Письмо 28. Редактирование генома
Опубликовано в журнале Урал, номер 8, 2019
1
Генетику Крейгу Вентеру принадлежат слова: «Жизнь основана на софте ДНК. Вы меняете софт ДНК — и меняете виды. Это удивительно простая концепция, удивительно сложная в своем исполнении»1. Крейг Вентер возглавлял команду генетиков, которая синтезировала живой организм, совершенно новый, никогда прежде не встречавшийся в природе2. Фактически Вентер показал, что мы уже можем «программировать», модифицируя и собирая ДНК.
Редактировать цифровую информацию мы все умеем: нажал delete — удалил букву. А вот как менять «софт ДНК»? В чем «удивительная сложность»?
Мы учились цифровому программированию сто лет. В 1936 году Алан Тьюринг «построил» абстрактную машину, в которой уже были реализованы все возможности будущих языков программирования. Примерно в это же время Клод Шеннон показал, что электрические схемы реализуют любую логическую функцию. В 1950–1960-е физики и инженеры создали полупроводниковую электронику. Тогда же за дело взялись программисты. И постепенно вырос наш сегодняшний информационный мир — мир мобильного интернета, облачных технологий, социальных сетей и прочих цифровых радостей и печалей.
Цифровое программирование — это создание и преобразование последовательностей нулей и единиц. Программы и данные (софт) сохраняются на постоянном носителе и запускаются в специальной аппаратной среде (хард). С точки зрения среды любая программа — это набор данных, который «выполняется» средой (обратное, вообще говоря, неверно: не всякий набор данных — программа, а только данные, организованные в виде специальной структуры).
2
Прежде чем мы поговорим о редактировании ДНК и отдельной особи, и целой популяции, сделаю краткое отступление и скажу несколько слов о том, как работает клетка (например, прямо сейчас в моем организме). (Если вы помните школьную биологию, просто пропустите этот раздел.)
В ядре клетки находится ДНК (дезоксирибонуклеиновая кислота) — макромолекула, главное хранилище наследственной информации. Общая длина ДНК человека достигает 2 метров. Она хранится в компактном, скрученном виде. ДНК человека сохраняется в виде набора из 23-х (в норме) пар хромосом. (Кроме ядерной ДНК в клетке есть еще и короткая митохондриальная ДНК, множество ее копий находится в органеллах клетки — митохондриях.)
ДНК имеет двухцепочечную структуру, и каждая цепочка представляет собой последовательность, состоящую из четырех «букв» — нуклеотидов: аденина, тимина, цитозина и гуанина. (То есть это не двоичная, как в цифровом компьютере, а четверичная система, но как раз это отличие несущественно.) Две цепочки соединяются водородными связями, которые образуют пары оснований: аденин — тимин, цитозин — гуанин. Такие связи называются комплементарными. Длина ДНК обычно измеряется в количестве пар нуклеотидов. У человека их около 3 миллиардов (есть виды, у которых ДНК гораздо длиннее, например, ДНК амебы содержит более 100 миллиардов пар оснований).
Соединенные вместе цепочки (знаменитая «двойная спираль») представляют собой нечто похожее на винтовую лестницу, где каждая ступенька — это пара нуклеотидов. Крепления между ступеньками довольно прочные, а вот сами ступеньки легко разъединяются. Возможность разъединять ступеньки нужна для того, чтобы специальные белки могли «расплетать» ДНК и собирать на основе каждой цепочки комплементарную цепочку РНК (рибонуклеиновую кислоту). Такая РНК — это своего рода «зеркальное» отражение ДНК. В РНК, как и в зеркале, сохраняется та же информация, что и в источнике, но если в зеркале она «перевернута» слева направо, то в РНК «перевернута» комплементарно, например, аденин в ДНК — урацил в РНК (тимин в РНК не входит), тимин в ДНК — аденин в РНК и так далее. Как мы уже говорили, хромосомы находятся в ядре, а вот работа по синтезу белков происходит в цитоплазме клетки, где этим важным делом занимается специальный «транслятор» — рибосома.
В самом грубом виде дело обстоит так. Белок расплетает ДНК, копирует информацию на РНК (комплементарно отражает ее в «зеркале»), РНК доставляет информацию рибосоме (буквально везет «на себе» или «в виде себя»). В процессе этой доставки (который и называется «процессинг») РНК проходит через целую последовательность преобразований, в частности, из нее вырезается информация, которая рибосоме не нужна. Рибосома читает РНК и, расшифровывая генетический код, сохраненный в ДНК, строит из соответствующих аминокислот новые белки.
Среди белков есть и такие, которые поддерживают метаболизм клетки, и те, которые потом будут расплетать ДНК, строить РНК (их много разных, и они выполняют самые разнообразные функции), организовывать и реализовывать деление клетки. И так клетка будет жить.
Если применить компьютерную метафору, то можно сказать, что ядро клетки с сохраняемой в ней ДНК — это такой харддиск, где хранится исходный код программ. А в работающие программы — белки и РНК — этот код преобразует (транслирует) рибосома.
ДНК включает в себя гены — это специальным образом оформленные (с концом и началом) последовательности нуклеотидов, которые и кодируют белки и РНК.
Например, ген CCR5 состоит 339 нуклеотидов (об этом гене мы еще поговорим). Все гены, кодирующие белки, составляют не более 2% ядерной ДНК. Еще 1% — кодирует только РНК. Зачем нужна клетке такая большая некодирующая часть ДНК, на сегодня неясно. Наш организм (и клетка в том числе) очень хорошо настроен, и вряд ли такой большой фрагмент ДНК болтается совсем без дела.
Рибосома собирает белки из 20 аминокислот, а в ДНК только 4 разных нуклеотида. Четырьмя нуклеотидами нельзя закодировать все 20 аминокислот. Спасает в этой ситуации генетический код, то есть кодирование аминокислот с помощью последовательностей нуклеотидов. Аминокислота кодируется последовательностью из трех нуклеотидов в гене. На самом деле тремя нуклеотидами можно закодировать не 20, а 64 аминокислоты. И сегодня ставятся эксперименты с таким расширенным набором аминокислот.
Рибосома двигает по РНК считывающую рамку. Когда она считывает старт-кодон (фиксированный набор из трех аминокислот — «начало»), начинается синтез белка. Рамка сдвигается дальше — всегда на три нуклеотида, — и рибосома получает следующую команду: «присоединить аминокислоту», чей код записан последовательностью трех нуклеотидов. Когда рамка считывает стоп-кодон, синтез белка завершается. Если при всей этой достаточно сложной (и потому не самой надежной) процедуре РНК потеряет хотя бы один нуклеотид, — рамка сдвинется неправильно, белок, скорее всего, построить не удастся, или он так изменится, что перестанет выполнять свои функции.
Генетический код — это одно из древнейших изобретений эволюции, он практически всегда один и тот же и у человека, и у бактерии.
3
Идея редактирования ДНК заключается в следующем. Раз уж мы знаем, где на харддиске лежит кодирующая белки и РНК информация, давайте мы ее прямо на диске и поправим. Тогда мы изменим всю последующую работу системы, которая строит белки.
Например, в 3-й хромосоме есть ген CCR5, который отвечает за синтез одноименного белка. Хотя во всех клетках содержится одна и та же ДНК (с точностью до мутаций), разные типы клеток синтезируют разные белки. Белок CCR5 синтезируется, в частности, Т-клетками, или Т-лимфоцитами, которые играют важную роль в иммунной системе человека (приобретенный иммунный ответ). При нормальной работе белка он позволяет ВИЧ проникать в Т-клетку.
Если мы сможем «отредактировать» ген CCR5, то после считывания и раскодирования генетической информации рибосома сделает что-то ненормальное, и белок уже не будет работать так, как был запрограммирован. Но как раз в случае CCR5 мы совсем не против того, чтобы белок «сломался», мы этого и хотим. Нам сломанный белок (но не со всякой поломкой, а с мутацией CCR5delta32, при которой нет 32 совершенно определенных идущих подряд нуклеотидов) как раз и нужен, потому что мы точно знаем, что сломанный белок не позволит ВИЧ проникнуть в Т-клетку, человек приобретет иммунитет и никогда СПИДом не заболеет.
Редактировать удобнее всего эмбрион: тогда все клетки организма, полученные при делении оплодотворенной яйцеклетки, естественно наследуют внесенные изменения.
Так и поступил китайский генетик Хэ Цзянькуй, который изменил ген CCR5 в ДНК эмбриона, из которого развивались девочки-близнецы Лулу и Нана3.
4
Геном будущих Лулу и Нана был отредактирован с помощью технологии CRISPR/Cas9. (CRISPR — clustered regularly interspaced short palindromic repeats — система коротких палиндромных кластерных повторов.) Скажем несколько слов об этой самой знаменитой на сегодня технологии редактирования ДНК.
В 80-е годы в ДНК бактерий была обнаружена странная структура. Были найдены повторяющиеся одинаковые отрезки, которые разделяли различные фрагменты примерно той же длины, что и разделители. Смысл этой структуры долго оставался неясен, но то, что она встречалась у разных видов бактерий, указывало, что такая структура — неслучайна. В 2000-е годы было установлено, что эта структура — приобретенный иммунитет бактерий, их в точном смысле антивирусная система: повторяющиеся отрезки — это разделители, а различные фрагменты между ними — это фрагменты вирусных ДНК. Эта повторяющая структура — «база антивирусных сигнатур», очень похожая на те, что используются компьютерными антивирусами.
Когда вирус проникает в бактерию, она сравнивает неизвестную проникшую в нее последовательность с фрагментами, сохраненными в «базе сигнатур». Если в базе найдена проникшая в бактерию последовательность, следует команда «уничтожить: это вирус». Специальный белок Cas9 связывается с вирусом и режет его на кусочки. А бактерия сохраняет фрагмент генома вируса в своей собственной ДНК. Так пополняется «база сигнатур». Если «сигнатуры» вируса нет в ДНК бактерии и она не успеет уничтожить вирус — она погибнет. Но если сигнатура вируса сохранится в ДНК бактерии — сигнатура будет унаследована.
Это открытие впечатлило генетиков. Самым важным качеством, которое было выработано природой в иммунитете бактерий, оказалось умение находить нужный отрезок кода и делать разрез именно в том месте, где этот отрезок найден.
Если иммунная система бактерий умеет резать, то клетка умеет еще и «латать» разрезы. Это — система репарации, или восстановления, ДНК. При делении клетки в ДНК нередко возникают сбои, а ведь мы уже знаем, что достаточно ошибки всего в один нуклеотид, чтобы ген перестал работать. Механизм репарации ДНК может вырезать сбойные фрагменты и заменять их корректными, используя как образец тот же фрагмент на парной ДНК (своего рода резервной копии, которая содержится в хромосоме). Но оказалось, что можно в качестве образца предложить ДНК любую последовательность нуклеотидов, и она будет встроена на место разреза. А вот это уже полноценная система редактирования.
Как это делается: формируется специальный вектор, который содержит гидовую РНК, которая может найти место необходимого разреза в ДНК; белок Cas9, который сделает в найденном месте разрез, и фрагмент последовательности, которая будет вставлена на место разреза. Такой вектор вводится в клеточное ядро. Если сделать два разреза, то получится в точности редактирование: отыскали нужные места, сделали два разреза, выбросили лишний фрагмент, вклеили новый.
Конечно, это довольно грубая схема, но в общих чертах она передает работу технологии CRISPR/Cas. Теперь мы, формируя нужные векторы, можем любую ДНК изменить, будь это хоть соя, хоть комар, хоть эмбрион, из которого вырастут Лулу и Нана. Другое дело, что мы до сих пор не можем со 100%-ной вероятностью утверждать, что CRISPR/Cas не сделает лишних разрезов, не покалечит ДНК. Если с соей — это не страшно, не получилось с одной попытки, попробуем еще разок, то с человеком так поступить нельзя. Поэтому все генетики так возмутились поступком Хэ Цзянькуя.
Технология CRISPR/Cas была описана и проверена в работах 2012 года. Дженифер Дудна из Университета Беркли и Эммануэль Шарпентье, работавшая в 2012 году в Университете Вены, научились редактировать ДНК плазмид — автономных молекул с короткой кольцевой ДНК, расположенных внутри клетки. Плазмиды встречаются и у бактерий, и у эукариот (клеток с ядром). Практически в это же время Фэн Чжан из Института Брода разработал технологию редактирования ДНК эукариот (к которым относятся и животные, и человек)4.
5
Еще более интересная аналогия с цифровым вирусом тоже связана с технологией CRISPR/Cas — это мутагенная цепная реакция (или генный драйв). Мы можем сохранить в ДНК саму программу редактирования (весь вектор целиком), тогда при активировании гена будет запущена и сохраненная в ДНК программа редактирования. Та же принципиальная схема используется при создании цифрового вирусного эксплойта.
Одной из первых была выполнена работа по внедрению «вирусного эксплойта» в ДНК мушки дрозофилы. В ген, отвечающий за расцветку мушки, был встроен CRISPR-механизм по редактированию самого этого гена (или его аллеля, то есть варианта того же гена). При активировании гена активировался CRISPR-механизм: он находил гомологичную (парную) хромосому и менял соответствующий аллель (и себя в него прописывал). В результате ученые получали гомозиготную клетку, которая при наследовании обязательно передает ген, содержащий CRISPR-механизм. И так далее. При наследовании почти все особи получали отредактированный ген. Это в точности повторяет схему работы цифрового вируса: проникновение в систему в виде набора данных (для этого используется тот или иной вариант бреши в защите программы, часто это ошибка buffer overflow), сохранение тела вируса в программе, перехват управления при запуске программы, проникновение вируса в незараженные программы, распространение и наследование.
Что это значит? Ни больше ни меньше, что мы можем с помощью мутагенной цепной реакции модифицировать целую популяцию организмов. Или, например, эту популяцию уничтожить. Есть предложение по уничтожению с помощью такого «биологического эксплойта» комаров, переносчиков вируса Зика в Калифорнии, и комаров, переносчиков малярийного плазмодия в Африке. Был предложен механизм, который позволяет так настроить CRISPR-механизм, что самцы становятся переносчиками гена бесплодия. Он делает бесплодными самок малярийных комаров, а самцы остаются готовыми к спариванию и продолжают ген «бесплодия» распространять. Достаточно выпустить в популяцию сравнительно небольшое количество отредактированных самцов, чтобы вся популяция вымерла.
Мутагенная цепная реакция, делающая бесплодными малярийных комаров, была описана в довольно давней работе, которая вышла в конце 2015 года и была выполнена группой исследователей во главе с Тони Ноланом из Имперского колледжа в Лондоне. Почему же это не сделано, если в Африке каждый день от малярии умирает тысяча человек? Есть «опасность, что CRISPR-механизм, несущий ген бесплодия, передастся от комаров, распространяющих малярию, к обычным, безвредным комарам, которые являются неотъемлемой частью экосистемы. Ими и их личинками питаются рыбы и лягушки; наверное, они играют еще какую-то роль. Хотим ли мы их уничтожения?»5
В 2015 году, рассказывая о мутагенной цепной реакции, которая была реализована на мушках дрозофилах, сайт «Биомолекула» писал: «Однако у многих исследователей мутагенная цепная реакция вызывает большие опасения. Мутация, однажды введенная в геном единственного организма, неконтролируемо распространяется в геномах детей, внуков, правнуков и всех последующих поколений этой популяции. Муха с мутацией в гене yellow, случайно вылетевшая из лаборатории, может внести эту мутацию в природные популяции дрозофил — тогда все плодовые мушки на Земле со временем станут бледно-желтыми, а мы навсегда забудем, как выглядели раньше известные нам Drosophila melanogaster. А если речь пойдет не о мухах, а о внесении мутаций, например, в геном человека? Или экспериментаторы совершат ошибки, которые приведут к неконтролируемому распространению страшных патогенных организмов? Ученые успокаивают, что судьба нашей планеты не станет похожа на сюжет фантастического фильма. Они держат своих «бледных» дрозофил за семью печатями: посторонние не имеют доступа ни к пробиркам с плазмидами, ни к экспериментальным мухам. Они разделяют всеобщее волнение по поводу своего открытия, однако очень рады, что придумали такой эффективный метод редактирования генома»6.
А в январе 2019-го появилась работа генетиков из университета Сан-Хосе, в которой они описали мутагенную цепную реакцию, но уже не на комарах и дрозофилах, а на млекопитающих — на мышах. Это уже совсем близко человеку7.
6
Наверно, мы можем собрать новую Асиломарскую конференцию8, принять строгие правила использования мутагенных цепных реакций и других рискованных экспериментов по редактированию генома с непредсказуемыми последствиями. И, наверное, ученые, как люди ответственные, согласятся со строгими требованиями биоэтики.
Но кто сказал, что этим требованиям подчинятся все вообще, кто в своем гараже получит доступ к редактированию генома? А сегодня технологии редактирования генома (не только дрожжей или бактерий, но и, например, лягушек) доступны любому: на рынке есть и биоматериалы, и портативные секвенаторы, позволяющие прочитать ДНК. И все это и просто технологически, и вполне доступно по ценам. Так, с помощью секвенатора Oxford Nanopore удалось полностью секвенировать (расшифровать и собрать) геном арабидопсиса (Резуховидка Таля — это такая «мушка дрозофила» среди растений, любимый объект генетиков) за 4 дня и 1000 долларов9. А в этом геноме — 150 миллионов пар оснований. Совсем не мало.
Oxford Nanopore использует новую нанопоровую технологию секвенирования. И она становится с каждым годом точнее, проще и дешевле. Точность секвенирования уже превышает 97%10. Требуемые вычислительные мощности быстро снижаются. Компания заявила о выпуске в 2019 году гаджета SmidgION — первого секвенатора, подключаемого к смартфону11.
Генетик Рудольф Яниш из Массачусетского технологического института, говоря о технологии CRISPR/Cas, довольно раздраженно заметил: «Сегодня вы ни в ком не нуждаетесь, чтобы это сделать. Это может любой идиот»12.
Инструменты и биоматериалы стремительно дешевеют, число людей, увлеченных биотехнологиями, растет с каждым днем… Остановить это движение невозможно. Уже есть любители, готовые рискнуть здоровьем и вколоть себе crispr-коктейль, чтобы нарастить мышечную массу (это не помогает, но и отрицательный результат энтузиастов не останавливает). А это попросту опасно, поскольку неизвестно, как на такое вмешательство отреагирует организм.
До сих пор созданием биологического оружия занимались государства, и все работы проводились в закрытых, хорошо охраняемых лабораториях. А если его можно будет сделать в гараже?
Но далеко не все были огорчены или даже обеспокоены возможностью применения мутагенной цепной реакции не только в лабораториях, но и в природе. В Новой Зеландии, напротив, встретили сообщения о возможности создания бесплодных особей (что приведет к вымиранию популяции) с энтузиазмом. В 2017 году правительство страны объявило о начале финансирования крупной программы Predator Free 2050 («Освободись от хищников к 2050 году»)13. Целью программы является освобождение территории страны от «инвазивных видов», то есть таких видов животных, которые были завезены на острова. Это — одичавшие кошки, крысы, опоссумы, горностаи. У этих видов нет здесь естественных врагов, они бесконтрольно расплодились и угрожают видам, традиционно живущим в Новой Зеландии.
Что же все-таки делать? «Писать антивирус», который позволил бы нейтрализовать мутагенную цепную реакцию и восстановить геном. На развитие такого «биологического» программирования уже выделяются серьезные деньги14.
Ну и надеяться на разумность вида homo sapiens.
1 What is life? a 21st century perspective. On the 70th Anniversary of Schroedinger’s Lecture at Trinity College by J. Craig Venter. 7.12.2012. https://www.edge.org/conversation/what-is-life.
2 Владимир Губайловский. Письма к учёному соседу. Письмо 12. Искусственная жизнь. Урал, 2016, № 5.
3 Об эксперименте китайского генетика см.: Владимир Губайловский. Письма к ученому соседу. Письмо 25. Вопросы биоэтики. Урал, 2019, № 2.
4 Crispr timeline. https://www.broadinstitute.org/what-broad/areas-focus/project-spotlight/crispr-timeline.
5 Максим Франк-Каменецкий. Самая главная молекула: от структуры ДНК к биомедицине XXI века. М., «Альпина нон-фикшн», 2017. С. 258.
6 Мутагенная цепная реакция: редактирование геномов на грани фантастики. 24 апреля 2015. https://biomolecula.ru/articles/mutagennaia-tsepnaia-reaktsiia-redaktirovanie-genomov-na-grani-fantastiki
7 Super-Mendelian inheritance mediated by CRISPR–Cas9 in the female mouse germline. https://www.nature.com/articles/s41586-019-0875-2. Published: 23 January 2019.
8 В 1975 году в конференц-центре Асиломар, Монтерей, Калифорния, по инициативе лауреата Нобелевской премии Пола Берга прошла конференция по рекомбинантной ДНК. Непосредственным поводом для нее была тревога биологов, связанная с работами по созданию генномодифицированных организмов. На конференции впервые были выработаны принципы добровольного самоограничения, которых ученые должны придерживаться в своих исследованиях. https://en.wikipedia.org/wiki/Asilomar_Conference_on_Recombinant_DNA.
9 High contiguity Arabidopsis thalianagenome assembly with a single nanopore flow cellhttps://www.nature.com/articles/s41467-018-03016-2. Published: 07 February 2018.
10 Evaluation of Oxford Nanopore’s MinION Sequencing Device for Microbial Whole Genome Sequencing Applications. https://www.nature.com/articles/s41598-018-29334-5. Published: 19 July 2018.
11 SmidgION. https://nanoporetech.com/products/smidgion.
12 ‘Any idiot can do it.’ Genome editor CRISPR could put mutant mice in everyone’s reach.
13 By Jon CohenNov. https://www.sciencemag.org/news/2016/11/any-idiot-can-do-it-genome-editor-crispr-could-put-mutant-mice-everyones-reach. 3 November 2016. https://en.wikipedia.org/wiki/Predator_Free_2050.
14 How will we keep controversial gene drive technology in check? By Kelly Servick. https://www.sciencemag.org/news/2017/07/how-will-we-keep-controversial-gene-drive-technology-check. Jul. 19, 2017.