Простое начало. Как четыре закона физики формируют живой мир
Шрифт:
Итак, мы уже не один десяток лет умеем изменять геномы всевозможных организмов. Но описанные выше методы лишены притягательной простоты. Организм включает в себя новый ген лишь после серии проб и ошибок, и место, где он окажется, либо не контролируется вовсе – а это непредвиденно влияет на экспрессию, – либо контролируется умеренно, но ценой еще более трудоемкой инженерии. Когда мы задались целью внедрить ген инсулина или флуоресцентного репортера в бактерию или мышь, пытаться сделать это идеально, пожалуй, можно не раз и не два, но такая стратегия пригодна не везде, особенно если мы мечтаем о лечении генетических болезней человека. Нам хотелось бы придумать простой и точный способ редактировать геномы: находя специфические последовательности ДНК, либо заменять их нужными фрагментами собственного изготовления, либо просто аккуратно вырезать из генома. И теперь у нас такой способ есть. Я рассмотрю систему CRISPR/Cas9, однако, как это часто бывает с технологиями, почти одновременно появились несколько революционных методов геномного редактирования. Альтернативные варианты – нуклеазы на основе белков с доменом «цинковые пальцы» (ZFN) и нуклеазы
CRISPR/Cas9 – очень древняя или, напротив, совсем новая техника. Ее, возможно, открыли, а возможно, изобрели. Любой из этих вариантов может оказаться верным в зависимости от ракурса. Сначала посмотрим, как этим геномным инструментом оперируют его исконные обладатели, а затем обратимся к его современным версиям на службе у человека.
Природа, если воспользоваться образом Теннисона, была красна от клыков и когтей задолго до появления этих самых клыков и когтей. Даже микроорганизмы борются друг с другом. Бактерии пронзают и травят своих сородичей, амебы пожирают бактерий, вирусы заражают клетки и бесчинствуют в их геномах. Помимо вооружения у каждого из этих созданий вырабатывается защита. До недавних пор считалось, что защитные механизмы бактерий работают только в настоящем, выявляя угрозы по мере их возникновения и не запоминая прошлые обиды. Но теперь мы знаем, что бактерии обладают памятью. Как и клетки нашей иммунной системы, они ведут учет уже знакомых противников, чтобы незамедлительно среагировать при новой встрече с ними. Само открытие адаптивного бактериального иммунитета может служить символом нашего биотехнологического века, ведь оно не состоялось бы без внедрения секвенирования ДНК и современных компьютеров.
В 1987 году японские биологи, изучавшие один из генов модельной бактерии E. coli, мимоходом заметили у нее «необычную структуру» – последовательность из 29 нуклеотидов, которая повторялась в геноме пять раз через равные 32-нуклеотидные интервалы (спейсеры)15. Каково ее назначение и встречается ли она в других геномах, так и осталось загадкой. На это наблюдение особо не обратили внимания: жизнь полна странностей, по большей части не имеющих никакого значения.
В 1990-х Франсиско Мохика и его коллеги из испанского Университета Аликанте обнаружили похожие повторы ДНК в геномах нескольких архей16. Археи – это тоже одноклеточные микроорганизмы, лишенные ядер и мембранных органелл (см. главу 5). Внешне они малоотличимы от бактерий, но формируют отдельную ветвь древа жизни: как и нас, их отделяют от бактерий миллиарды лет эволюции. Мохика наткнулся на статью японцев и понял, что закрепление похожих генетических структур у столь неродственных организмов должно свидетельствовать о важности их роли в жизни микробов. В конце 1990-х, когда количество прочитанных бактериальных геномов возросло, а вычислительные инструменты позволили возиться с их сиквенсами на обычном компьютере, Мохика с коллегами нашел похожие расположенные кластерами повторы в геномах многих других бактерий и архей. Впрочем, их многочисленность и загадочность не принесли лаборатории Мохики славы и денег: она годами не могла добиться финансирования этих исследований, причем отказы обычно обосновывали ничтожной значимостью ДНК-повторов. А содержащих их геномов между тем становилось все больше. В 2002 году Мохика и Рууд Янсен из Утрехтского университета предложили назвать эти геномные структуры CRISPR: clustered regularly interspaced short palindromic repeats, «короткие палиндромные повторы, регулярно расположенные группами». Ученые заметили и то, что вплотную к этим структурам примыкает серия генов, которые назвали Cas (CRISPR-associated, «ассоциированные с CRISPR»). Итак, CRISPR получили имя, однако их функции по-прежнему оставались тайной.
И снова на помощь пришли геномы и компьютеры. Сразу три статьи 2005 года – одна от группы Мохики и две другие из Франции, от команд Кристин Пурсел и Александра Болотина17 – сообщали, что нуклеотидные последовательности спейсеров в CRISPR совпадают чаще всего с участками геномов вирусов [65] . С незапамятных времен вирусы заражали клетки, и такое совпадение позволяло заподозрить в CRISPR элементы неизвестного прежде защитного механизма. Хотя внимание к этой теме постепенно нарастало, ни одну из трех работ сначала не оценили по достоинству. Статью Мохики, написанную первой, один за другим отвергли все престижные журналы, и ей пришлось найти более скромный приют. Тем не менее сущность CRISPR начинала вырисовываться. Зачем бережно хранить каталог ДНК-фрагментов заражавших тебя вирусов? Не иначе как для узнавания по этим «фотороботам» и обезвреживания вторженцев, если они решат атаковать тебя вновь [66] .
65
Иногда спейсеры идентичны участкам транспозонов или крупных плазмид, способных передаваться от бактерии к бактерии (конъюгативных плазмид).
66
О перипетиях, связанных с открытием системы CRISPR-Cas и патентованием технологий на ее основе, рассказывает, например, статья: https://biomolecula.ru/articles/crispr-epopeia-i-ee-geroi. Просто и наглядно поясняет принцип работы этой системы инфографика: https://biomolecula.ru/articles/prosto-o-slozhnom-crispr-cas.
Работая в качестве бактериальной иммунной системы, CRISPR/Cas использует комплементарность ДНК и РНК (см. главу 3), а также нуклеазную активность белков (способность расщеплять ДНК)18. Белки Cas1 и Cas2 разрезают обнаруженные ими в клетке чужеродные, скорее всего вирусные, молекулы ДНК и вставляют фрагменты в клеточный геном – в самое начало CRISPR-кассеты, добавляя заодно и новый повтор. Таким образом получается, что повторы разграничивают отдельные фрагменты (спейсеры) в библиотеке знакомых клетке вирусных геномов. Далее клетки совершают, казалось бы, безрассудный поступок и транскрибируют цепочку повторов и спейсеров в молекулу pre– crРНК (предшественницу CRISPR-РНК). Как вы помните из главы 3, транскрипция обычно служит первым шагом к синтезу белков, а синтез вирусных белков для клетки может быть опасен. РНК повторов, однако, частично комплементарна tracrРНК (trans-activating crRNA), которая считывается с участка генома поблизости от CRISPR-локуса. Каждый повтор в pre– crРНК спаривается с tracrРНК, после чего с каждым из этих РНК-дуплексов связывается белок Cas9, а особый фермент нарезает pre– crРНК на отдельные crРНК, состоящие из одного спейсера и части повтора. Так образуется набор связанных с Cas9 и скрученных в двойную спираль crРНК/tracrРНК– гибридов со свободно висящим сегментом вирусного происхождения (см. среднюю часть рисунка).
Комплекс РНК-Cas9 бродит по клетке благодаря броуновскому движению. Если среди встречных молекул ДНК ему попадается та, что содержит специфическую короткую и довольно распространенную последовательность нуклеотидов (PAM, protospacer adjacent motif), он прикрепляется к ней в этом самом месте (кстати, та же последовательность помогает Cas1 и Cas2 определять, где разрезать чужеродную ДНК для включения в CRISPR-кассету). Cas9 расшатывает связи между нитями ДНК, по сути расплавляя двойную спираль на небольшом участке. Если однонитевая РНК, которую переносит Cas9, комплементарна одной из распаренных нитей ДНК – а это возможно только с ДНК того же вируса, по фрагменту которого сформирована crРНК, – образуется ДНК-РНК-гибрид. Эта необычная, но стабильная двойная спираль занимает в Cas9 бороздку, «выстланную» положительными электрическими зарядами, которые удерживают сильно электроотрицательные ДНК и РНК на месте (см. нижнюю часть рисунка; ДНК обозначена черным).
Cas9 содержит два нуклеазных домена, способных расщеплять ДНК. Когда белок захватывает ДНК-РНК-спираль, домены меняют ориентацию так, чтобы каждый из них контактировал с одной из нитей вирусной ДНК – той, что соединилась с РНК, и той, что осталась в одиночестве. На рисунке ниже я показал самое радикальное изменение формы, где один из доменов, черная спираль, поворачивается почти на 180 градусов. Cas9 вносит в каждую нить по разрезу, и эта часть вирусного генома теряет функциональность. Белок удаляется: его дело сделано19.
Существуют разные системы CRISPR с разными наборами ассоциированных с ними белков, но я не буду углубляться в это20. Базовый механизм сходен у всех, и потому я сосредоточусь на относительно простом и изящном белке Cas9, который эксплуатируют в большинстве биотехнологических проектов.
CRISPR/Cas9 как бактериальная иммунная система весьма впечатляет, ведь в ней память совмещается с защитой. На своем глубинном уровне она показывает, что миллиарды лет назад Природа решила одну из главных задач генной инженерии: научилась находить целевую последовательность нуклеотидов среди миллионов прочих и вносить в нее изменения. Поиск здесь подразумевает пользование библиотекой вирусных ДНК, а изменение – простое уничтожение расщеплением. Некоторые ученые, однако, догадались, что природные разработки можно подправить, чтобы расширить область их применения и даже сделать их созидательными.
В 2012 году группы Дженнифер Даудны из Калифорнийского университета в Беркли и Эмманюэль Шарпантье из Университета Умео в Швеции опубликовали написанную по итогам совместной работы статью, оказавшую мощнейшее влияние на научное сообщество. Авторы изящно демонстрировали редактирующие способности CRISPR/Cas9 за пределами клеток бактерий и архей. Команда Шарпантье открыла tracrРНК и объяснила многие аспекты работы Cas9. Даудна и ее коллеги специализировались на РНК, но в диапазон их исследовательских объектов входил и сложный ландшафт CRISPR-ассоциированных белков. В естественных условиях tracrРНК и crРНК, созданная на базе вируса, вместе направляют Cas9. Даудна и Шарпантье поняли, что заменой вирусной последовательности любой другой можно перепрограммировать Cas9 на желаемый пункт назначения. Кроме того, вместо tracrРНК и crРНК можно использовать соответствующим образом сконструированный и сворачивающийся единый РНК-гид. Следовательно, всего одной легкосинтезируемой нитью РНК и всего одним легкопроизводимым белком Cas9 можно обеспечить точное нацеливание на нужные участки ДНК. Чтобы разрезать ДНК там, где находится определенная последовательность нуклеотидов, надо действовать по следующей инструкции: создать молекулы единого РНК-гида, содержащие ту самую последовательность (вместо T там должны стоять У, как всегда в РНК), добавить к ним Cas9, поместить весь комплекс в интересующую вас систему – и все. Две научные группы показали, что этот метод работает в пробирке, за пределами естественной для него среды микробных клеток. Сообщая о результатах экспериментов в статье 2012 года, авторы назвали получившуюся систему «эффективной, многофункциональной и программируемой» и добавили, что она обладает «солидным потенциалом для решения задач прицельного воздействия на гены и редактирования геномов»21.