Мир до нас: Новый взгляд на происхождение человека
Шрифт:
Другим крупным успехом древней геномики стала разработка мощных инструментов секвенирования, которые позволяют надежно секвенировать генетический код чуть ли не на промышленной основе.
В 1990-х гг. ученые преимущественно использовали метод ПЦР – полимеразной цепной реакции. Он не потерял своей значимости и сегодня; так, ПЦР широко применялась для выявления вирусной РНК в ходе исследований, связанных с началом пандемии Covid-19 в 2020 г. Этот метод основан на копировании маленьких фрагментов ДНК с использованием фермента полимеразы и их амплификации – многократного точного воспроизведения, что облегчает их исследование. Метод ПЦР оказался поистине революционным, и его автор Кэри Муллис заслуженно получил в 1993 г. Нобелевскую премию по химии{103}. Метод дает нам возможность добывать путем амплификации огромное количество пригодной для исследования ДНК. Исходный фрагмент ДНК используется полимеразой как шаблон для синтеза все новых и новых копий. Копия остроумно строится из новых нуклеотидов (оснований), которые связаны друг с другом полимеразой, начиная с так называемых праймеров –
На этом рассказ об амплификации можно завершить. Теперь о другом: как не только извлечь хорошо знакомую нам последовательность нуклеотидов – А, Т, Ц, Г (аденин-тимин и цитозин-гуанин), уникальный код ДНК, который формирует двойную спираль, также известную как древо жизни, – но и узнать, что же она означает? Чтобы разобраться в этом, необходимо сперва понять, что такое секвенирование, а для этого нужно вернуться в 1977 г., к разработке первой технологии геномного секвенирования нобелевским лауреатом Фредериком Сэнгером[24].
Точно выстроить буквенную последовательность ДНК удается благодаря весьма находчивому методу прекращения ПЦР на том самом основании, которое нужно прочитать. Для приостановки реакции добавляются дезоксинуклеотиды другого типа, не способные образовать химическую связь со следующим основанием в последовательности, – так называемые дидезоксинуклеотиды, или ддНТФ.
Рис. 12. Схема полимеразной цепной реакции
Фрагменты амплифицированной ДНК поровну распределяются по четырем колбам, в каждой из которых содержатся дезоксинуклеотиды, включающие в себя одно из оснований: аденин, тимин, гуанин или цитозин. Затем в каждую колбу добавляется определенный ддНТФ, или нуклеотид-терминатор. Итак, в первой колбе содержится только ддНТФ, помеченный аденином, во второй – цитозином и т. д. Таким образом, в первой колбе репликация ДНК продолжится до тех пор, пока реакция не остановится в точке, где к последовательности этого фрагмента ДНК добавляется меченный конкретным основанием ддНТФ. Вы получите четыре колбы, содержащие фрагменты ДНК переменной длины, которые оканчиваются на определенном основании: аденине, тимине, гуанине или цитозине.
Теперь, чтобы выяснить, какую позицию занимают эти основания в общей последовательности ДНК, необходимо количественно определить размеры каждого фрагмента, для чего служит следующая часть сэнгеровского процесса – электрофорез. Это слово всего-навсего означает движение различных частиц под действием постоянного электрического тока в жидкости – в нашем случае, в полиакриламидном геле. Содержимое каждой из четырех колб выливают в четыре отделения с гелем и включают ток. В каждом из отделений фрагменты ДНК перемещаются от отрицательного полюса к положительному. Чем меньше и легче фрагменты, тем дальше они продвигаются, образуя при остановке видимые полосы. В первой емкости будут находиться фрагменты, движение которых прервалось на А, во второй – на Ц, в третьей – на Г и в четвертой – на Т. После завершения опыта последовательность оснований можно прочитать снизу вверх в порядке увеличения массы фрагментов, а затем расположить в правильной очередности согласно известной парности нуклеотидов. Таким образом мы получаем последовательность ДНК – АГТТЦАГЦАТАГА и т. д. Этот метод был использован для создания человеческого генома в амбициозном проекте «Геном человека», который продлился 10 лет и обошелся его спонсорам в 3 млрд долларов.
Рис. 13. Схема секвенирования по Сэнгеру
ПЦР – безусловно, гениальное изобретение – все же имеет определенные недостатки, в частности касающиеся древней ДНК. Загрязняющая ДНК подвергается амплификации с тем же успехом, что и древняя; так удобрения, которые вы вносите в почву своего сада, способствуют росту не только роз, но и сорняков. Именно это на заре применения метода было главным затруднением при анализе фрагментов ДНК, извлеченных из костей и зубов.
Однако технология секвенирования непрерывно совершенствовалась, что сильно изменило положение вещей в области изучения древней ДНК. В авангарде этой революции шла американская биотехнологическая компания 454 Life Sciences. Говорят, что ее руководитель Джонатан Ротберг пришел к мысли об усовершенствовании технологии секвенирования ДНК, когда у одного из его детей начались серьезные проблемы с дыханием. Ротберг был удручен тем, что врачам никак не удается установить природу заболевания – наследственное оно или нет. Предположительно, ответ мог бы дать полный геном. Листая в больнице журнал, Ротберг заметил на его обложке фотографию нового микропроцессора Intel Pentium и подумал, что ускорение секвенирования путем параллельной работы с многочисленными фрагментами ДНК и управление процессом посредством мощной компьютерной системы позволят улучшить генетический анализ. Как итог, он основал компанию 454 Life Sciences, целью которой было повышение скорости секвенирования. Позднее компании предстояло стать ведущим партнером проекта «Геном неандертальца», заключавшегося в секвенировании ядерного генома неандертальского человека{104}. Это исследование и другие оригинальные научные работы принесли Ротбергу большие деньги. Как известно, часть этих денег он потратил на воссоздание в своем имении на Лонг-Айленде копии Стоунхенджа. Для этого сооружения, получившего название «Круг жизни», потребовалось 700 тонн гранита, доставленного из Норвегии.
Новейшие подходы к секвенированию, привнесенные 454 Life Sciences и другими компаниями, ускорили процесс едва ли не в 100 раз. В нем появилось несколько очень важных отличий от метода Сэнгера. Первое – более продвинутая химия процесса. К обоим концам коротких фрагментов ДНК, взятых из образца, «пришиваются» так называемые адаптеры, позволяющие секвенатору распознавать начало и конец каждого фрагмента. Секвенирование осуществляется на маленькой пластинке вроде предметного стекла для микроскопа, испещренной сотнями крошечных лунок, в которых находятся полимерные капсулы. Эти капсулы содержат нуклеотидные последовательности, дополняющие адаптеры, благодаря чему они прилипают к адаптерам на конце каждого фрагмента ДНК и удерживают их на месте. После этого в волнообразном порядке добавляются соединения, содержащие нуклеотидные основания – сначала А, затем Ц, затем Г, затем Т, и, как и при секвенировании по Сэнгеру, основания одно за другим включаются в последовательность ДНК при участии полимеразы. Основное отличие заключается в том, что этап электрофореза здесь заменен на метод пиросеквенирования, который позволяет выявлять основания гораздо эффективнее. После успешного добавления нуклеотида высвобождается пирофосфат, который затем проходит химическое превращение с выделением квантов света. Сверхчувствительная камера регистрирует все вспышки на пластине и, измеряя интенсивность вспышки, определяет, какое именно основание присоединилось к последовательности. Благодаря использованию этого метода процесс секвенирования ускоряется и делается непрерывным{105}.
Новые методики позволяют считывать десятки миллионов оснований за день. Этот метод и его последующие модификации носят название «секвенирование нового поколения»; его применение заметно активизировало работу по изучению древней ДНК в рамках археологических исследований. Новые, более совершенные платформы секвенирования, разработанные Illumina и другими компаниями, позволяют все больше ускорять и автоматизировать процесс. Теперь вместо дорогостоящих ферментов в секвенаторах для регистрации добавленных к последовательности оснований используют красители, соответствующие определенным нуклеотидам; цвет легко определяется цифровыми камерами высокого разрешения. Для секвенирования генома уже не требуется 10 лет, как потребовалось в случае с проектом «Геном человека», – достаточно один раз включить секвенатор на сутки-другие. За год можно расшифровать десятки тысяч геномов. Впрочем, с древней ДНК дело обстоит сложнее, поскольку она частенько оказывается сильно фрагментированной, а фрагменты ДНК – короткими, так что и времени для секвенирования необходимо больше.
Ну а теперь, когда мы разобрались с технологией секвенирования, поговорим о том, какого рода информацию можно получить из ДНК древних костей.
В человеческих костях содержится два основных архива генетических данных. Первый из них – митохондриальная ДНК (мтДНК). Митохондрия – это органоид, имеющийся в любой клетке и обеспечивающий ее энергией. В ней находятся мелкие кольцевидные хромосомы. Второй архив – это ядерный геном, который содержится только в ядрах клеток. Он представляет собой диплоид, двухцепочечную ДНК, одна половина которой унаследована от матери, а вторая – от отца. Ядерный геном является продуктом смешения, происходящего на протяжении жизни многих поколений, – рекомбинации. Следовательно, в ядерной ДНК каждого из нас хранится запись, затрагивающая не только нашу личность, но и чрезвычайно продолжительные отрезки генетической истории, ведь до нашего рождения игральные карты генетической информации раздавались и перетасовывались неоднократно. Так, отдельно взятый ядерный геном несет в себе бесконечно много сведений об очень длительной истории популяции. Что же касается митохондриальной ДНК, то она приходит к человеку только от матери, которая получает ее от своей матери, та – от своей и т. д. За счет значительно бoльших размеров ядерный геном намного информативнее, чем митохондриальная ДНК: если митохондриальный геном (митогеном) содержит около 16 500 пар оснований, то ядерный геном почти в 200 000 раз больше – в нем целых 3,2 млрд пар оснований.
Такое число трудно даже вообразить, но мы попытаемся. Допустим, мы решили написать книгу, в которой от начала и до конца будут представлены все пары оснований А, Ц, Г, Т из ядерного генома одного человека в должной последовательности. У нас получится 1,6 млн страниц по 2000 букв на каждой; чтобы книжками можно было пользоваться, ограничим объем каждой 500 страницами. В результате для одного полного генома нам понадобится библиотека из 3200 томов. Текст митохондриального генома при этом уложится всего лишь в восемь страниц. Впрочем, следует сказать, что, по всей видимости, значительная часть ядерного генома практически не несет информации; иногда ее даже называют мусорной ДНК[25]. У самых разных видов встречается немало этого «мусора», поэтому генетики часто сосредоточиваются на вариативных областях генома, которые называются ОНП (однонуклеотидные полиморфизмы). Благодаря своей изменчивости у разных людей и групп ОНП куда более информативны. Когда говорят, что генетики секвенировали 250 000 ОНП, чтобы сравнить различные геномы человека, речь идет как раз об этих вариативных участках генетического кода. Коммерческие компании, занимающиеся секвенированием ДНК, могут обработать для платежеспособного заказчика сотни тысяч ОНП из его генома.