Продолжая использовать наш сайт, вы даете согласие на обработку файлов cookie, которые обеспечивают правильную работу сайта. Благодаря им мы улучшаем сайт!
Принять и закрыть

Читать, слущать книги онлайн бесплатно!

Электронная Литература.

Бесплатная онлайн библиотека.

Читать: Жизнь на скорости света. От двойной спирали к рождению цифровой биологии - Крейг Вентер на бесплатной онлайн библиотеке Э-Лит


Помоги проекту - поделись книгой:

Одновременно с этим прорывом в понимании «программного обеспечения» жизни – ДНК – значительно продвинулось и описание ее «аппаратной части» – белков. Белки – это базовые строительные блоки клетки, фундаментальной структурной единицы всех известных живых существ, от единственной клетки бактерии до тех ста триллионов, из которых состоит человеческое тело. Как упоминалось выше, мир клетки впервые был обнаружен Робертом Гуком, о котором некоторые говорят как об английском Леонардо да Винчи. Гук был первым британским ученым, показавшим, как экспериментальный метод с применением инструментов реально работает и приносит нарастающее знание. В своем шедевре Micrographia{59} (1665) Гук описал клетки (само слово cell происходит от латинского cellula – «ячейка»), разглядев сотовую структуру среза пробки под микроскопом. Каждое живое существо на земле состоит из клеток, окруженных мембраной, которая создает изолированный внутренний объем. Там находится генетический материал и клеточные механизмы для его репликации.

Первые двадцать лет ХХ века в микробиологии в попытках идентифицировать молекулярную основу этой «аппаратной части» господствовала так называемая «коллоидная теория». В то время не было четких доказательств существования больших молекул, и «биоколлоидисты» утверждали, что антитела, ферменты и все такое прочее на самом деле состоят из коллоидов, то есть разнообразных смесей маленьких молекул{60}. В центре их внимания были не гигантские органические молекулы, удерживаемые вместе сильными ковалентными связями, а агрегации мелких молекул, удерживаемых вместе относительно слабыми связями. В начале 1920-х, однако, эта точка зрения пошатнулась благодаря немецкому химику-органику Херманну Штаудингеру (1881–1965), который показал, что такие большие молекулы, как крахмал, целлюлоза и белки, на самом деле представляют собой длинные цепочки из коротких повторяющихся молекулярных блоков, удерживаемых вместе ковалентными связями. Однако поначалу представление Штаудингера о том, что он называл Makromoleküle (макромолекулы), встретило почти всеобщее неприятие. Макромолекулярная теория была отвергнута даже коллегами Штаудингера по Швейцарской высшей технической школе (ETH) в Цюрихе, где он был профессором, пока не переехал в 1926-м во Фрайбург. И только в 1953-м (в год открытия двойной спирали) Штаудингер наконец получил Нобелевскую премию за свой весомый вклад в науку.

В последние годы мы пришли к тому, что рассматриваем клетку, эту основную единицу жизни, как фабрику, взаимосвязанный ряд сборочных линий, движимых белковыми машинами{61}, созданными эволюцией за тысячи, миллионы или даже миллиарды лет для выполнения специальных задач. Эта модель отмечает возрождение идеи, имевшей хождение в XVII веке, прежде всего в трудах Марчелло Мальпиги (1628–1694), итальянского врача, одного из первых микроскопистов{62}. Мальпиги предположил, что телесными функциями управляют крохотные «органические машинки».

Теперь мы знаем, что это белки, образующие множество различных классов. Катализаторы, например, ускоряют огромное разнообразие химических реакций, а фиброзные белки вроде коллагена – это главный структурный элемент, четверть всех белков, найденных у позвоночных, то есть животных со спинным хребтом, включая млекопитающих. Эластин, напоминающий резину, составляет основу легочной ткани и стенок артерий. Мембраны вокруг наших клеток содержат белки, которые помогают вводить и выводить молекулы в клетку и из клетки и участвуют в клеточной коммуникации; глобулярные белки связывают, преобразуют и выпускают химические вещества. И так далее.

Последовательность ДНК непосредственно кодирует структуру каждого белка, определяющую его активность. Генетический текст определяет линейную последовательность аминокислот, которая в свою очередь определяет сложную трехмерную структуру окончательного белка. После синтеза эта линейная полипептидная цепочка складывается в свою характерную форму: некоторые части образуют пластины, другие – стопки, складки, завитушки, закручиваются в спирали и в другие сложные конфигурации, которыми определяется работа механизма. Некоторые части белковой машины гибкие, другие – жесткие. Некоторые белки – это сборочные узлы, части большей трехмерной белковой машины.

Давайте посмотрим на АТФ-синтетазу как на один из примечательных и ярких примеров молекулярной машины. Этот фермент, в двести тысяч раз меньше булавочной головки, сделан из тридцати одного белка и, вращаясь с частотой 60 раз в секунду, способен создавать энергетическую валюту клеток – молекулу аденозинтрифосфата, или АТФ. Вы не смогли бы двигаться, думать или дышать без этого механизма. Другие белки – это моторы, как динеин, за счет которого движется сперматозоид; миозин, который движет мышцами; и кинезин, который «ходит» на паре ножек (когда присоединяется топливо в виде АТФ, одна ножка отгибается и шлепает вокруг, пока не зацепится, чтобы сделать следующий шаг) и имеет хвост, чтобы возить грузы по клеткам. Некоторые из этих транспортных роботов приспособлены для перемещения только одного вида груза: таков гемоглобин, который состоит из четырех белковых цепочек – двух альфа и двух бета, каждая из которых располагает кольцеобразной группой гема, в центре которой находится атом железа, чтобы разносить кислород по всему телу. Железо обычно крепко сцепляется с кислородом, но этот созданный эволюцией механизм обеспечивает обратимую связь молекулы кислорода с каждым из четырех гемов в каждой молекуле гемоглобина.

Светопоглощающий пигмент – это секрет одной из самых важных на свете машин, той, которая управляет экономикой жизни океанов и поверхности планеты. Хотя разные виды растений, водорослей и бактерий развили различные механизмы для запасания световой энергии, у них у всех есть структура, называемая фотохимическим реакционным центром. Там можно найти белки-антенны, включающие в себя несколько молекул светопоглощающего пигмента хлорофилла. Они улавливают солнечный свет в виде частиц света – фотонов, а потом проводят их энергию через серию молекул в реакционный центр, где она используется для чрезвычайно эффективного превращения углекислоты в сахара. Фотосинтетические процессы происходят в местах, настолько плотно набитых пигментными молекулами, что там вступают в игру квантово-механические процессы{63}. (Самая головокружительная ветвь физики, квантовая механика – разработанная в числе других Эрвином Шрёдингером, – имеет дело с микроскопическими явлениями.) Это одна из нескольких квантовых машин, используемых живыми существами в зрении, электронном и протонном туннелировании, обонянии и магниторецепции{64}. Это выдающееся открытие – еще одно доказательство идей Шрёдингера, который также рассматривал возможность того, что квантовые флюктуации играют роль в биологии{65}.

Каждая молекулярная машина создана эволюцией для автоматического выполнения очень специфической задачи, от восприятия зрительных образов до сгибания мышц. Вот почему можно думать о них как о маленьких роботах. Как писали Чарльз Тэнфорд и Жаклин Рейнольдс в книге «Природные роботы» (2001), «у него нет сознания; он не управляется разумом или высшим центром. Всё, что делает белок, заложено в его линейный текст, производный от текста ДНК».

Самый важный прорыв в молекулярной биологии после открытия генетического кода был в определении деталей главного робота – рибосомы, которая занимается синтезом белка и таким образом направляет производство всех остальных клеточных роботов. Молекулярные биологи десятки лет знали, что в рибосоме сосредоточен центр всех танцев с производством белков. Чтобы функционировать, рибосоме нужны две вещи: матричная РНК (мРНК), инструкция по изготовлению белка, скопированная из хранилища генетической информации в клетке – с ДНК; и транспортная РНК (тРНК), которая приносит на хвосте аминокислоты, используемые для создания белка. Рибосома кодон за кодоном считывает последовательность с мРНК и к каждому кодону подбирает тРНК с соответствующим антикодоном, выстраивая их груз – аминокислоты – в правильном порядке. Рибосома также действует как катализатор-рибозим: соединяет аминокислоты ковалентной химической связью, добавляя их тем самым к растущей белковой цепочке. Синтез прекращается, когда в последовательности РНК появляется кодон «стоп», но после этого полимер из аминокислот должен еще сложиться в нужную трехмерную структуру, чтобы стать биологически активным белком.

Бактериальные клетки содержат около тысячи рибосомных комплексов, что позволяет им непрерывно синтезировать белок – как для замены деградировавших белковых молекул, так и для изготовления новых для дочерних клеток во время деления. Рибосому можно рассматривать под электронным микроскопом и видеть, как она изгибается и меняет форму в ходе работы. Проворот храповика{66} в глубине рибосомы – ключевой момент белкового синтеза. Весь синтез белка происходит чрезвычайно быстро: сборка цепочки длиной около ста аминокислот занимает секунды.

Как и в случае двойной спирали, выявить подробности строения рибосомы удалось с помощью рентгеновской кристаллографии. Сначала, однако, надо было заставить рибосомы кристаллизоваться – как кристаллизуется из раствора соль, когда выпаривается вода, – чтобы получить хорошо организованные кристаллы из миллионов рибосом, собранных в правильные структуры, которые можно изучать с помощью рентгеновских лучей. Ключевое открытие было сделано в 1980-х, когда Ада И. Йонат в Израиле в содружестве с Хайнцем-Гюнтером Виттманом в Берлине вырастили кристаллы из бактериальных рибосом, выделенных из микроорганизмов горячих источников и Мертвого моря. Секреты бактериальной рибосомы были раскрыты в 2005 году, а строение эукариотной – дрожжевой – рибосомы в высоком (трехангстремном) разрешении было опубликовано французской группой в декабре 2011 года[6].

Бактериальная рибосома состоит из двух крупных частей, называемых 30S и 50S субъединицами, которые расходятся и сходятся во время работы. Меньшая субъединица 30S – это часть рибосомы, которая считывает генетический код; в большей, 50S, собственно делаются белки. Субъединица 30S изучена с точностью до атома Йонат и независимо – Венкатраманом Рамакришнаном в Лаборатории молекулярной биологии Совета по медицинским исследованиям в Кембридже (Англия). Они, например, открыли «акцепторный участок», часть субъединицы 30S, который распознает и отслеживает точность соответствия между матричной и транспортной РНК. Детали молекулярного строения показывают, как рибосома выполняет спаривание двух первых букв кодона: молекулы тычутся, пока не «ощутят» желобок в двойной спирали из хорошо подогнанных РНК, чтобы гарантировать, что код прочитывается с высокой достоверностью. При проверке третьей буквы в тройке, соответствующей конкретной аминокислоте, этот механизм оказывается менее строгим из-за неоднозначности кода. Это совпадает с наблюдением, что конкретной тРНК – и аминокислоте на ней – может соответствовать не одна тройка нуклеотидов мРНК. Например, аминокислоту фенилаланин может кодировать как тройка УУУ, так и УУЦ.

Кроме того, Гарри Ф. Ноллер из Калифорнийского университета в Санта-Крусе (начинавший свое исследование, будучи очарован тем, как двигаются молекулы) в 1999 году опубликовал первые подробные изображения целой рибосомы, а потом, в 2001-м, дополнил их еще более тонкими деталями. Его работа показала, как формируются и распадаются молекулярные мостики во время этой операции{67}. Рибосомная машина содержит пружины сжатия и кручения, сделанные из РНК, чтобы держать субъединицы вместе, когда они смещаются и проворачиваются относительно друг друга. Ее малая субъединица, двигаясь вдоль матричной РНК, связывается с транспортной РНК, у которой на одном конце свободный антикодон, а на другом – аминокислота. Аминокислоты связываются вместе в белок большой субъединицей, которая тоже связывается с транспортной РНК. Таким образом рибосома может пропускать через свой центр по 15 груженных аминокислотами молекул РНК в секунду, координируя присоединение новых звеньев к растущему белку.

На нарушении этих функций бактериальных рибосом основано действие многих антибиотиков. К счастью, хотя бактериальные и человеческие рибосомы похожи, они достаточно различаются, чтобы антибиотики могли связаться с бактериальными рибосомами и блокировать их эффективнее, чем человеческие. Все аминогликозиды – тетрациклин, хлорамфеникол, эритромицин – работают, убивая бактериальные клетки вмешательством в работу рибосом.

Йонат, Рамакришнан и Томас А. Стейтц поделили Нобелевскую премию 2009 года по химии за свои опыты по выяснению, как работает эта чудесная машина.

По мере развития геномики роль РНК выглядела все более важной. Согласно центральной догме, РНК – всего лишь посредник, обеспечивающий выполнение команд, зашифрованных в ДНК. В этой модели двойная спираль ДНК расплетается, и ее генетическая информация копируется на одноцепочечную мРНК. В свою очередь мРНК переносит ее от генома к рибосомам. Общепринятым также было мнение, что ДНК, не кодирующая белки, – это «мусорная» ДНК. Оба представления изменились в 1998 году, когда Эндрю Файр из Института Карнеги в Вашингтоне, Крейг Кэмерон Мелло из Массачусетского университета и их коллеги опубликовали свидетельства того, что двухцепочечная РНК, снятая с некодирующей ДНК, может быть использована, чтобы отключать определенные гены, – что помогло объяснить некоторые озадачивающие явления, наблюдающиеся, например, у петуний{68}. Теперь стало ясно, что некоторые участки ДНК кодируют короткие молекулы РНК – молекулярные выключатели, играющие ключевую роль в том, как и насколько интенсивно используются гены. Вся информация в живой клетке в конечном счете заключена в определенном порядке нуклеотидов и аминокислот – в ДНК, РНК и белках. Поддержание этой чрезвычайной упорядоченности в геноме определяется священными законами термодинамики. Чтобы молекулярные машины могли обуздать тепловое движение, надо затратить химическую энергию. Клетки также требуют постоянных затрат этой энергии, чтобы образовывать ковалентные связи между молекулами, а также для выстраивания этих молекул в правильном порядке или последовательности. Посреди этой бури химического хаоса лежит относительно неколебимый набор инструкций, закодированных в ДНК.

Обсуждая механизм кодирования наследственной информации, Шрёдингер имел причину говорить об «апериодическом кристалле»: он хотел подчеркнуть надежность хранения наследственной информации и использовал термин «кристалл», чтобы «объяснить постоянство гена». Совсем другое дело – белковые роботы, закодированные в наших генах, нестабильные и быстро ломающиеся. Продолжительность жизни любого белка лежит в интервале от секунд до дней. Им приходится выдерживать суету в клетке, где тепловая энергия заставляет молекулы биться друг о друга. Белки также могут складываться в неактивные и часто ядовитые скопления – на чем основаны некоторые хорошо известные болезни.

В каждый конкретный момент человеческая клетка обычно содержит тысячи разных белков, производя одни и избавляясь от других по мере надобности для поддержания своего благополучия. Недавние исследования ста белков в человеческих раковых клетках{69} показали, что период полураспада белков составляет от 45 минут до 22,5 часа. Сменяются и сами клетки. Каждый день в человеческом организме умирает 500 миллиардов кровяных клеток. Предполагается, что в ходе нормального развития любого органа умирает половина составляющих его клеток. У нас каждый день слущивается около 500 миллионов клеток кожи. В результате вы сбрасываете весь ваш внешний слой кожи каждые две-четыре недели. Пыль, которая накапливается у вас дома – это вы. Если вы не будете постоянно создавать новые белки и клетки, вы умрете. Жизнь – это процесс постоянного обновления. Без нашей ДНК, без программ жизни, клетки очень быстро гибнут, а с ними и весь организм.

То, что линейные цепочки аминокислот, определенные генетическим текстом, складываются в характерные формы, чтобы выполнять свои особые функции, кажется на первый взгляд почти что чудом. Не все правила, определяющие складывание белков, уже поняты, что неудивительно, если учесть, что типичная цепочка из аминокислот (полипептид) имеет от миллионов до триллионов возможных конфигураций сложения. Чтобы вычислить все возможные конформации любого белка до предсказуемого термодинамически стабильного состояния, Лоуренсовская национальная лаборатория в Ливерморе объединила усилия с IBM, породив Blue Gene – линию суперкомпьютеров, которые могут выполнять около триллиона операций с плавающей запятой в секунду (то есть имеют мощность в один петафлопс).

Белок из сотни аминокислот может складываться множеством способов, так что количество различных структур составляет от 2100 до 10100 возможных конформаций. Чтобы испробовать все возможные конформации для каждого белка, понадобилось бы примерно 10 миллиардов лет. Но в линейную последовательность белкового текста встроены инструкции по складыванию, которые в свою очередь определены линейным генетическим текстом. В результате с помощью броуновского движения – постоянного движения молекул, вызываемого тепловой энергией, – эти процессы происходят очень быстро – за несколько тысячных секунды. Это обеспечивается тем, что правильно сложившийся белок имеет самую низкую возможную свободную энергию. И так же, как вода стекает в самую нижнюю точку, белок естественно принимает свою предпочтительную форму.

Правильно сложенная конформация – та, которая гарантирует, что фермент может правильно работать, – включает переход от высокой степени энтропии и свободной энергии к термодинамически стабильному состоянию сниженной энтропии и свободной энергии. У белка, называемого виллин, этот процесс можно даже наблюдать благодаря компьютерной симуляции{70}. Растягивая действие реальной продолжительностью в шесть миллионных секунды до нескольких секунд, симуляция показывает, как тепловая энергия заставляет трястись исходную линейную цепочку из восьмидесяти семи аминокислот; линейный белок дергается туда-сюда и всего за шесть микросекунд проходит через множество разных конформаций на пути к окончательной форме. Представьте, сколько актов эволюционного отбора ушло на этот дерганый танец, учитывая, что аминокислотная последовательность белка определяет не только тип его свертывания, но и его окончательную структуру – и, следовательно, его функцию.

Соревнование между «правильными» и потенциально вредными вариантами складывания белков довольно быстро привело к появлению «контроля качества» клеточных белков в виде другой группы специализированных молекулярных машин. Эти «молекулярные дуэньи» – шапероны – помогают белкам складываться и препятствуют образованию вредных агрегаций, а также разбирают агрегации, которые уже сформировались. Так, например, шапероны Hsp70 и Hsp100 разбирают агрегации, а Hsp60 состоит из разных белков, которые образуют что-то вроде бочонка с крышкой, чтобы, находясь внутри, несложившийся белок мог принять правильную форму. Неудивительно, что нарушение функционирования шаперонов лежит в основе многих нейродегенеративных заболеваний и форм рака.

Самая частая у европеоидов наследственная болезнь из тех, что определяются одним геном (в США она поражает одного новорожденного из 3500), – муковисцидоз, пример неправильно складывающегося, неверно ведущего себя белка. Он вызывается дефектом в гене, который отвечает за белок, называемый муковисцидозный трансмембранный регулятор проводимости (CFTR). Этот белок регулирует транспорт хлорид-иона сквозь клеточную мембрану; его изъяны приводят к разнообразным симптомам. Например, дисбаланс воды и соли у пациентов с муковисцидозом приводит к тому, что их легкие забивает липкая слизь, которая к тому же становится средой для роста болезнетворных бактерий. Повреждение легких из-за постоянных инфекций – главная причина смерти людей с этой болезнью. Не так давно ученые показали{71}, что по большей части в основе муковисцидоза лежит самая обычная мутация, мешающая отделению транспортного белка от одного из его шаперонов. В результате последние этапы нормального складывания не проходят, и активный белок не производится в должном количестве.

Разрушение скоплений белка и белковых фрагментов жизненно важно, потому что эти субстанции могут образовывать пробки или бляшки, которые очень токсичны. Когда при забастовке мусорщиков прекращается вывоз отходов, на улицах растут горы зловонных отбросов, уличное движение замедляется, растет риск болезней, и город быстро выходит из строя. То же верно для клеток и органов. Болезнь Альцгеймера, дрожь паркинсоника и неотвратимое ухудшение при болезни Крёйцфельда-Якоба (человеческая форма коровьего бешенства) – все это происходит из-за накопления токсичных нерастворимых белковых агрегаций.

Некоторые белковые машины приспособлены для исправления ошибок при синтезе и сборке белков. Протеасомы отвечают за ликвидацию ненормальных белков путем протеолиза – реакции разрывания белковых связей, выполняемой ферментами протеиназами. Эта машина представляет собой цилиндрический комплекс, средняя часть которого состоит из четырех колец, подобно стопке бубликов, каждый бублик сделан из семи белковых молекул. Предназначенные для ликвидации в протеасоме белки-мишени помечаются молекулами убиквитина – маленького белка, присутствующего по всей клетке. Примерно тридцать лет назад этот базовый механизм избавления клетки от отходов был выявлен тремя учеными: Аароном Чехановером, Аврамом Хершко и Ирвином А. Роузом; в 2004 году они получили за это Нобелевскую премию.

Продолжительность жизни каждого белкового робота в клетке генетически запрограммирована. Действие этой программы слегка отличается в разных ветвях жизни. Например, и E. coli, и дрожжевые клетки содержат фермент бета-галактозидазу, которая помогает расщеплять сложные сахара; однако период полураспада этого фермента сильно зависит от аминокислоты на конце белка (N-концевой аминокислоты). Когда на N-конце бета-галактозидазы стоит аргинин, лизин или триптофан, время полураспада белка составляет 120 секунд у E. coli и 180 секунд у дрожжей. Если на том же месте стоит серин, валин или метионин, время полураспада значительно возрастает – более 10 часов у E. coli и более 30 часов у дрожжей. Это называется N-концевым правилом{72} пути деградации белка.

Нестабильность и недолговечность белков показывают, что и жизнь самих клеток была бы очень короткой, если бы клетки были просто мембранными мешочками – пузырьками – с белками, но без генетического материала. Все клетки умрут, если не смогут постоянно делать новые белки для замещения тех, что повреждены или неправильно сложены. Бактериальная клетка должна заново сделать все свои белки или умереть в течение часа или даже меньше. Это верно и для клеточных структур, таких как мембрана: круговорот фосфолипидных молекул и мембранных транспортеров таков, что, если они не будут постоянно пополняться новыми, мембрана лопнет и все содержимое клетки вытечет. При культивировании клеток в лаборатории применяют простой тест на жизнеспособность: определить, протекает ли их мембрана настолько, чтобы пропустить внутрь крупные частицы красителя. Если они могут проникнуть в клетки, те явно мертвы.

Другая белковая машинерия разлагает и разрушает старые или отказывающие клетки в многоклеточных организмах. Эта программируемая клеточная смерть – апоптоз – критически важная составляющая жизни и развития. Конечно, разборка чего-то настолько сложного, как клетка, требует чрезвычайно точной координации. Чтобы начать разрушение, апоптосома, белковый комплекс, прозванный «машина смерти о семи спицах», использует каскад каспаз – особой разновидности протеаз, т. е. ферментов, переваривающих белок. Эти каспазы ответственны за разборку главных клеточных белков, таких как белки цитоскелета, что приводит к характерным изменениям формы клеток, подвергающихся апоптозу. Другой признак апоптоза – это фрагментация ДНК. Каспазы играют важную роль в этом процессе, активируя фермент, расщепляющий ДНК, – ДНКазу. Кроме того, они ингибируют ферменты, ремонтирующие ДНК, разрушая структурные белки в ядре клетки.

Наши тела можно было бы представить как трехмерные белковые структуры, но постоянное обновление их компонентов делает эти структуры динамическими. Шрёдингер уловил это, когда говорил о «поразительном даре организма концентрировать в себе „поток порядка“, избегая тем самым распада в атомный хаос, – о „питье упорядоченности“ из подходящей окружающей среды».

И наконец, мы должны рассмотреть, что именно движет всей бешеной активностью и обновлением во всех и в каждой клетке. Если и был кандидат на жизненную силу для одушевления жизни, это то, что в 1827 году впервые заворожило Роберта Броуна (1773–1858), когда этот шотландский ботаник заинтересовался постоянными зигзагообразными движениями фрагментов пыльцевых зерен, феноменом, который назовут в его честь (если только вы не француз – они утверждают, что сходные наблюдения были изложены в 1828 году ботаником Адольфом-Теодором Броньяром, 1801–1876). Броуна озадачило то, что эти микроскопические движения происходили не от потоков жидкости, и не от испарения, и не от прочих очевидных причин. Сначала он подумал, что заметил «тайну жизни», но, обнаружив, что так же двигаются и минеральные крупицы, отмел это представление.

Первый существенный сдвиг в нашем нынешнем понимании того, чему стал свидетелем Броун, произошел более чем через 75 лет после его открытия, когда Альберт Эйнштейн (1879–1955) рассмотрел теоретически, как невидимые молекулы, из которых состоит вода, должны подпихивать плавающие в ней мелкие частицы. До статьи Эйнштейна 1905 года кое-кто из физиков (особенно Эрнст Мах, 1838–1916) все еще сомневался в физической реальности атомов и молекул. Модель Эйнштейна была в конце концов подтверждена точными экспериментами, проведенными в Париже Жаном Батистом Перреном (1870–1942), который в 1926 году был награжден за эту и другие работы Нобелевской премией.

Броуновское движение оказалось важным, когда дело дошло до понимания работы живых клеток. Многие жизненно важные компоненты клеток, такие как ДНК, намного больше отдельных атомов, но все же достаточно малы, чтобы их двигали постоянные удары окружающего моря атомов и молекул. Так что, хотя ДНК действительно имеет форму двойной спирали, благодаря силам хаотического броуновского движения это извивающаяся, сгибающаяся, кружащаяся спираль. Белковые роботы живых клеток способны складываться в свои правильные формы лишь потому, что их компоненты – это подвижные цепочки, пластинки и спирали, которые постоянно толкутся внутри защитной клеточной мембраны. Жизнь движется броуновским движением, начиная с кинезиновых грузовичков, которые тянут маленькие мешочки с веществами вдоль микротрубочек к вращающейся АТФ-синтетазе{73}. Критически важно, что броуновское движение зависит от температуры: слишком низкая – и движения не хватает; слишком высокая – и все структуры идут вразнос от бешеного движения. Поэтому жизнь может существовать только в узком спектре температур.

Внутри этого спектра в клетках постоянно происходит что-то вроде девятибалльного землетрясения. «Вам не нужно было бы даже нажимать на педали велосипеда: просто приделайте к колесу храповик, чтобы оно не могло крутиться назад, и тряситесь вперед», как говорили Джордж Остер и Хуньгун Ван с факультета молекулярной и клеточной биологии Калифорнийского университета в Беркли{74}. Белковые роботы совершают похожий трюк, используя храповики и рабочие такты для обуздания силы броуновского движения. Благодаря непрекращающемуся беспорядочному движению и вибрации молекул на коротких дистанциях очень быстро происходит диффузия, что позволяет происходить биологическим реакциям с малыми количествами реагентов в чрезвычайно тесных объемах большинства клеток.

Теперь, когда мы знаем, что линейный текст ДНК определяет строение белковых роботов и РНК, которые управляют нашими клетками, а их строение, в свою очередь, определяет их функции, следующий вопрос очевиден: как нам читать и понимать этот текст, чтобы мы могли понять программу жизни?

Глава 4. Оцифровка жизни

Первые дни молекулярной биологии были отмечены тем, что многим показалось самонадеянным отщеплением новой науки от биохимии. Однако наш спор не касался методов биохимии, но лишь их слепого игнорирования новой области химии информации.

Сидней Бреннер, 2005{75}

Настала эра цифровой биологии, в которой белки и другие взаимодействующие молекулы в клетке можно рассматривать как компьютерное «железо», а информацию, закодированную в ДНК, – как клеточный «софт», то есть программы. Вся информация, нужная для создания живой самовоспроизводящейся клетки, заключена в цепочках двойной спирали ДНК. По мере чтения и истолкования этого текста мы в конце концов сможем полностью понять, как работают клетки, а затем изменять и улучшать их путем написания новых клеточных программ. Но, конечно, это легче сказать, чем выполнить: изучение этих программ – ДНК – показывает, что они значительно сложнее, чем мы думали даже лет десять назад.

В то время как первая линейная последовательность аминокислот в белке (инсулине) была установлена Фредом Сэнгером в 1949 году, разработка методов чтения ДНК оказалась делом долгим. В 1960-х и 1970-х продвижение было медленным и секвенирование измерялось в нескольких парах оснований в месяц или даже в год. Например, в 1973 году Аллан Максэм и Уолтер Гилберт из Гарвардского университета опубликовали статью, описывающую, как с помощью их нового метода секвенирования{76} были установлены двадцать четыре пары оснований. Одновременно шло и секвенирование РНК, продвигавшееся несколько быстрее. И все же по сравнению с возможностями современных технологий даже для чтения нескольких букв кодированного текста в ту пору требовались поистине героические усилия.

Большинство людей узнали о геномике при первой расшифровке человеческого генома, которая увенчалась моим появлением в Белом доме в 2000 году рядом с моими коллегами-соперниками и президентом Клинтоном, где мы торжественно объявили об открытии последовательности человеческого генома. На самом деле первые идеи о расшифровке ДНК относятся к временам полувековой давности, когда Уотсон и Крик предложили модель ее атомной структуры. Большой скачок в нашем познании случился, когда в 1965-м группа под руководством Роберта Холли из Корнеллского университета опубликовала последовательность из семидесяти семи рибонуклеотидов аланиновой транспортной РНК (тРНК) из клетки дрожжей Saccharomyces cerevisiae{77} как часть работы по выявлению того, как тРНК помогает собирать аминокислоты в белки. Секвенирование РНК продолжало лидировать, когда в 1967 году группа Фреда Сэнгера установила последовательность нуклеотидов рибосомальной 5S-РНК E. coli, короткой молекулы из 120 нуклеотидов{78}. Первый реальный геном, который был успешно расшифрован, был вирусной РНК: в 1976 году лабораторией Вальтера Фирса в Гентском университете в Бельгии был секвенирован бактериофаг MS2. Фирс изучал бактериофаги (которые захватывают для своего размножения бактерии) совместно с Робертом Л. Синшаймером из Калтеха, а потом с Харом Гобиндом Кораной в Мэдисоне (Висконсин).

Технология секвенирования ДНК, которая дала мне возможность секвенировать человеческий геном, зародилась в середине 1970-х, когда группа Фреда Сэнгера в Кембридже разработала новую технику – первую, которую можно было назвать «более-менее секвенированием». За ней последовала методика, которую Сэнгер назвал дидезокси-секвенированием ДНК, но которая в его честь теперь называется «секвенированием по Сэнгеру». В нем применяются дидезоксинуклеотиды, или нуклеотиды-терминаторы, которые останавливают ДНК-полимеразу, не давая ей добавлять нуклеотиды к растущей цепочке ДНК. У дидезоксинуклеотидов нет гидроксильной группы (–ОН), что означает, что после того, как ДНК-полимераза прицепит их к растущей нуклеотидной цепочке, дальше нельзя добавить никаких нуклеотидов. Прикрепив радиоактивный фосфат к одному из четырех нуклеотидов, чтобы пометить фрагменты, стало возможным прочесть порядок А, Т, Ц и Г, прикладывая гель, использованный для разделения оснований, к рентгеновской пленке[7].

Группа Сэнгера использовала его новые инструменты секвенирования для установления первой последовательности генома ДНК-вируса, принадлежащего бактериофагу phi X 174{79}; эта последовательность была опубликована в Nature в 1977 году. Клайд Хатчинсон (ныне сотрудник Института Вентера) стажировался в лаборатории Сэнгера (от Университета Северной Каролины, где он с 1968 года был штатным преподавателем) и внес свой вклад в секвенирование генома phi X 174. В 1950-х Синшаймер, использовав рассеяние света, оценил размер генома phi X 174 примерно в 5400 оснований и был удовлетворен, когда Сэнгер выяснил, что точное количество – 5386{80}.

За два года до появления статьи Сэнгера я закончил свою диссертацию в Калифорнийском университете в Сан-Диего (UCSD) и успел перейти в Университет штата Нью-Йорк в Баффало, чтобы начать собственную научную и преподавательскую карьеру. Я пропустил публикацию Сэнгера, потому что она вышла в самый разгар Бурана-77[8], к тому же спустя две недели после публикации у меня родился сын{81}. Моя лаборатория в это время работала над выделением и описанием рецепторов для нейромедиаторов – белков, обеспечивающих передачу сигналов между нервными клетками.

За десять лет, последовавших за работой над геномом phi X 174, секвенирование ДНК постепенно прогрессировало. Хотя секвенирование по Сэнгеру стало мировым стандартом, оно было медленным, очень трудоемким и требовало заметных количеств радиоактивного фосфора, у которого период полураспада – всего пара недель. Кроме того, чтение гелей с последовательностями было скорее искусством, чем наукой. В своей второй Нобелевской лекции Сэнгер описывал утомительные усилия, которых требовало раннее секвенирование ДНК, и заключал: «Судя по всему, для секвенирования генетического материала был весьма желателен новый подход»{82}.

В 1984 году я перевел свою исследовательскую команду в Национальный институт здоровья, и мы начали учиться молекулярной биологии с помощью нескольких хороших сборников рецептов по этому предмету и моих взаимодействий с Маршаллом Ниренбергом и его лабораторией, которая располагалась этажом ниже нашей в корпусе 36. За мой первый год в НИЗ мы секвенировали только один ген, адреналинового рецептора человеческого мозга{83}, используя радиоактивное секвенирование по Сэнгеру, но это заняло большую часть года. Как и Сэнгер, я был уверен, что должен быть способ получше. К счастью, это было примерно в то время, когда Лерой Худ и его команда в Калтехе опубликовали ключевую статью с описанием, как они заменили в нуклеотидах-терминаторах радиоактивный фосфат на четыре разных флюоресцентных красителя, которые, если их активировать лазерным лучом, можно было последовательно считывать прямо в компьютер{84}. Я раздобыл одну из первых автоматических ДНК-секвенирующих машин в новой компании Applied Biosystems, как раз когда начались серьезные обсуждения дикого предложения секвенировать целиком человеческий геном.

Используя новую технологию секвенирования ДНК в сочетании с компьютерным анализом, моя лаборатория быстро секвенировала тысячи человеческих генов по разработанной мною новой методике, фокусировавшейся на относительно коротких последовательностях, которые я назвал «экспрессированными метками сиквенса» (expressed sequence tags; EST){85}. Метод EST включал секвенирование экспрессированного[9] генетического материала – матричной РНК (точнее, синтезированной на ней комплементарной ДНК). Хотя с помощью методики EST мы успешно прочли несколько тысяч человеческих генов, мой подход не встретил немедленно всеобщего одобрения. Многие увидели в нем угрозу традиционному пути работы с генами: мы могли за день открыть больше генов, чем всё научное сообщество – за предыдущие десять лет. Не улучшило ситуации и то, что правительство США решило зарегистрировать патенты на все гены, идентифицированные моей командой. Наши открытия вызывали атаки и возражения, но они же приводили к некоторым заманчивым предложениям, в том числе – создать мой собственный базовый научно-исследовательский институт, каковое я и принял в 1992 году. Я назвал его Институтом геномных исследований (The Institute for Genomic Research, TIGR), и именно там, в Роквилле (штат Мэриленд), мы построили самую крупную в мире фабрику секвенирования ДНК, используя последние версии автоматических ДНК-секвенирующих машин.

Ход истории геномики изменился в 1993 году после случайной встречи на научной конференции в Бильбао, в Испании, где я обрисовал наше быстрое продвижение в открытии генов. Многие в аудитории как будто были шокированы масштабными результатами наших работ по EST и самой природой наших открытий – особенно генов, ответственных за неполипозный рак толстой кишки, открытых в сотрудничестве с Бертом Фогельштайном из Киммелевского онкологического центра Университета Джонса Хопкинса в Балтиморе. Как только рассеялась толпа, пришедшая задавать прямые вопросы, передо мной появился высокий приятного вида человек с серебристыми волосами и в очках. «Я думал, у вас есть рожки», – сказал он, намекая на демонический образ, который часто использовала пресса, изображая меня. Он представился Хэмилтоном Смитом из Университета Джонса Хопкинса. Я уже знал о Хэме по его серьезной репутации в нашей области и по Нобелевке, и мне он сразу понравился – он явно решил составить обо мне и моей науке собственное впечатление и не давать окружающим влиять на его мнение{86}.

Хэм к тому времени сделал долгую и плодотворную карьеру и теперь, в 62 года, подумывал об отставке. Когда мы разговаривали в баре, а потом на обеде после моей лекции, он высказал интересную идею: предложил свою любимую бактерию Haemophilus influenzae, из которой он выделил первые рестриктазы, в качестве идеального кандидата для секвенирования генома с применением моего подхода.

Наш первый совместный проект начался с медленного старта, поскольку Хэм объяснил, что есть проблемы с получением библиотек клонов, содержащих фрагменты генома H. influenzae. Только спустя годы он признался мне, что его коллеги в Университете Джонса Хопкинса были совсем не в восторге от нашего проекта, глядели на меня с подозрением из-за фурора, произведенного EST, и опасались, что сотрудничество со мной испортит ему репутацию. Хотя многие из них всю свою трудовую жизнь изучали H. influenzae, они не сразу оценили идею получения полной последовательности генома. Хэм в конце концов был вынужден действовать за спиной своей группы – как и я несколькими годами раньше при работе с EST{87}.

Хэм начал сотрудничать со мной в TIGR. Наша работа над проектом началась в 1994 году и вовлекла в себя большую часть моей научной команды. Мы действовали не так, как Сэнгер много лет назад с phi X 174, используя изолированные одиночные вырезанные фрагменты для секвенирования по одному за раз. Мы полностью положились на случайность. Мы разбили геном на фрагменты в смешанной библиотеке[10] и случайно выбрали двадцать пять тысяч фрагментов, чтобы получить прочитанные последовательности примерно по пятьсот букв каждая. Применив новый алгоритм, разработанный Грейнджером Саттоном, мы начали составлять величайшую на то время биологическую мозаику, собирая кусочки в исходный геном. В процессе мы разработали несколько новых методов для завершения сборки генома. Каждая отдельная пара оснований генома была точно секвенирована, а двадцать пять тысяч фрагментов аккуратно собраны. Результатом стало то, что 1,8 миллиона пар оснований генома были воссозданы в компьютере в правильном порядке.

Следующим шагом было интерпретировать геном и идентифицировать все составляющие его гены. Будучи первым, кто изучал набор генов живого самовоспроизводящегося организма, я хотел сделать гораздо больше, чем просто представить последовательность. Команда потратила значительное время, выясняя, что говорит набор генов о жизни организма. Что означает тот софт, который программирует структуры и функции жизни? Мы описали наши результаты в статье, которая была быстро принята к публикации в журнале Science и должна была выйти по расписанию в июне 1995 года. Слухи о нашем успехе поползли еще за несколько недель до ее выхода. В результате меня пригласили прочитать президентскую лекцию на ежегодной встрече Американского микробиологического общества, которая проходила в Вашингтоне 24 мая 1995 года, и я принял это предложение с условием, что на сцене ко мне присоединится Хэм. Ожидания стали физически давить на меня, когда президент общества Дэвид Шлезингер из Университета Вашингтона в Сент-Луисе объявил то, что он назвал «историческим событием».

При помощи Haemophilus influenzae мы перевели двойную спираль биологии в цифровой мир компьютера, но веселье только начиналось. Работая с геномом этой бактерии, чтобы исследовать ее биологию и как она вызывает менингит и другие болезни, мы одновременно для подтверждения методики секвенировали еще один геном – самый маленький из известных тогда бактериальных геномов, геном Mycoplasma genitalium. Когда я закончил речь, аудитория поднялась в едином порыве и устроила мне долгую и сердечную овацию. Я никогда раньше не видел на научной конференции{88} такой масштабной и спонтанной реакции.

Это был очень сладкий миг. Моя команда стала первой, когда-либо секвенировавшей геном живого организма, и не менее важным было то, что мы это сделали, разработав новый метод, который назвали «полногеномное секвенирование методом дробления[11]». Это свершение отметило начало новой эры, когда чтение ДНК живых существ стало настолько рутинным делом, что позволяло анализировать их, сравнивать и понимать.

После завершения чтения генома Haemophilus influen-zae я хотел секвенировать второй геном, чтобы мы могли сравнивать два генома, что помогло бы понять базовый набор генов, потребных для жизни. В это время Клайд Хатчинсон в Университете Северной Каролины в Чапел-Хилле предложил перспективного кандидата с самым наименьшим известным геномом: вид Mycoplasma genitalium, у которого меньше пятисот генов. Мы решили, что этот геном дополнит нашу работу по H. influenzae, потому что он принадлежит другой группе бактерий. Окраска по Граму, названная так в честь ее изобретателя Ханса Кристиана Грама (1853–1938), делит все виды бактерий на две категории в зависимости от того, как они реагируют на краску: грамположительные (как Bacillus subtilis, например) становятся фиолетовыми или синими, а грамотрицательные (как H. influenzae) приобретают розовый или красный цвет. Считалось, что M. genitalium эволюционно произошла от какой-то бациллы, поскольку она классифицировалась как одна из грамположительных бактерий.

Для завершения секвенирования этого генома потребовалось всего лишь три месяца, и в 1995 году мы опубликовали 580 000 пар оснований генома Mycoplasma genitalium в Science{89}. Наше достижение должно было послужить основой большого труда по сотворению синтетической клетки, но в то же время у него нашлись и более скорые последствия. Эта работа дала старт новой дисциплине, известной как сравнительная геномика. Сравнив два первых в истории секвенированных генома, мы могли поискать общие элементы, связанные с живой самовоспроизводящейся формой жизни. Сравнительная геномика разрабатывает одно из самых захватывающих открытий биологии: создав однажды белковую структуру, которая выполняет важную биологическую функцию, эволюция склонна использовать эту структуру/последовательность снова и снова.

Гены, которые управляют фундаментальным процессом деления клеток у дрожжей, например, похожи на те, которые используют наши клетки{90}. Поскольку из бактерии E. coli уже выделили, секвенировали и функционально охарактеризовали гены, кодирующие ДНК-полимеразу, наша группа могла использовать эту информацию для поиска сходных последовательностей в геноме H. influenzae. Если бы какие-либо из последовательностей ДНК близко соответствовали гену ДНК-полимеразы E. coli, мы могли бы сделать вывод, что ген H. influenzae –  это тоже ген ДНК-полимеразы. Проблема была в том, что в 1995 году базы данных генов были весьма скудны, поэтому мы мало с чем могли сравнить наш геном. В целом почти 40 % предполагаемых генов в наших секвенированных геномах не имели соответствия в базе данных.

Наша статья в Science про M. genitalium описывала, как мы использовали данные из обоих секвенированных геномов, чтобы задать основные вопросы о рецепте жизни: каковы ключевые отличия в генном содержимом двух видов? У H. influenzae около 1740 белков, кодируемых каждый своим геном, и примерно восемьдесят генных последовательностей для РНК. У M. genitalium только 482 гена, кодирующих белки, и 42 гена для РНК. Геном M. genitalium меньше отчасти потому, что в нем отсутствуют все гены ферментов, производящих собственные аминокислоты (она может добывать их из человека-хозяина). Как и у M. genitalium, у нас тоже есть незаменимые аминокислоты – валин и триптофан, которые наши клетки не могут синтезировать, и их приходится получать с пищей.

Возможно, еще интереснее вопрос: какие гены общие у этих двух микроорганизмов? Если те же самые гены найдутся у организмов многих разных типов, они обретут гораздо большее значение. Общие гены предполагают общего предка и могут оказаться поистине важнейшими для самого процесса жизни. Ключевой абзац нашей статьи 1995 года гласит: «Обзор генов и их организации у M. genitalium позволяет описать минимальный набор генов, необходимый для выживания».

Мы начали думать над базовым набором жизненно важных генов. Какое минимальное число генов требуется клетке, чтобы выжить и процветать? Мы надеялись, что гены, присутствующие у обеих бактерий из двух разных групп, дадут представление о критическом наборе генов.

Скудость наших биологических познаний в 1995 году отражает уже то, что мы понятия не имели о функциях 736 генов (43 % от всего набора) у H. influenzae и 152 генов (32 %) M. genitalium. Во время написания статей мы много спорили о жизни и о том, действительно ли M. genitalium представляет собой минимальный набор генов. Эти наши дискуссии отразились в заключении статьи о M. genitalium: «Сравнение [новых секвенированных геномов] с генной последовательностью M. genitalium должно способствовать более точному определению фундаментального комплекта генов для самовоспроизводящегося организма и более полному пониманию разнообразия жизни». Другие группы также начали работать с нашими данными по двум первым опубликованным геномам. Евгений Кунин из НИЗ провозгласил, что эта разработка отмечает новую эру в геномной науке, и заключил путем компьютерного исследования, что у микробов очень невелико генное разнообразие. Он основывался на сходстве между наборами генов грамотрицательных (H. influenzae) и грамположительных (M. genitalium) бактерий{91}. Однако наш следующий геномный проект одним ударом изменил принятые представления о генетическом разнообразии.

В 1996-м мы намеренно выбрали для третьей работы над геномом необычный вид: Methanococcus jannaschii. Этот одноклеточный организм живет в экстремальной среде – гидротермальном источнике, где из-под дна океана бьет горячая, насыщенная минеральными соединениями жидкость. В этих адских условиях клетки противостоят давлению в 245 атмосфер и температурам около 85 градусов Цельсия. Это само по себе примечательно, потому что большинство белков денатурируют при температурах от 50 до 60 градусов (в частности, именно это происходит с яичным белком при варке). В отличие от жизни на поверхности Земли, зависящей от солнечного света, Methanococcus – хемотроф, то есть делает все, что ему нужно для существования, из неорганических веществ. Источником углерода для любого белка и липида в клетке Methanococcus служит диоксид углерода. Кроме того, превращая углекислоту в метан, этот микроб получает энергию для своей жизнедеятельности. Methanococcus принадлежит к предполагаемой третьей ветви жизни – так называемым археям, которые в 1977 году открыл Карл Вёзе из Университета Иллинойса в Урбане{92}. Вместе с Вёзе мы выбрали Methanococcus как первую архею, геном которой будет секвенирован и проанализирован.

Сиквенс не подвел. Геном Methanococcus{93} расширил наш взгляд на биологию и генетические богатства планеты. Почти 60 % генов Methanococcus были новыми для науки, ничего не знавшей об их функциях; только 44 % генов напоминали что-то описанное ранее. Некоторые из генов Methanococcus, включая те, которые связаны с основным энергетическим обменом, напоминают те, которые есть у бактериальной ветви жизни. В то же время другие его гены, включая те, что связаны с переработкой информации и репликацией генов и хромосом, лучше всего соответствуют эукариотным генам, в том числе некоторым человеческим и дрожжевым. Наше геномное исследование побывало на первой странице каждой крупной газеты в Америке и широко освещалась в большей части остального мира: The Economist выбрал заголовок «Горячая штучка», в то время как Popular Mechanics возвещала об «Инопланетной жизни на Земле», и ей вторили San Jose Mercury News с заголовком «За пределами научной фантастики»{94}. Кстати, современные исследования наводят на мысль, что эукариоты – это потомки архей, и если это окажется так, мы опять вернемся к двум главным ветвям жизни{95}.

В том же 1996 году в газетные «шапки» по всему миру попала и НАСА, когда опубликовала то, что некоторые приняли за свидетельство микробной жизни на Марсе. Эверетт Гибсон и его коллеги из агентства объявили, что нашли в метеорите ALH 84001 окаменелость не более нанометра размером. Это было сенсационной находкой, поскольку ALH 84001 был выбит из поверхности Красной планеты и затем упал на Землю примерно тринадцать тысяч лет назад.

Эти сообщения о микробах-марсианах, сопровождаемые интригующими картинками мелких клякс и микроскопических колбасок, еще больше подхлестнули дискуссии о том, из чего может состоять минимальный геном. Наши простые прикидочные расчеты показали, что объем упомянутой «нанобактерии» настолько мал, что просто не может содержать молекулы ДНК или РНК. Теперь уже ясно, что структуры, найденные в ALH 84001, не имеют отношения к живым существам и что отложения, напоминающие примитивные клетки, могут возникать просто в ходе роста кристаллов{96}.

Следующие несколько лет моя команда продолжала секвенировать множество уникальных видовых геномов, включая тот, на который нас вдохновила новаторская работа австралийца Барри Маршалла. Они с патологом Робином Уорреном считали, что язву желудка вызывает спиралевидная бактерия, позже названная Helicobacter pylori. На меня произвело впечатление упорство Маршалла, работа которого постоянно оспаривалась. Его коллеги не желали верить, что причиной язвы может быть бактерия, а не стресс. В 1984 году Маршалл, вдохновленный своей убежденностью, выпил раствор с бактерией. Вскоре у него начались приступы рвоты и развился гастрит. В конце концов его настойчивость окупилась. Благодаря его исследованию миллионы людей были вылечены антибиотиками вместо ежедневного приема лекарств, снижающих кислотность, – что заодно снизило риск развития рака желудка. Мы опубликовали геном Helicobacter pylori в 1997 году{97}, а в 2005-м Маршалл получил Нобелевскую премию по медицине{98}.

Поскольку одноклеточная жизнь существовала около четырех миллиардов лет, она достигла разнообразия, позволяющего освоить всевозможные места обитания, от морозных антарктических пустынь до горячих кислых источников. Способностью к жизни «на грани» эти организмы, обитающие в крайних условиях, заслужили название «экстремофилов». Прощупывая жизнь у ее пределов, как в случае с Methanococcus, мы надеялись получить больше всего от сравнительной геномики. Следующий экстремофильный геном, который мы секвенировали, был геномом рода Archaeoglobus, живущего в нефтяных месторождениях и горячих источниках. Этот организм использует как источник энергии сульфаты, но может пожирать почти что угодно{99}. Наш первый анализ более чем двух миллионов букв его генома показал, что функции четверти его генов были неизвестны (две трети из этих загадочных генов были общими с M. jannaschii), а еще четверть кодировала новые белки.

Наше секвенирование двух первых бактериальных геномов и одного генома археи, а также публикация большим консорциумом лабораторий генома дрожжей{100} дали миру первый взгляд на геномы всех трех ветвей жизни. Что эти данные говорят нам о базовом наборе ингредиентов жизни? Наши попытки установить минимально необходимые для жизни гены повели нас по нескольким экспериментальным путям. Наш изначальный план был подойти к пониманию минимальной самовоспроизводящейся формы жизни с разных сторон. Окончательным решением был бы синтез генома, но пока нам было нужно очень много информации об основах клеточной жизни, которой не было в научной литературе.

Самым очевидным подходом было вырубать гены в геноме M. genitalium, чтобы установить, какие из них существенны: удалите или отключите ген, и если организм продолжает жить, вы можете считать, что этот конкретный ген не играет критической роли; если же организм умирает, то ген был явно существенным. Идея была проста и ранее успешно применялась к разным видам. Марио Капеччи из Университета Юты, Оливер Смитис из Университета Северной Каролины и Мартин Эванс из Кардиффского университета в Великобритании получили в 2007 году Нобелевскую премию за разработанную ими в 1980-х технологию создания «нокаутных» мышей, у которых избирательно отключен один или несколько генов.

Другое дело, что для применения этих методов к M. genitalium были серьезные практические препятствия. Нокаутировать гены у организма вроде дрожжей относительно легко благодаря арсеналу генетических инструментов, применимых к таким видам. Для микоплазм таких инструментов просто нет – как нет и инструмента для многих последовательных изменений генов.

Один из фундаментальных инструментов молекулярной биологии – отбор с помощью антибиотиков. При таком отборе клетки, в которых были изменены гены, отбираются путем убивания всех немодифицированных клеток антибиотиком. Модифицированные клетки выживают, потому что плазмиды ДНК, применяемые для введения в них новых генов, содержат еще и гены устойчивости к антибиотику. Хотя эта технология – основа большинства молекулярно-биологических экспериментов, к сожалению, в них применяется лишь несколько систем для отбора антибиотиками, что сильно ограничивает число последовательных изменений генов, которые можно проделать.

Для решения одной из проблем Клайд Хатчинсон предложил уникальный подход, который мы назвали «полногеномным транспозонным мутагенезом», при котором небольшая молекула ДНК, называемая транспозоном, разрывает ген, что позволяет нам судить, насколько этот ген был важен. Транспозоны, или мобильные генетические элементы, – это относительно короткие последовательности ДНК, способные встраиваться в геном – в определенные участки или в случайные места. Американка Барбара Макклинток открыла транспозоны в кукурузе, где они меняли распределение пигментации зерен. Эта работа принесла ей в 1983 году Нобелевскую премию{101}. Транспозоны можно считать эгоистичными генами, вроде вирусов, которые «заражают» геном. Оказывается, изрядная доля вашего генома состоит из таких ДНК-паразитов. Они важны, и не в последнюю очередь потому, что могут вызывать генетические болезни, если вставятся в ключевой ген и нарушат его функционирование.

Мы выбрали транспозон (Tn4001), выделенный у Staphylococcus aureus, чтобы он случайно вставлялся в геном M. genitalium и нарушал функционирование генов. Мы растили клетки, которые пережили такие вставки, выделяли и секвенировали их ДНК, начиная с праймера последовательности, который связывается только с транспозоном, чтобы точно определить, где в геноме окажется транспозон. Если Tn4001 вставится в середину гена и клетки это переживут, то мы считали этот ген несущественным для жизни.

После транспозонной бомбардировки генома мы сочли жизненно важными все гены, которые в живых клетках не имели транспозоновых вставок. Но проанализировав свои данные, мы поняли, что эта абсолютная система счета наивна, что гены и геномы существуют в определенных условиях и что жизнь не определяется одними генами. Поскольку все клетки получают ключевые питательные вещества и химикаты из окружающей среды, то, когда эта среда изменяется, ключевыми для жизни оказываются другие гены.

Белки мембранного транспорта ответственны за перенос важных питательных веществ из окружающей среды в клетки. Например, M. genitalium может расти как на глюкозе, так и на фруктозе, и у нее есть два гена, в которых зашифрованы специфические белки-транспортеры для каждого из этих сахаров. В наших исследованиях с транспозоновыми вставками оба гена оказались в группе несущественных для жизни, что поначалу нас удивило: ведь они были ключевыми для способа питания этого организма. Однако мы поняли, что среда, на которой мы обычно растили клетки M. genitalium, содержит и глюкозу, и фруктозу, что означает, что если ген какого-то транспортера выключается, то клетка просто переключается на потребление другого сахара. Напротив, если мы растили клетки только на одном сахаре, то, при вырубании транспортера именно этого сахара клетки умирали. Для некоторых функций, таких как метаболизм сахаров, определить «условно жизненно важные гены» нетрудно, но для тех генов, функции которых в клетке еще неизвестны, нет очевидного способа убедиться, не замещен ли разорванный ген другим.

Это оказалось особенно важно, когда мы включили в исследования вид Mycoplasma pneumonia, ближайшего известного родича M. genitalium, размер генома которого – 816 000 пар оснований, т. е. на 236 000 пар больше, чем у M. genitalium. Опять же мы хотели соединить работы по транспозоновой вставке со сравнительной геномикой, чтобы определить минимальный набор генов, нужных для жизни. Практически у каждого из 480 белок-кодирующих генов Mycoplasma genitalium в геноме M. pneumonia есть «родич», происходящий от общего с ним предкового гена (ортолога), и кроме того, есть еще 197 генов. Это наводит на соблазнительную мысль: не может ли набор из 480 генов, общих для двух видов, уже быть близок к минимальному геному? Наше исходное предположение состояло в том, что все 197 «лишних» генов в геноме M. pneumonia можно уничтожать вставками транспозонов, поскольку само существование M. genitalium предполагает, что они не необходимы для жизни. Результаты были не слишком удовлетворительны и информативны: мы обнаружили, что всего вставками транспозонов были разрушены 179 генов M. pneumonia, но из 197 «лишних» были разрушены лишь 140.

Сопоставив наши работы, мы вычислили, что у M. genitalium от 180 до 215 несущественных генов и от 265 до 350 – существенных. Из последних функция 111 неизвестна. Это явно не было точным определением жизни, которое мы искали. К тому же по мере проработки этих данных становилось всё очевиднее, что есть гены, каждый из которых сам по себе несущественен, но все вместе их удалять нельзя.

Учитывая скудость молекулярно-биологических инструментов и ограниченность данных по транспозонам, мы решили, что единственный путь получения минимального генома – попытаться синтезировать целый бактериальный геном с нуля. Нам надо будет химически синтезировать целую хромосому, используя только существенные гены. Однако это была бы громадная задача. Хотя ученые и писали маленькие кусочки генетических текстов уже почти полстолетия, никто не сделал ни одной конструкции из ДНК размером хотя бы в сотую долю того, что был нужен нам.

Работа над химическим синтезом ДНК начиналась в 1950-е, с успеха Хара Гобинда Кораны и Маршалла Ниренберга, но заметный прогресс был сделан лишь в 1980-е вслед за внедрением автоматического синтезатора ДНК Марвином Карузерсом из Колорадского университета в Боулдере. В его синтезаторе стояли четыре бутыли с нуклеотидами А, Т, Ц и Г, из которых они добавлялись по одному в предписанном порядке. Таким образом ДНК-синтезаторы могут делать короткие цепочки ДНК, называемые олигонуклеотидами. Однако при увеличении длины олигонуклеотидов выход продукта и точность падают. Вокруг синтеза олигонуклеотидов и продажи их исследователям выстроилась целая индустрия, потому что синтетическая ДНК применяется в молекулярной биологии для секвенирования ДНК и проведения ПЦР (полимеразных цепных реакций).

Синтетические олигонуклеотиды химическими методами можно соединять в более длинные куски ДНК. Когда мы впервые начали обсуждать синтез целого генома, самые длинные куски ДНК, которые удавалось сделать, были длиной в несколько тысяч пар оснований. Чтобы выстроить геном жизнеспособного организма, от нас требовалось химически синтезировать и собрать почти шестьсот тысяч пар оснований. Мы поняли: чтобы достичь этой цели, нам придется разрабатывать новые методы. Чтобы посмотреть, реальна ли наша идея хоть в каком-то приближении, мы решили, что надо попробовать сделать небольшой тестовый проект. Мы выбрали для синтеза геном бактериофага phi X 174. Помимо того, что это был первый секвенированный ДНКовый вирус, почти тридцать лет назад другая команда уже сделала примечательную и успешную попытку скопировать этот одноцепочечный геном с помощью ферментов.

Глава 5. Синтетический phi X 174

Это будет одна из самых важных историй, которые когда-либо читали вы, или ваш папа, или ваш дедушка… Эти люди открыли фундаментальный секрет жизни. Это потрясающее достижение. Оно широко распахивает двери к новым открытиям в борьбе с болезнями, в строительстве намного более здоровой жизни для всех людей. Это может быть первым шагом – как говорят эти великие гении из лаборатории – к контролю над некоторыми видами рака в будущем.

Президент Линдон Джонсон, декабрь 1967 года{102}

Хотя большинство людей никогда не слышали о phi X 174, этот простой бактериофаг уже завоевал место в истории. Фаг был первым ДНКовым вирусом, подвергшимся секвенированию, и первым, чей геном искусственно скопировали и активировали. Найденный в парижской канализации{103} phi X 174 поражает бактерию из человеческого кишечника E. coli. Можно удивиться, почему так много внимания уделено такому вроде бы неприметному вирусу, но причина проста: в этом вирусе, если изучать его на молекулярном уровне, почти ничего нет. Phi X 174 состоит из хромосомы – кольцевой молекулы ДНК, в которой всего 11 генов, – упакованной в икосаэдрическую «одежку» из белков, включая дюжину пятиугольных «шипов». Хотя под электронным микроскопом фаг выглядит красивым, как цветок, на самом деле это холодная геометрическая форма. Вирус не живее кристалла соли. Его жизненный цикл таков: фаг впрыскивает свою ДНК в бактериальную клетку, где она перехватывает управление биохимической машиной клетки, заставляя ее производить множество новых вирусов. Затем потомство вырывается из клетки, будучи готово заразить еще больше бактерий E. coli.

До появления секвенирования ДНК и даже до того, как стало известно строение генома фага, вирус в 1960 году воссоздала в лаборатории Стэнфордского университета группа под руководством биохимика Артура Корнберга. Ключом к этому достижению стало открытие Корнбергом ДНК-полимеразы, главнейшего фермента для репликации ДНК. Лаборатория Корнберга, используя новооткрытый фермент, начала копировать ДНК in vitro. Судя по статьям Корнберга, его команда сначала попыталась скопировать бактериальный геном, но успеха не имела из-за неспособности полимеразы прочесть безостановочно насквозь весь геном, который состоит из миллионов оснований ДНК.

После провалившегося эксперимента Корнберг решил сделать то, что тридцать лет спустя собиралась сделать моя группа: он поставил себе целью воспроизвести какую-нибудь ДНК попроще, а именно phi X 174. К тому времени один из первопроходцев в генном синтезе и секвенировании, Роберт Синшаймер открыл некоторые важные детали в жизненном цикле фага. Хотя ДНК вируса phi X 174 состоит из одной кольцевой цепочки, Синшаймер обнаружил, что немедленно после заражения хозяина ферменты бактерии превращают кольцевую ДНК в привычную линейную двойную спираль. Это открытие высветило проблему, с которой столкнулся Корнберг при попытках сделать копию вирусного генома: хотя ДНК-полимераза может скопировать весь геном phi X 174 (5386 пар оснований) в линейной форме, она не может создать инфекционную кольцевую форму. Мы все знаем, как превратить линию в окружность, но сделать это на молекулярном уровне полвека назад было для ученых не так просто.

Природа, конечно, превзошла мастерство, и несколько групп ученых, включая команду Корнберга, стали искать бактериальный фермент, который мог бы соединить два конца линейной двухцепочечной ДНК, чтобы превратить ее в замкнутую окружность, наподобие молекулярного уробороса. Этот поиск завершился в 1967 году, когда пять групп открыли ДНК-лигазу – фермент, который мог замкнуть ДНК в колечко. К концу года Корнберг использовал ДНК-лигазу для соединения концов ДНК phi X 174, скопированной ДНК-полимеразой. Воспроизведенная ДНК теперь могла заразить бактерию. Вот так Корнберг преуспел в копировании генома phi X 174, закольцевав его, использовав ферментативно скопированную ДНК для заражения E. coli и продуцирования множества копий этого вируса.

Он, конечно, знал в общих чертах свой объект, но не знал состава генома phi X 174 – последовательности ДНК. Корнберг понял, что он «оживил», лишь спустя десять лет, в 1977 году, когда группа Фреда Сэнгера использовала ДНК-полимеразу в своем новом методе секвенирования, применив ее к геному phi X 174. Тем не менее работа Корнберга стала сенсацией. 14 декабря 1967 года Стэнфордский университет организовал пресс-конференцию Корнберга, приурочив ее к публикации его статьи в журнале Proceedings of the National Academy of Sciences. Организаторы попросили журналистов не называть его достижение «синтетической жизнью», поскольку вирусы – не живые существа; они могут размножаться только при помощи других организмов. Но, как оказалось, предупредили не всех.

В тот же день президент Линдон Джонсон должен был произнести речь в Смитсонианском институте на праздновании двухсотлетия Encyclopaedia Britannica{104}, и его спичрайтер попросил Стэнфорд дать ему абзац про работу над ДНК. Просьба была выполнена, но когда Джонсон начал читать подготовленную речь, он резко отложил ее в сторону и не смог сдержать волнения, рассказывая аудитории о новостях, которые вот-вот должны были появиться в газетных шапках:

Это будет одна из самых важных историй, которые когда-либо читали вы, или ваш папа, или ваш дедушка… Эти люди открыли фундаментальный секрет жизни. Это потрясающее достижение. Оно широко распахивает двери к новым открытиям в борьбе с болезнями, в строительстве намного более здоровой жизни для всех людей. Это может быть первым шагом – как говорят эти великие гении из лаборатории – к контролю над некоторыми видами рака в будущем.

Президент также рассмотрел ситуацию, когда государство может «учреждать жизнь», обладая властью, которую раньше считали прерогативой природы или даже бога: «Это, наверное, станет одной из великих проблем – и одним из важнейших решений. Те решения, что принимает нынешний президент, – это детский сад по сравнению с теми, которые предстоят будущему президенту». После такой речи неудивительно, что заголовки газет по всему миру провозгласили рождение первой синтетической жизни{105}.

Мне посчастливилось ознакомиться с приведенным выше пассажем о «тайне жизни» на десятки лет позже – в 2010 году, когда мы объявили о первой синтетической клетке и научный журналист Джо Палка готовил интервью со мной для Национального общественного радио. (История, которую президент приветствовал как самую важную на поколения вперед, прошла мимо меня – в дни, когда это было главной новостью, я служил санитаром во флотском госпитале в Дананге, во Вьетнаме.) Я подумал, что эта забавная история – восхитительная находка, прекрасно иллюстрирующая как преемственность научного мышления – в данном случае в деле полного понимания жизни путем ее воссоздания, – так и неизбежные трудности донесения до публики действительно волнующих научных результатов без преувеличения и срыва в рекламу. Я когда-то знал Корнберга через руководителя моей диссертации Натана (Нэйта) Каплана. Я задумался: что сделал бы Корнберг, будь в его распоряжении те замечательные возможности геномики, что последовали за его ранними экспериментами?

Опыты с воссозданием ДНК-вирусов на матрице оригинального вирусного генома позже были распространены на более примитивные РНК-вирусы, такие как вирус полиомиелита, и на ретровирусы – такие как ВИЧ. У последних носителем наследственности тоже служит РНК, но они дублируют ее в геном клетки-хозяина с помощью фермента, переписывающего РНК на ДНК. Открытие этого фермента – обратной транскриптазы – в 1970 году стало результатом исследования опухолеродных РНК-вирусов и сильно поколебало центральную догму «ДНК→РНК→белок». За независимое открытие обратной транскриптазы Ховард Мартин Темин из Университета Висконсина в Мэдисоне и Дэвид Балтимор из Массачусетского технологического института (МТИ) поделили Нобелевскую премию 1975 года по физиологии и медицине.

Среди РНК-вирусов есть и бактериофаги; один из них, фаг Qβ (Ку-бета), был первым вирусом, воссозданным в лаборатории с помощью обратной транскриптазы. Этот опыт был кульминацией замечательной работы швейцарского молекулярного биолога Чарльза Вайссмана, который, вероятно, больше известен своими исследованиями прионов в Цюрихском университете и получением белка интерферона с применением технологии рекомбинантной ДНК в 1980 году, через несколько лет после основания первой биотехнологической компании Genentech{106}. Ранние новаторские попытки Вайссмана и Мартина Биллетера секвенировать РНК в 1969 году{107} воодушевят Фреда Сэнгера{108}. Позже, работая с Ричардом Флоуэллом, Вайссман в 1974 году проложит путь к тому, что сегодня называют «обратной генетикой»: изучению того, как влияют на организм те или иные изменения генетического текста (в противоположность классической генетике, где выявляют мутантный организм, а затем прослеживают ответственную за это мутацию в ДНК).

В том же 1974 году начался и прогресс в копировании РНК-вирусов, когда Вайссману и Тадацугу Танигучи удалось получить комплементарную двухцепочечную ДНК-копию (кДНК) с РНК фага Qβ, которую потом они вставили в плазмиду-переносчик. К «удивлению и радости» Вайссмана, плазмида, внедренная в E. coli, дала потомство из заразных Qβ-фагов. Такое удалось проделать впервые{109}. Возможность делать вирусную кДНК позволила бы проводить генетические манипуляции, которые нельзя выполнить на уровне РНК, то есть применять к РНК-вирусам технологию рекомбинантной ДНК. Несколько лет спустя Винсент Раканьелло и Дэвид Балтимор повторили этот эксперимент в МТИ, используя очищенную РНК вируса полиомиелита и человеческие раковые клетки: они тоже получили аутентичные вирусные частицы{110}. Со времени этой работы были опубликованы генетические тексты вирусов почти из каждого вирусного семейства, в том числе вирусов гепатита С{111}, бешенства, гриппа А, кори, Эболы, респираторного синцитиального вируса, буньявируса и вируса гриппа, вызвавшего пандемию 1918 года{112}.

Обратная транскриптаза и ДНК-полимераза внесли вклад и в улучшение методов чтения генетических текстов. Обратная транскриптаза обычно используется для создания кДНК из мРНК, что позволяет секвенировать ДНК работающих (экспрессирующихся) генов. Это тот же метод, что я использовал в своем подходе «экспрессированных меток сиквенса» (EST). От phi X 174 Сэнгера через H. influenzae и до человеческого генома ДНК-полимераза играла ключевую роль в секвенировании ДНК. Чтобы прочитать три миллиарда оснований человеческого генома, моя группа разработала «полногеномное секвенирование методом дробления», основанное на разбивке генома на мелкие кусочки, которые легко прочитать машинами для секвенирования ДНК. В 1999 году, чтобы прочесть двадцать пять миллионов таких отдельных «строчек» и собрать из них полный геном человека, потребовалось девять месяцев. Сегодня, после появления ряда новых технологий, чтение ДНК так продвинулось, что позволяет на одном настольном приборчике сделать сиквенс человеческого генома за один день.

После завершения секвенирования человеческого генома в компании Celera я вновь обратился к проблеме генетического «прожиточного минимума» и дальнейшей работе над синтетическими геномами. Хэм Смит оставил Celera, чтобы примкнуть ко мне. Для финансирования этих работ мы вдвоем подали заявку на большой грант в министерство энергетики США (МЭ). Оно ведет крупную программу «Геномы для жизни», выросшую из их работ по человеческому геному. Еще раньше МЭ финансировало полное секвенирование моей командой некоторых первых геномов, в том числе M. genitalium и Methanococcus jannaschii. В итоге МЭ предоставило нам пятилетний грант с ежегодным бюджетом в 5 миллионов долларов – хорошее начало, сделавшее для нас возможной разработку двух новых областей, у которых, как мы считали, были потрясающие перспективы.

Первая радикально расширяла мою раннюю работу по секвенированию геномов, которая потом стала называться метагеномикой. Вместо сосредоточения на конкретных видах мы стали искать, как получить генетический «моментальный снимок» всего микробиологического разнообразия в такой среде, как океан или человеческий кишечник. Многие мои коллеги сомневались, что секвенирование дроблением всех организмов в образце морской воды сработает, потому что мы имеем дело с супом из множества разных видов. Скептицизм навевало то, что необходимо было одновременно секвенировать тысячи геномов, присутствующих в образце, а затем с помощью компьютера «перекоммутировать» фрагменты, стыкуя один с другим только те, что относятся к одному геному (как мы делали это с человеческим геномом). Но я был уверен, что нуклеотидная последовательность достаточно уникальна для каждого вида, чтобы можно было восстановить ее в компьютере из сложной смеси фрагментов разнородных последовательностей.

Как оказалось, мой новый метод секвенирования «дроблением среды» был весьма успешным. Мы начали с образцов воды из Саргассова моря вокруг Бермудских островов, которое в то время многими считалось «океанской пустыней» из-за нехватки доступных питательных веществ. В этом «пустом» море мы только в одном образце нашли более 1,2 млн ранее неизвестных генов и как минимум 1800 видов{113}. Бедная питательными веществами морская вода была полна жизни, потому что энергию организмы получали напрямую из солнечного света. Мы обнаружили, что фотосинтезировали не только растения: почти каждый микроорганизм в верхних слоях океана имеет светочувствительный белок – фоторецептор родопсин, очень похожий на тот, что работает в наших глазах. За последние шесть лет нашей работы в составе экспедиции Sorcerer II, отбиравшей образцы через каждые двести миль и покрывшей за эти годы больше шестидесяти тысяч миль по морю, мы обнаружили более восьмидесяти миллионов генов. То, что раньше считалось одним видом, теперь оказалось совокупностью тысяч близкородственных организмов. На основании множества работ мы прикинули, что в океане примерно 1030 одноклеточных организмов и 1031 вирусов. Это значит, что на каждого человека на планете приходится по миллиарду триллионов организмов.

Второе направление исследований, профинансированное МЭ, позволило нам начать с начала путь к тому, чтобы впервые создать синтетическую жизнь. Клайд Хатчинсон на основании своей ранней работы с Робертом Синшаймером и Фредом Сэнгером предложил в качестве тестового проекта бактериофаг phi X 174. Это был заманчивый объект по целому ряду причин. Геном бактериофага маленький, phi X 174 не выдержит много генетических изменений, так что это сразу будет проверкой на точность синтеза. И к тому же об этом вирусе очень много информации – благодаря усилиям Корнберга, Сэнгера и, конечно, Синшаймера, вдохновленного на изучение фагов Максом Дельбрюком и выбравшего, понятное дело, один из самых маленьких, какой сумел найти{114}.

Чтобы проверить простую методику синтеза, мы в 1997 году предприняли первую попытку синтезировать геном phi X 174 из набора перекрывающихся олигонуклеотидов в 50 пар оснований каждый, с последующей полимеразной цепной реакцией, чтобы сделать копии генома. Сначала нам показалось, что эксперимент удался. В записях лаборатории Клайда Хатчинсона значится, что 22 апреля мы получили молекулы ДНК, размер которых соответствовал целому геному phi X 174. Ключевой вопрос: был ли синтез достаточно точным, чтобы получить вирус? Мы собирались попытаться заразить синтетической ДНК клетки E. coli. Если ДНК не содержит летальных ошибок, то бактерия начнет производить специфические вирусные белки, которые будут самособираться в новые копии вируса phi X. Увы, наш синтетический геном не оказал вообще никакого действия. Мы знали, что синтез ДНК подвержен ошибкам, но надеялись, что путем отбора в ходе заражения на миллион цепочек ДНК найдется хотя бы одна с правильной последовательностью. Эта надежда разбилась, когда до нас дошел смысл этой неудачи. Точный синтез ДНК даже маленького вируса оказался задачей, требующей куда больше труда и умения, чем мы себе представляли. Что же говорить о более масштабной затее – создать полный бактериальный геном для получения живой клетки! Мы всей командой разрабатывали стратегию, как нам продвигаться дальше, и взвешивали, достижима ли вообще наша цель – синтетическая жизнь. Однако эти критические обсуждения были на несколько лет отодвинуты возможностью секвенировать человеческий геном. А уж когда мы на гребне нашего успеха с секвенированием человеческого генома вернулись к проблеме синтетического генома, мы уже были обречены на удачу.

Наши ранние попытки за несколько лет до того синтезировать phi X 174 провалились, очевидно, из-за ошибок, которые неизбежны при синтезе олигонуклеотидов. Если бы автоматические синтезаторы ДНК были способны производить чистые, свободные от ошибок, олигомеры заданной последовательности, сборка длинных двухцепочечных молекул ДНК была бы относительно простым делом. Но в реальности лишь около половины синтезированных молекул имеют правильную длину цепочки; остальные молекулы по большей части усеченные. Обычной причиной того, что они короче, чем ожидалось, становилось то, что в синтезаторе попадалось основание, которое не встраивалось; это назвали проблемой N-1. Эти неправильные молекулы или останавливали сборку олигонуклеотидов, или на выходе получалась ДНК с ошибками.

Мы проделали простые вычисления, чтобы иметь представление, почему опыт не удался. Поскольку в среднем только одна из двух молекул, использованных для сборки ДНК фага, была правильной, то стало совершенно – и безнадежно – ясно, почему наша давняя сборка не удалась. При случайном выборе 130 неочищенных олигонуклеотидов вероятность того, что цепочка генома нашего phi X собралась бы правильно, была одна вторая в 130 степени: (1/2)130, или 10–39, – исчезающе малая величина. Мы посчитали, что еще до отбора на заразность нужно снизить долю неправильных олигонуклеотидов до менее чем 10 % от всей популяции – только тогда мы могли рассчитывать на шанс создать достаточно много правильных молекул.



Поделиться книгой:

На главную
Назад