Глава 2. Когда темная материя становится совсем темной
Ученых поразило, что такая огромная доля генома не кодирует никаких белков. Однако больше всего их удивило не само это явление, а его размах. Специалисты уже много лет знали о существовании участков ДНК, не кодирующих белки. Собственно, это стало одним из первых больших сюрпризов после открытия структуры ДНК. Однако тогда вряд ли кто-нибудь представлял, какими важными окажутся эти области ДНК, и вряд ли кто-нибудь ожидал, что они помогут объяснить причины некоторых генетических заболеваний.
Сейчас не помешает чуть подробнее вглядеться в строительные блоки нашего генома. Напомним, ДНК — своего рода алфавит, к тому же весьма простой. В нем всего четыре буквы — А, Г, Т и Ц (аденин, гуанин, тимин и цитозин). Их называют нуклеотидными основаниями. Этот простенький алфавит несет в себе невероятное количество информации. Человек наследует 3 миллиарда оснований, составляющих наш генетический код, от матери, и аналогичный набор оснований от отца. Представьте себе ДНК как веревочную лестницу, где каждая ступенька — нуклеотидное основание, причем между соседними ступеньками 25 сантиметров. Такая лестница протянулась бы на 75 миллионов километров, то есть приблизительно от Земли до Марса (впрочем, тут многое зависит от того, где эти планеты будут располагаться на своих орбитах в тот момент, когда мы протянем эту воображаемую лестницу).
Еще одно сравнение. Полный корпус произведений Шекспира содержит в себе, по уверениям специалистов, 3 миллиона 695 тысяч 990 букв1. Представим себе, что все это собрали в один толстенный том. Мы наследуем от матери текст объемом чуть больше 811 таких книг. И столько же — от отца. Это, прямо скажем, немалый объем информации.
Если продолжать аналогию с алфавитом, можно заметить, что алфавит ДНК кодирует лишь трехбуквенные слова. Каждое такое слово соответствует определенной аминокислоте — строительному блоку, из которых конструируются белки. Ген можно представить себе как предложение из таких трехбуквенных слов. Такая фраза кодирует последовательность аминокислот, из которых слагается тот или иной белок. (См. рис. 2.1.)
Рис. 2.1. Связь между геном и белком. Каждая трехбуквенная последовательность в гене кодирует один строительный блок соответствующего белка.
В каждой клетке обычно содержится по две копии каждого гена. Одну копию мы наследуем от матери, одну — от отца. Но хотя в клетке лишь две копии каждого гена, она способна создавать тысячи и тысячи белковых молекул, кодируемых тем или иным геном.
Как клетке это удается? В процесс экспрессии генов встроено два механизма амплификации (увеличения числа копий). Последовательность нуклеотидных оснований в ДНК не служит непосредственным шаблоном для создания белка. Клетка создает копии гена. Эти копии очень похожи на исходный ген ДНК, однако не идентичны ему. Они слегка отличаются от него по химическому составу. Их называют РНК (рибонуклеиновая кислота, тогда как ДНК — дезоксирибонуклеиновая кислота). Еще одно отличие: у РНК вместо основания Т (тимин) — основание У (урацил). ДНК состоит из двух нитей, соединенных парами оснований. Чем-то это похоже на железнодорожные пути. Рельсы удерживаются вместе благодаря тому, что нуклеотидное основание одного рельса связывается с основанием другого, как если бы основания пожимали друг другу руки. Такие рукопожатия подчиняются определенным правилам. Т пожимает руку только А, а Ц — лишь Г. Благодаря этому распределению связей ученые часто описывают ДНК как совокупность нуклеотидных пар. РНК — однонитевая молекула («монорельс»)[2]. Главные отличия между ДНК и РНК показаны на рис. 2.2. Клетка способна быстро сделать тысячи РНК-копий гена ДНК, и это — первая амплификационная стадия экспрессии гена.
Рис. 2.2.
РНК-копии гена уносятся от ДНК в другую часть клетки — цитоплазму. В этой клеточной области молекулы РНК действуют как своего рода шаблоны (матрицы) для аминокислот, которые образуют белок. Каждая молекула РНК может много раз выступать в роли такого шаблона, что и представляет собой вторую стадию амплификации при экспрессии гена. (См. рис. 2.3.)
Можно прибегнуть к аналогии с узором для вязания, которую мы уже использовали в первой главе. Ген ДНК — исходный узор на листе бумаги. Этот узор можно много раз ксерокопировать (сравните с производством РНК). Полученные копии можно послать множеству вязальщиц, каждая из которых может много раз воспроизвести один и тот же узор (сравните с синтезом белка). Простая, но эффективная модель. Такая молекула РНК действует как своего рода посланец. Она несет информацию о генетической последовательности от ДНК к «сборочному цеху», где синтезируются белки. Поэтому она и называется информационной РНК (другое название — матричная РНК).
Рис. 2.3. Единичная копия гена ДНК в ядре клетки используется как шаблон для создания множества копий молекулы информационной РНК. Эти молекулы РНК выводятся за пределы ядра. Затем каждая может играть роль инструкции для производства белка. Каждая молекула информационной РНК способна создавать множество копий одного и того же белка. Таким образом, при создании белка на основе кода ДНК имеют место две стадии амплификации. Для простоты картины здесь показана лишь одна копия данного гена, хотя обычно в клетке их две — по одной от каждого из родителей.
Отсекая бессмыслицу
Вам может показаться, что все это — довольно простые процессы. Однако некоторое время назад ученые обнаружили, что здесь есть некая странность. Большинство генов состоит из фрагментов, которые кодируют аминокислоты белков, и каких-то «лишних» кусков, которые ничего такого не кодируют. Эти куски — словно бессмыслица, вклинившаяся в строй понятных слов. Фрагменты бессмысленного генетического текста назвали интронами.
Когда клетка производит РНК, она вначале копирует все ДНК-буквы гена, в том числе и те его куски, которые не кодируют никаких аминокислот. Но затем клетка удаляет эти некодирующие куски, так что в конечном счете получается информационная РНК, представляющая собой удобную инструкцию для синтеза нужного белка. Этот процесс называется сплайсингом («сращиванием»). Он упрощенно показан на рис. 2.4.
Рис. 2.4.
Как показано на рис. 2.4, белок кодируется модульными блоками информации, что дает клетке массу возможностей по-разному обрабатывать РНК (такая обработка называется процессингом РНК). Клетка может по-разному соединять модули, полученные от молекулы информационной РНК, тем самым создавая целый ряд информационных молекул, кодирующих родственные друг другу, но не идентичные белки. Схематически это показано на рис. 2.5.
Куски бессмысленного текста между участками гена, кодирующими аминокислоты, вначале считали просто какой-то чепухой, ненужным хламом. Отсюда и возникло пренебрежительное название «мусорная ДНК». Такие фрагменты обычно отметали как незначащие. Как уже подчеркивалось, мы будем использовать термин «мусорная ДНК» для обозначения любых фрагментов ДНК, не кодирующих белки.
Рис. 2.5. Молекула РНК может обрабатываться различными путями. В результате могут соединяться друг с другом разные участки, кодирующие аминокислоты[3]. Это позволяет синтезировать на основе одного исходного гена ДНК различные версии белковой молекулы.
Однако теперь-то нам известно, что такие фрагменты могут иметь очень большое значение. Атаксия Фридрейха, заболевание, которое мы описывали в главе 1, вызывается ненормально большим количеством повторов последовательности ГАА в одной из «мусорных» областей ДНК, находящейся между двумя фрагментами, честно кодирующими аминокислоты. Отсюда и возник вполне разумный вопрос: если мутация не затрагивает последовательности, отвечающие за синтез аминокислот, почему же люди, у которых наблюдается такая мутация, страдают от столь разрушительных симптомов?
При атаксии Фридрейха мутация определенного гена происходит в мусорной области между двумя участками, кодирующими аминокислоты. (На рис. 2.5 это была бы область между Б и Л.) В нормальном состоянии такой ген содержит от 5 до 30 повторов ГАА, а у мутантного гена от 70 до 1000 повторяющихся мотивов ГАА2. Исследователи показали: когда число повторов так сильно превышает норму, клетка перестает вырабатывать информационную РНК, кодируемую данным геном. А поскольку клетки теряют способность производить информационную РНК, они не могут делать и белок. Если вы не рассылаете вязальщицам узоры, солдаты не получают теплых носков.
Собственно, в таких случаях клетки не производят даже длинную, необработанную РНК-копию гена3. Зона избыточного повтора ГАА действует как своего рода «клейкая» область, которая препятствует нормальному копированию ДНК. Сравните с попыткой ксерокопировать 50-страничный документ, в котором страницы 4-12 склеены вместе. Аппарат просто не сможет нормально обработать эти страницы, и весь процесс копирования документа застопорится. В случае гена атаксии Фридрейха невозможность копирования означает, что не будет РНК, а значит, не будет и белка.
Пока не до конца ясно, почему нехватка белка, кодируемого данным геном, приводит к симптомам данной болезни. Похоже, этот белок участвует в процессах, которые мешают избыточному накоплению железа в частях клетки, вырабатывающих энергию4. Когда клетке не удается синтезировать соответствующий белок, уровень содержания железа повышается до токсичных значений. По-видимому, некоторые типы клеток более чувствительны к уровню содержания железа. К ним относятся и те, которых затрагивает эта болезнь.
Родственный предыдущему, но все же иной механизм лежит в основе синдрома ломкой X-хромосомы — формы неспособности к обучению (умственной отсталости), с которой мы сталкивались в главе 1. Мутация при синдроме ломкой X-хромосомы — увеличение числа повторов последовательности ЦЦГ. Тут многое напоминает мутацию при атаксии Фридрейха: в нормальной хромосоме число копий этой последовательности обычно от 15 до 65. Но у хромосомы, которая несет в себе мутацию, характеризующую синдром ломкой X-хромосомы, число копий — от примерно 200 до нескольких тысяч5,6. Однако при синдроме ломкой X-хромосомы зона увеличенного числа повторов располагается в иной части гена по сравнению с атаксией Фридрейха — перед первым участком, кодирующим аминокислоты: на рис. 2.5 это соответствует мусорной области слева от блока, обозначенного буквой Б. Когда число «мусорных» повторов становится очень большим, информационная РНК не производится, а значит, на основе данного гена не синтезируется белок7.
Функция этого белка состоит в том, чтобы разносить по клетке множество различных молекул РНК. Он доставляет их в нужные места, тем самым влияя на то, как эти РНК будут обрабатываться и как они будут синтезировать белки. Без данного белка другие молекулы РНК не регулируются должным образом. В результате нарушается нормальное функционирование клетки8. По неясным пока причинам нейроны мозга, похоже, особенно чувствительны к такому эффекту. Вот почему при этом заболевании ухудшается обучаемость.
Приведем очередную бытовую аналогию. В Великобритании сравнительно небольшое количество выпавшего снега может парализовать транспортные сети. Снег покрывает шоссе и железнодорожные пути, мешая двигаться автомобилям и поездам. Когда такое происходит, люди не в состоянии вовремя добраться до места работы, что создает всевозможные проблемы. Школы не открываются, товары не доставляются в срок, банки не выдают нужное количество наличности и т.п. Одно исходное событие — снегопад — порождает многообразные последствия, поскольку нарушает работу транспортных систем человеческого общества. Что-то подобное происходит и при синдроме ломкой X-хромосомы. Подобно снегу на автострадах и рельсах, мутация нарушает работу транспортных систем человеческой клетки, что приводит к множеству последствий: наблюдается своего рода «эффект домино».
«Отключение» экспрессии определенного гена — ключевая стадия в патологии атаксии Фридрейха и синдрома ломкой X-хромосомы. Подтверждения этой гипотезы удалось найти, исследуя некоторые крайне редкие проявления обоих заболеваний. У очень небольшого числа пациентов участки мусорных повторов имеют тот же малый размер, что и у большинства здоровых людей. У таких пациентов наблюдаются мутации, меняющие порядок следования участков, кодирующих аминокислоты. Такие изменения аминокислотной последовательности не позволяют клетке вырабатывать белок. Иными словами, неважно, почему белок не экспрессируется, — в любом случае у пациентов наблюдаются симптомы болезни.
И как только вы обзавелись красивой теорией...
Может показаться, что у нас вырисовывается удобный и прямой путь для дальнейших исследований. Можно рассуждать так: эти расширения в мусорных областях важны лишь из-за того, что они создают аномальную ДНК. С этой ДНК клетка обращается неправильно. Результат — нехватка определенных важных белков. Можно предположить, что обычно эти мусорные области не играют особой роли в клетке.
Однако этому выводу кое-что противоречит. «Нормальный» диапазон количества повторов в генах синдрома ломкой X-хромосомы и атаксии Фридрейха обнаруживается по всему миру. Более того, он сохраняется на всем протяжении эволюции человека (является «консервативным»). Если эти области не наделены никаким смыслом, следовало бы ожидать, что со временем они будут случайным образом меняться. Однако такого не происходит. Остается предположить, что эти «нормальные» повторы имеют какую-то функцию.
Но подлинная жемчужина в этой генетической раковине связана с миотонической дистрофией, заболеванием, которое мы описывали в главе 1. Количество повторов при миотонической дистрофии растет по мере того, как недуг передается от поколения к поколению. Родительская хромосома может содержать последовательность ЦТГ, повторенную 100 раз подряд. Но в хромосоме ребенка последовательность ЦТГ может повторяться уже 500 раз подряд! По мере увеличения числа повторов последовательности ЦТГ заболевание становится все острее. Такого бы не происходило, если бы вредоносный рост числа повторов просто отключал близлежащий ген. Все клетки страдающего миотонической дистрофией содержат по две копии данного гена. В одной копии нормальное число повторов, в другой — увеличенное. А значит, одна копия гена должна всегда вырабатывать нормальное количество соответствующего белка. Следовательно, общий уровень выработки белка может упасть максимум на 50%.
Можно выдвинуть такую гипотезу. По мере того, как количество повторов увеличивается, все сильнее падает экспрессия мутантной версии гена. Это могло бы привести к постепенному уменьшению общего количества вырабатываемого белка — от падения на 1% для сравнительно небольшого роста числа повторов до 50%-ного (максимального) падения для значительного роста этого числа. Это, в свою очередь, могло бы привести к различным симптомам. Проблема в том, что других наследуемых генетических заболеваний такого же типа в общем-то нет. Мы просто не наблюдаем никаких других болезней, где весьма незначительные изменения экспрессии генов приводят к такому сильному эффекту (все, у кого число повторов превысило критический уровень, демонстрируют симптомы болезни), причем между пациентами наблюдается весьма тонкая градация симптомов (они становятся более серьезными по мере роста числа повторов).
Имеет смысл посмотреть, где именно в гене миотонической дистрофии происходит этот рост числа повторов. Оказывается, на правом краю, за последней областью, кодирующей аминокислоты. На рис. 2.5 это соответствует горизонтальной линии после прямоугольника с буквой Ь. Получается, всю область, кодирующую аминокислоты, можно скопировать в РНК еще до того, как копирующая аппаратура клетки встретится с вредоносной зоной повторов («расширением», «зоной экспансии»).
Теперь уже очевидно, что эта зона повторов сама копируется в РНК. Зона сохраняется, даже когда длинную РНК обрабатывают для создания из нее информационной РНК. При миотонической дистрофии информационная РНК делает нечто необычное. Она связывает множество белковых молекул, которые имеются в клетке. Чем больше повторов, тем больше белковых молекул связывается. Мутантная информационная РНК при миотонической дистрофии действует как губка, собирающая все больше таких белков. Белки, которые связываются с расширением информационной РНК при миотонической дистрофии, обычно участвуют в процессах регуляции многих других информационных РНК. Они влияют на эффективность доставки молекул информационной РНК в нужные места клетки, а также на то, долго ли эти молекулы информационной РНК просуществуют в клетке и насколько эффективно они будут кодировать белки. Но все эти регуляторы связывает расширение информационной РНК, создаваемой на основе гена миотонической дистрофии, так что они уже не могут выполнять свою обычную работу9. Этот процесс схематически показан на рис. 2.6.
Рис. 2.6.
Вот еще одна аналогия. Представьте себе большой город, где каждый полицейский вынужден подавлять массовые выступления на каком-то участке. Тогда не останется сотрудников охраны правопорядка для выполнения обычных полицейских функций. То-то раздолье взломщикам и угонщикам. Похожая история происходит в клетках тех, кто страдает от мутации гена миотонической дистрофии. В этом гене нарастает количество повторов последовательности ЦТГ, что в конечном счете приводит к неправильной регуляции прочих генов клетки.
Дело в том, что зона повторов, увеличиваясь, связывает все большее количество белков. Поэтому нарушается функционирование все большего количества информационной РНК, что затрагивает все больше функций клетки. В конечном счете это приводит к развитию широкого диапазона симптомов у тех, кто страдает генетической мутацией, характерной для миотонической дистрофии. Вот вам и объяснение того, почему пациенты с большим числом повторов страдают от самых разных и серьезных клинических проблем.
Как мы уже видели в случаях атаксии Фридрейха и синдрома ломкой X-хромосомы, нормальные повторяющиеся последовательности (для гена миотонической дистрофии — последовательности триплета ЦТГ) впечатляющим образом сохранялись на протяжении всей эволюции человека. Это еще одно подтверждение того, что они играют важную роль в поддержании здорового состояния и нормального функционирования организма. Для гена миотонической дистрофии подтверждение еще более убедительное — благодаря тем белкам, которые связываются с зоной повторов в информационной РНК. Эти белки также связываются с зонами повторов меньшего размера — как раз такого, которым характеризуются нормальные гены. Просто в зонах меньшего размера не так много таких связываний, как при увеличенном количестве повторов.
Из примера с миотонической дистрофией ясно, что есть какая-то причина, объясняющая, почему молекулы информационной РНК содержат области, не кодирующие белки. Такие области играют важнейшую роль при регулировании того, каким образом информационные РНК используются клетками. Эти области сами как бы создают еще один уровень контроля, осуществляя тонкую настройку количества белков, которые будут вырабатываться на основе генетической матрицы ДНК. Мутацию, приводящую к миотонической дистрофии, идентифицировали почти за десятилетие до публикации генома человека. Тогда никто не ожидал, какой невероятно сложной и изменчивой окажется эта тонкая настройка.
Глава 3. Куда ушли все гены?
26 июня 2001 года было объявлено о завершении первоначального черновика расшифровки человеческого генома. В феврале 2001 года вышли первые статьи, где описывалась эта «черновая» последовательность. Это стало кульминацией долгих лет работы, технологических прорывов, научного соперничества. В основном исследование финансировали американские Национальные институты здравоохранения и британский
Сообщение о том, что человеческий геном наконец расшифрован (пусть и пока начерно), вызвало огромный шум. Наиболее яркое заявление сделал, пожалуй, тогдашний президент США Билл Клинтон: «Сегодня мы изучаем язык, при помощи которого Бог сотворил жизнь»3. Можно лишь догадываться, что почувствовали некоторые ведущие участники проекта, когда политик заговорил о божественном в эту минуту технологического триумфа. К счастью, ученые обычно отличаются скромностью и застенчивостью, особенно перед телекамерами и в беседах со знаменитостями, так что мало кто выразил по этому поводу громкое недовольство.
Руководителем
Возможно, другие открытия по своему значению не менее важны, чем результаты проекта «Геном человека». На ум сразу же приходят огонь, колесо, число 0, алфавит. Не исключено, что у вас есть на примете и другие открытия. Кое-кто может также заметить, что расшифровка человеческого генома пока еще не выполнила всех своих обещаний, особенно касающихся борьбы с заболеваниями. (К примеру, Дэвид Сейнсбери, тогдашний министр науки Великобритании, заявлял: «Теперь мы обрели возможность достигнуть в медицине всего, на что мы только могли надеяться»5.)
Впрочем, большинство ученых уже тогда понимали, что подобные заявления следует воспринимать с изрядной долей скептицизма. Этому их научила история генетики. Возьмем, к примеру, два сравнительно хорошо известных генетических заболевания. Мышечная дистрофия Дюшенна — очень опасный недуг. Страдающие им мальчики постепенно теряют мышечную массу, физически деградируют, утрачивают подвижность и обычно умирают еще в подростковые годы. Муковисцидоз — генетическое заболевание, при котором легкие утрачивают способность очищаться от слизи. Страдающие этим недугом подвергаются большому риску заразиться острыми формами инфекций, угрожающих жизни. Хотя некоторые из больных муковисцидозом в наши дни все-таки доживают примерно до 40 лет, это происходит лишь благодаря интенсивной физиотерапии, ежедневно очищающей их легкие, и колоссальным дозам антибиотиков.
Ген, мутирующий при мышечной дистрофии Дюшенна, выявили в 1987 году, а ген, мутирующий при муковисцидозе, обнаружили в 1989-м. То, что мутации в этих генах являются причиной болезней, установили более чем за 10 лет до завершения расшифровки человеческого генома. Но даже сейчас, после более чем 20 лет усилий специалистов, эффективных методов лечения этих болезней по-прежнему не существует. Понятно, что неизбежен значительный временной разрыв между знанием генетической последовательности человека и созданием методик лечения, позволяющих спасать жизни больных. Особенно велик этот разрыв, когда причиной заболевания становится не один ген, а два и более, или же когда какие-то гены взаимодействуют со средой (а ведь для большинства недугов дело обстоит именно так).
Впрочем, не следует чересчур строго судить политиков за их громкие заявления. Ученые и сами подняли немалую шумиху вокруг своих открытий. Если вы требуете от спонсоров почти 3 миллиарда долларов, вам нужно придумать амбициозный план и разработать убедительную рекламную кампанию. Расшифровка человеческого генома — не самоцель. Однако тем не менее она является важным научным достижением. В сущности, это был инфраструктурный проект, предоставивший человечеству данные, без которых попросту не удалось бы поставить великое множество других вопросов.
Разумеется, геномная последовательность человека — не одна на всех. У разных людей она разная. В 2001 году секвенирование миллиона пар нуклеотидных оснований ДНК обходилось в неполных 5300 долларов. К апрелю 2013-го стоимость такой же процедуры упала до 6 центов. Иными словами, пожелай вы проделать секвенирование вашего собственного генома, в 2001 году вам обошлось бы это в 95 с лишним миллионов долларов, а сегодня с вас потребуют чуть меньше 6 тысяч долларов6. Более того, одна компания заявляет, что пришла эпоха тысячедолларовых геномов7. Поскольку стоимость секвенирования так резко упала, ученым теперь гораздо легче исследовать степень вариативности генома между различными людьми. Это дает целый ряд преимуществ. В наши дни специалисты получили возможность выявлять редкие мутации, которые вызывают опасные заболевания, но встречаются лишь у небольшого количества пациентов, зачастую — в генетически изолированных популяциях (например, в общинах амишей (аманитов)[5], проживающих в США8). Есть возможность секвенировать опухолевые клетки пациентов, чтобы выявить мутации, которые приводят к развитию раковых процессов. В некоторых случаях это позволяет создать специфические методики лечения для борьбы с конкретной формой онкологического заболевания конкретного пациента9. Исследования в области эволюции человека и миграции людей удалось значительно усовершенствовать именно благодаря анализу ДНК-последовательностей10.
Дорогой, я куда-то задевала гены
Но тогда, в 2001 году, все это оставалось делом будущего. Пытаясь абстрагироваться от поднявшейся шумихи, ученые размышляли над расшифрованным человеческим геномом и задались простым вопросом: что же делает нас особенными, непохожими на других живых существ? Человек — наиболее сложно устроенный вид из всех обитателей Земли. Никакой другой вид не строит города, не создает произведения искусства, не выращивает злаки, не играет в настольный теннис. Философы могут спорить, делают ли нас такие занятия «лучше» других видов. Но уже сам факт того, что мы способны вести такие споры, указывает на то, что мы устроены значительно сложнее других видов. В этом не может быть никаких сомнений.
В чем же состоит молекулярное объяснение нашей изощренности как организмов? Ученые уже довольно давно более или менее сошлись во мнении, что объяснение таится где-то в наших генах. Ожидалось, что у человека попросту
К тому времени, когда опубликовали черновую расшифровку человеческого генома, генетики уже завершили секвенирование для целого ряда других организмов. Разумеется, поначалу они сосредоточились на более простых (и меньших по размеру) геномах по сравнению с человеческим. К 2001 году удалось секвенировать геномы сотен вирусов, десятков бактерий, двух простых видов животных, одного гриба и одного растения. Ученые использовали эти данные, чтобы оценить, сколько генов содержится в человеческом геноме. (Для этой оценки применялся и целый ряд других экспериментальных методик и подходов.) Оценки варьировались от «30 тысяч» до «120 тысяч» — среди специалистов царила известная неуверенность касательно данного вопроса. В прессе часто циркулировала цифра «100 тысяч», хотя и эта оценка изначально не считалась определенной. Похоже, большинство исследователей считали разумной величину примерно в 40 тысяч.
Но когда в феврале 2001 года обнародовали черновую расшифровку генома человека, ученые не смогли найти в ней и 40 тысяч генов, кодирующих белки, не говоря уж о 100 тысячах. Исследователи из
Может показаться странным, что ученые не пришли к единому мнению насчет количества генов, едва была опубликована черновая расшифровка генома. Причина — в том, что для идентификации генов необходимо анализировать данные о генетической последовательности, а это не так просто, как кажется. Гены не помечены разными цветами, они не используют особые наборы генетических букв, отличающие их от прочих частей генома. Чтобы выявить ген, кодирующий белок, нужно проанализировать определенные характеристики и объекты: скажем, те последовательности, которые могут кодировать цепочку аминокислот.
Как мы уже видели в главе 2, гены, кодирующие белки, не создаются из одной непрерывной ДНК-последовательности. Они конструируются модульным образом, причем области, кодирующие белки, перемежаются отрезками генетического мусора. Человеческие гены обычно гораздо длиннее генов фруктовых мушек-дрозофил или микроскопического червя
Отсюда возникает серьезная проблема: как отличить сигнал от шума, анализируя гены в генетических последовательностях человека? Даже в пределах одного-единственного гена лишь небольшой участок отвечает за кодирование белка. Этот участок окружен гигантской областью генетического мусора.
Вернемся к исходной проблеме. Почему человек является столь сложно устроенным организмом, если наши гены, кодирующие белки, так похожи на аналогичные гены мух и червей? Отчасти это объясняется сплайсингом — процессом, о котором мы упоминали в главе 2. Человеческие клетки способны создавать большее количество вариантов белков по сравнению с более простыми организмами. Более 60% генов человека умеют создавать такие сплайсинговые вариации. Снова обратимся к рис. 2.5. Клетка человека способна производить белки, обозначенные на этой схеме как БЛЕДНОСТЬ, БЕДНОСТЬ, ЛЕСТЬ, ЕНОТ, ЛЕС, ЛЕНОСТЬ. В различных тканях она вырабатывает эти белки в разных соотношениях. К примеру, белки, которые мы обозначаем как БЛЕДНОСТЬ, ДНО и ЛЕСТЬ, могут в больших количествах синтезироваться в мозгу, тогда как почки могут экспрессировать лишь БЛЕДНОСТЬ и ЛЕНОСТЬ, при этом вырабатывать в 20 раз больше белка ЛЕНОСТЬ, чем белка БЛЕДНОСТЬ. В более простых организмах клетки будут производить лишь БЛЕДНОСТЬ да БЕДНОСТЬ, причем в более или менее фиксированных соотношениях в различных клетках. Сплайсинговая гибкость позволяет человеческим клеткам вырабатывать гораздо более разнообразные белки по сравнению с более простыми организмами.
Ученые, анализировавшие геном человека, предполагали, что могут существовать специфичные для человека гены, кодирующие белки: эти-то гены, мол, и отвечают за сложность нашего устройства, так возвышающую нас над прочей живностью. В человеческом геноме насчитывается около 1300 семейств генов. Почти все эти семейства встречаются во всех ветвях древа жизни, от самых простых организмов до самых сложных. Существует набор из приблизительно ста генных семейств, специфичных для животных, имеющих хребет, но даже они возникли уже на ранних этапах эволюции позвоночных. Эти характерные для позвоночных семейства генов, как правило, участвуют в комплексных процессах: скажем, в работе элементов иммунной системы, запоминающих инфекцию; в изощренных мозговых связях; в тромбообразовании; в передаче сигналов между клетками.
Часть нашего генома, кодирующая белки, словно бы построена из конструктора «Лего» с несметным количеством деталей. Большинство таких наборов (особенно наборы для новичков, эти громадные коробки) содержат ряд строительных блоков, которые являются вариациями на немногочисленные темы: треугольники и квадратики, несколько наклонных элементов, а может быть, еще и несколько арок в придачу. Ну да, они бывают разного цвета, у них разные пропорции и разная толщина, но в целом они похожи. Между тем из них можно соорудить почти все основные структуры, от лесенки из двух блоков до целого жилого комплекса. Лишь когда вам нужно построить что-то совсем-совсем особенное, вроде Звезды Смерти, требуются какие-то весьма необычные элементы, выходящие за рамки стандартов обычного конструктора «Лего».
На протяжении эволюции геномы развивались, но строились из стандартного набора «деталей конструктора». Лишь иногда, крайне редко, они создавали что-то совершенно новое. Так что мы не можем объяснить сложность устройства человека, заявляя, что у нас много необычных генов, кодирующих белки и специфичных лишь для человека. Таких генов у нас, откровенно говоря, немного.
Картина еще больше запутывается, если сравнить размеры человеческого генома с размерами генома других организмов. Посмотрите на рис. 3.1. Легко видеть, что у человека геном гораздо больше, чем у
Рис. 3.1.
Эти данные убедительно показали, что геном человека содержит невероятно большое количество ДНК, не кодирующей белки. Собственно, 98% нашего генетического материала не выступает как матрица для создания этих важнейших молекул, которые, как считается, выполняют ключевые функции в клетке и организме в целом. Почему же в нас так много мусора?
Ядовитая рыба и генетические изоляторы
Возможно, это несущественный вопрос и ответ на него не так уж важен. Возможно, сам вопрос поставлен неверно. Возможно, генетический мусор не имеет ни функции, ни биологического значения. Возможно, вообще ошибочно полагать, что если нечто есть, то у него имеются какие-то причины находиться именно там, где оно располагается. Аппендикс человека в общем-то не служит ни для какой полезной цели, это просто рудиментарный орган, доставшийся нам от наших эволюционных предков. Некоторые ученые еще в 2001 году предполагали: то же самое может оказаться верным и для большей части мусорной ДНК человеческого генома.
Такие рассуждения частично основаны на наблюдениях за любопытной рыбой — иглобрюхом (она же — рыба-собака, она же — бурый скалозуб). Иглобрюхи — удивительные создания. Плавают они медленно и неуклюже, поэтому от хищников им не удрать. Встретившись с опасностью, они быстро набирают огромный объем воды и раздуваются в шар (у некоторых видов он даже покрыт колючками). Этого недостаточно для того, чтобы отпугнуть голодного врага? Ну что ж, у иглобрюха имеется токсин в тысячу раз мощнее цианида. Благодаря ему рыба приобрела свою сомнительную славу. В Японии она считается деликатесом (там эту рыбу называют фугу). Однако история этого деликатеса, мягко говоря, довольно противоречива: неправильное приготовление фугу может привести к летальным последствиям для едока.
Генетики с давних пор очень любят иглобрюха — или, во всяком случае, его ДНК. Геном у иглобрюха вида
Поскольку иглобрюх содержит очень мало мусорной ДНК, но при этом является отлично функционирующим и вообще преуспевающим существом, специалисты предположили, что некодирующие области человеческого генома могут быть «просто паразитическими, эгоистичными элементами ДНК, использующими геном в качестве удобного хозяина»13. Впрочем, одно из другого не следует с такой уж логической неизбежностью. Если нечто не имеет ясно различимой функции в каком-то определенном организме, это еще не значит, что оно не играет роли во всех прочих видах живых существ. Эволюция обычно ведет строительство, пользуясь довольно-таки ограниченным набором компонентов (вспомним конструктор «Лего»), а значит, она склонна наделять новыми функциями уже существующие объекты или их части. Таким образом, мусорная ДНК вполне может играть роль (роли) в других организмах, особенно в сравнительно сложных.
Следует также иметь в виду, что клетка, содержащая в себе так много мусорной ДНК, вынуждена расплачиваться за это в функциональном смысле. Каждый человек начинает свою жизнь как яйцеклетка, слившаяся со сперматозоидом. Исходная клетка делится на 2. Из этих 2 получаются 4. Далее процесс продолжается. Взрослый человек состоит примерно из 50-70 триллионов клеток. Такое огромное количество трудно себе представить. Попробуем применить такое сравнение. Стопка из 50 триллионов долларовых купюр, уложенных друг на друга, имела бы высоту, равную полутора расстояниям от Земли до Луны.
Для того, чтобы создать такое количество клеток, требуется минимум 46 циклов деления. Каждый раз, когда клетка делится, ей сначала нужно скопировать всю свою ДНК. Если важно лишь менее 2% всей ДНК, зачем же тогда эволюция поддерживает существование остальных 98%, ведь это, как мы предположили, просто бесполезный мусор, не выполняющий никаких функций? Как мы уже признали, самое убедительное доказательство эволюции видов заключается во всех тех бесполезных вещах, которые мы унаследовали от своих предков (возьмите тот же аппендикс). Однако использование гигантских ресурсов для постоянного воспроизводства 49 «бесполезных» пар нуклеотидных оснований на каждую пару, выполняющую какую-то функцию, кажется некоторым превышением необходимой избыточности.
Одна из первых теорий, пытавшихся объяснить, почему в человеческом геноме столько ДНК, возникла еще до того, как завершили черновую расшифровку генома человека. Ученые уже знали, что значительная часть нашего генома не кодирует белки. И выдвинули изоляционную теорию.
Допустим, у вас есть наручные часы. Не просто абы какие старые часы, а баснословно дорогая штуковина вроде винтажных
A. Маленькая каморка, где имеется лишь стол, на который вам и придется положить часы.
B. Большая комната, где лежит 50 рулонов листовой изоляции. Длина каждого рулона — 5 метров, толщина — 20 сантиметров. Вы можете спрятать часы в глубине любого из этих 50 рулонов.
Не так-то трудно сообразить, какое помещение выбрать, чтобы максимизировать вероятность того, что часы избегнут повреждений, правда? Изоляционная теория мусорной ДНК исходит из такой же предпосылки. Гены, кодирующие белки, чрезвычайно ценны. Они подвергаются высокому эволюционному давлению, так что у каждого конкретного организма его индивидуальная белковая последовательность обычно — оптимальная для него, самая лучшая, какая только может быть. Мутация в ДНК (изменение какой-то пары нуклеотидных оснований), меняющая, в свою очередь, белковую последовательность, вряд ли сделает этот белок эффективнее. Скорее уж такая мутация помешает белку выполнять свою функцию, воспрепятствует его действию — с печальными последствиями.
Проблема в том, что наш геном постоянно бомбардируют потенциально опасные раздражители из окружающей нас среды. Иногда нам кажется, что это — приметы нашего времени, особенно когда мы думаем о чернобыльской или фукусимской радиации. На самом деле это явление сопровождает человечество на всем протяжении его существования. Ультрафиолетовый компонент солнечного света, канцерогены в пище, радоновое излучение гранитных скал... Наша геномная целостность всегда находилась под угрозой (и находится до сих пор). Иногда такие воздействия не очень существенны. Если ультрафиолетовое облучение вызовет мутацию клетки кожи, а эта мутация приведет к гибели данной клетки, ничего страшного. У нас полно клеток кожи, они постоянно отмирают и заменяются новыми, и потеря одной клетки — не проблема.