нас останется для кодирования аминокислот? Ровно двадцать! — сказал Гамов с торжеством фокусника, вынимающего кролика из шляпы.
Эта остроумная идея была первой из многих, безжалостно опровергнутых фактами. Перекрывающиеся коды оказались невозможны из-за накладываемых ими самими ограничений. Во-первых, они предполагают, что некоторые аминокислоты в белках должны всегда стоять рядом. Но Фред Сэнгер, скромный гений, впоследствии получивший две Нобелевских премии (одну за метод прочтения последовательностей аминокислот в белках, другую — за метод прочтения букв в ДНК), занимался в то время выяснением последовательности аминокислот в молекуле инсулина. Вскоре он выяснил, что аминокислоты в белке могут располагаться в любом порядке и ограничений на их последовательности в белках в природе нет. Вторая серьезная проблема состояла в том, что при перекрывающемся коде любая точечная мутация (в которой одна буква заменяется другой) неизбежно приводила бы к изменению больше чем одной аминокислоты в белке, а экспериментальные данные свидетельствовали о том, что при таких мутациях меняется лишь одна аминокислота. Стало ясно, что генетический код не перекрывается. Предположение Гамова о перекрывании кода было опровергнуто задолго до того, как стал известен настоящий код. Криптографы начали подозревать, что мать-природа упустила возможность воспользоваться некоторыми известными им трюками.
Следующую попытку разгадать загадку кода предпринял Крик. Он высказал идею настолько красивую, что ее немедленно все приняли, хотя самого автора и смущала нехватка доказательств. Крик воспользовался новыми открытиями, сделанными в нескольких молекулярно-биологических лабораториях, в первую очередь в новой лаборатории Уотсона в Гарварде. Уотсон глубоко увлекся исследованиями РНК — более короткой одноцепочечной молекулы, близкой к ДНК и находимой как в цитоплазме клеток, так и в ядре. Кроме того, он обратил внимание на то, что РНК составляет неотъемлемую часть крошечных структур, теперь называемых рибосомами, на которых, судя по всему, и синтезировались белки. Итак, неактивная ДНК сидит в ядре. Когда нужно синтезировать какой-либо белок, соответствующий участок ДНК используется в качестве матрицы, чтобы синтезировать его РНК-копию. Она физически выходит из ядра и достигает ожидающих ее снаружи рибосом, синтезирующих этот белок, используя в качестве матрицы уже молекулу РНК. Эта разновидность РНК впоследствии получила название матричной РНК (мРНК). Уотсон еще в 1952 году писал Крику: “ДНК делает РНК делает белок”. Крика теперь интересовало вот что: как точная последовательность букв молекулы матричной РНК переводится (транслируется) в последовательность аминокислот в белке?
Крик крепко задумался. Он предположил, что матричная РНК транслируется с помощью набора особых молекул — адаптеров, по одной на каждую аминокислоту. Адаптеры тоже должны состоять из РНК, у каждого из них должен быть антикодон, способный узнавать соответствующий кодон матричной РНК и связываться с ним. Принцип этого связывания, как считал Крик, должен быть точно таким же, как в ДНК: Ц образует пару с Г, А — с Т, и так далее[10]. Существование адаптеров предполагалось тогда чисто гипотетически, но они действительно были открыты несколько лет спустя, и оказалось, что они действительно состоят из РНК, как и предсказывал Крик. Теперь их называют транспортными РНК (тРНК). Вырисовывалась система, напоминающая детский конструктор, детали которого соединялись друг с другом и вновь разделялись, образуя изумительные, хотя и недолговечные структуры.
Но здесь Крик пошел по ложному пути. Я пишу об этом довольно подробно потому, что хотя действительность и оказалась несколько богаче, чем он предполагал, его идеи могут по-прежнему быть актуальны для решения вопроса о том, как все это возникло. Крик представлял себе, что матричная РНК просто сидит в цитоплазме, а ее кодоны торчат, как соски свиноматки, и к каждому из них может “присосаться” транспортная РНК. Рано или поздно молекулы тРНК свяжутся с мРНК по всей длине, расположившись одна за другой, и с каждой из них будет связана, как хвост поросенка, соответствующая аминокислота, готовая соединиться с соседними аминокислотами и образовать белковую цепочку.
Проблема, по мнению Крика, состояла в том, что тРНК будут прибывать в случайном порядке, по мере их появления рядом с мРНК, и связываться с ближайшим соответствующим кодоном. Но если не начинать с начала и не заканчивать в конце, как они узнают, где начинается и где заканчивается один кодон? Как они смогут найти правильную рамку считывания? Если последовательность содержит фрагмент АТЦГТЦ, то одна тРНК может связаться с кодоном АТЦ, а другая — с кодоном ГТЦ, но что помешает соответствующей тРНК узнать кодон ЦГТ в середине этого фрагмента и тем самым транслировать совсем не то, что нужно? Предложенный Криком ответ на этот вопрос предполагал категорический запрет подобных вещей. Раз матрица в целом должна читаться однозначно, значит, не все кодоны должны иметь смысл. Какие же из них требовалось запретить? Ясно, что последовательности, состоящие только из А, только из Ц, только из Т или только из Г, должны были оказаться под запретом: в цепочке АААААА нельзя найти правильную рамку считывания. Затем Крик проверил все другие трехбуквенные комбинации. Он рассуждал примерно так: если АТЦ имеет смысл, то все циклические перестановки этих трех букв (ТЦА и ТАЦ) должны быть под запретом. Сколько возможностей это нам оставляет? Снова двадцать! (Из шестидесяти четырех возможных кодонов AAA, ТТТ, ЦЦЦ и ГГГ исключаются. Остается шестьдесят. Из каждых трех вариантов циклических перестановок допустим только один, значит, делим шестьдесят на три.)
В отличие от перекрывающихся кодов, код Крика не накладывал никаких ограничений на порядок аминокислот в белке и не предполагал, что точечная мутация будет непременно менять две или три аминокислоты. Когда была выдвинута эта гипотеза, казалось, она дает прекрасное решение проблемы рамки считывания и при этом сокращает число кодонов с шестидесяти четырех до двадцати, что соответствует числу аминокислот в белках. Эта гипотеза ничуть не противоречила всем имеющимся на тот момент данным. И все же она ошибочна. Спустя несколько лет выяснилось, что искусственно полученная РНК, состоящая из кодонов ААА (запрещенных Криком), все же кодирует аминокислоту лизин и может транслироваться в белковую цепочку, состоящую исключительно из лизина.
К середине 60-х годов, когда были усовершенствованы экспериментальные методы, нескольким исследовательским группам удалось шаг за шагом выяснить, что на самом деле представляет собой генетический код. После всех попыток расшифровать его открывшаяся картина вызывала глубочайшее разочарование. Оказалось, что никакого изящного нумерологического решения не было, а код просто вырожден (это значит, что в нем полно излишеств). Три аминокислоты кодируются шестью разными кодонами каждая, в то время как другие кодируются лишь одним или двумя. Все кодоны идут в дело: три кодона означают “стоп” (конец трансляции), а все остальные кодируют ту или иную аминокислоту. Выходило, что в генетическом