Первое из них – триплетность, означающая, что каждую используемую в живых структурах аминокислоту кодируют три последовательно (то есть от 5`– к 3`-концу цепи) расположенных азотистых основания. Их называют триплетом или кодоном. В таблице первым двум основаниям соответствуют вертикальная и горизонтальная координаты; третье основание показано по вертикали справа, оно делает двумерную таблицу трехмерным кубом 4 х 4 х 4.
Физических промежутков между кодонами нет, поскольку код характеризуется непрерывностью. Если бы код был синглетным, то есть если бы каждой кодируемой аминокислоте соответствовало бы только одно основание (из четырех), кодирующая емкость кода и составляла бы только четыре аминокислоты. Между тем, таких аминокислот двадцать, и только этого числа (не меньше!) достаточно для обеспечения существующего белкового разнообразия. Если бы код был дублетным, то есть, если бы каждой кодируемой аминокислоте соответствовало бы два основания, кодирующая емкость кода составляла бы только шестнадцать аминокислот (42) – то есть очевидно недостаточно. Емкость триплетного кода составляет 64 аминокислоты (43). Этого хватает с избытком.
«Избыток» составляет 44 кодируемых продукта. Многие исследователи утверждают, что эволюция генетического кода шла в направлении от синглетного к триплетному. При этом они не понимают, что смена размера кодирующей единицы потребовала бы принципиального изменения всей машины кодирования (то есть всего набора ферментов, обслуживающих этот процесс) – вещь невозможная! Поэтому синглетный этап триплетного кодирования (если он был) мог означать, что в составе триплета значащей единицей могла быть только одна (например, первая или любая), а в составе дублета – две. Тогда и непрерывность кодированной записи могла быть только физической. Функционально значащие основания разделялись остальными основаниями триплета, а эволюция продолжала совершенствовать структуру молекул-участников кодирования. Произвольные (из четырех) третьи основания современных кодонов для восьми (из двадцати) аминокислот могут быть реликтами до-триплетных кодов. Выбор же тройки азотистых оснований в качестве дискретной единицы генетического кода мог быть обусловлен также термодинамикой взаимодействия пар оснований, при котором матричное копирование инициируется их триплетом (мы говорили об этом выше, ссылаясь на Зенгера).
Неперекрываемость – один и тот же нуклеотид не может входить одновременно в состав двух или более триплетов; не соблюдается для некоторых перекрывающихся генов вирусов, митохондрий и бактерий, которые кодируют несколько белков, считывающихся со сдвигом рамки.
Поскольку никакого избытка в крайне экономной природе не бывает, он и здесь компенсируется еще одним свойством, парадоксально именуемым вырожденностью (избыточностью), которая означает, что каждую аминокислоту (два исключения – метионин и триптофан) кодирует более, чем один триплет. Синим выделены клетки таблицы, содержащие аминокислоту, кодируемую четырьмя триплетами, серым – тремя, светло-серым – двумя, самым светлым – две аминокислоты, кодируемые только одним триплетом.
Однозначность кода означает, что каждый триплет фрагмента полинуклеотида, именуемого геном, кодирует только одну аминокислоту. Продуктами кодирования являются не только аминокислоты, но и знаки пунктуации – знак начала кодирующей цепочки (гена), ATG, или AUG, называемые стартовыми кодонами, и знаки ее окончания – TAA (UAA), TAG (UAG) и TGA (UGA) или терминирующие (trm) стоп-кодоны (в таблице – буквы синего цвета в бесцветных ячейках). Начало генного продукта – это всегда аминокислота (метионин в данном случае), конец его – аминокислота, предшествующая стоп-кодону.
Еще одно свойство генетического кода – универсальность, означает, что все живущие на Земле существа – будь то РНК– или ДНК-вирус, слон, морковка, червь или человек – пользуются одним и тем же генетическим кодом. Немногочисленные отклонения от этого правила касаются лишь отдельных аминокислот и являются, скорее всего, именно отклонениями, результатом весьма длительной эволюции в специфических условиях.
Небольшое число таких отклонений лишь подчеркивают седьмое из перечисляемых свойств кода – необычайная стабильность.
За этим свойством неизбежно должно стоять – и стоит – еще одно – столь же необычайная помехоустойчивость. Помехоустойчивость относится к двум наиболее важным свойствам кодируемых аминокислот – их размеру, который характеризуется объемом или массой молекулы, и их гидрофильности (и гидрофобности), которые определяют вторичную структуру полипептида. Замена третьего основания триплета, как правило, не влияет на эти свойства, замена второго более существенна и относится, по преимуществу, к гидрофильности аминокислоты или к ее гидрофобности, замена первого может оказаться роковой; она меняет размер кодируемой молекулы. Если подсчитать, сколько замен одного нуклеотида не меняет тип аминокислоты в соответствии с ее химическими свойствами (а такие замены аминокислот слабо сказываются на структуре и функциях белка) и сколько меняет, то отношение первых ко вторым будет близко к 2,25. Расчеты показывают, что существующий генетический код не является самым оптимальным вариантом кода по признаку помехоустойчивости, и специальными программами удается сгенерировать более устойчивые в этом отношении коды. Тем не менее, компьютерное моделирование демонстрирует вполне впечатляющую частоту кодов со сходной с существующим помехоустойчивостью – один на миллион. Даже при такой частоте число помехоустойчивых кодов еще достаточно велико, чтобы вызывать впечатление случайности выбора той версии, которая используется на Земле. А так и не достигнутый за миллиарды лет максимум помехоустойчивости генетического кода на нашей планете наводит на мысль о том, что его, скорее всего, определило некое единичное событие, после которого опять-таки некое ограничение фиксировало девятое свойство кода, отмеченное еще Френсисом Криком. Поскольку ни изощренные и длительные эксперименты, ни теория – во времена Крика – не показывали абсолютно никакого физико-химического соответствия между нуклеотидными триплетами и аминокислотами, он назвал не поддающийся изменениям в течение миллиардов лет генетический код замороженной случайностью. Замороженной – в том смысле, что сформировавшись, он уже не менялся. Случайностью – в том смысле, что он мог сформироваться каким угодно. А вот то, что он сформировался именно таким, каким мы его видим, и настолько удачно, что в дальнейшем мог уже и не меняться, придает ему, на первый взгляд, свойство чуда. На сегодняшний день оценка Крика – едва ли не самая убедительная гипотеза происхождения генетического кода. И все-таки, когда мы говорим «случайность», рассматривая формальные свойства кода (мы сделаем это позднее), не только физика и химия приходят нам в голову. Но и они (физика и химия) предлагают сегодня альтернативную замороженной случайности гипотезу, гипотезу «ключ-замок», основанную на экспериментальных данных, которые все же показывают определенное сродство отдельных аминокислот с отдельными РНК-последовательностями. Об этом – в конце книги.
…………………
«Номер» этой главы назван «инициалами» ее «главного героя» – Genetic Code. Автор хотел, однако, не только отметить их совпадение с принятым обозначением пары гуанин-цитозин (GC), но акцентировать комплементарность этой пары, которую в названии главы подчеркивает вторая комплементарная пара – аденин-тимин (АТ), символ которой (предлог at) обозначается на «компьютерном языке» знаком @. Если пару АТ встроить между G и C, вся четверка – GA‖TC – оказывается упорядоченной по массе и зеркально симметричной по комплементарности относительно центра, отмеченного двумя короткими вертикалями. В составе двуцепочечной молекулы нуклеиновой кислоты пара GC демонстрирует сильное, S, взаимодействие, образуя три межнуклеотидных водородных связи CΞG (нижняя пара на рисунке), в то время, как пара АТ (верхняя часть рисунка) демонстрирует слабое, W, взаимодействие:
Результатом комплементарности пар оснований является первое правило Чаргаффа: число гуанинов (G) в двуцепочечной ДНК равно числу цитозинов (С), а число аденинов (А) равно числу тиминов (Т). Это правило стало одним из краеугольных камней открытия спиральной структуры этой молекулы, о чем можно прочитать в любом учебнике.