…………………
…а пока поясним символ этой главы, и причину его выбора. Дело просто в том, что в мире нуклеиновых кислот латинская буква G символизирует одно из четырех азотистых оснований – гуанин (мы так и будем писать ее далее – прописью и курсивом). Это самое «тяжелое» основание (округленная молекулярная масса – 151) с химической формулой:
Дублет GG триплетного генетического кода контролирует синтез самой «легкой» аминокислоты – глицина, трехбуквенный символ которой – Gly (Гли – «по-русски»), а однобуквенный – а мы в дальнейшем будем использовать именно однобуквенные латинские символы (и будем писать их полужирным шрифтом в прописном варианте) – G. Ее округленная молекулярная масса – 75, а структурная химическая формула —
Наконец, если известную всем таблицу генетического кода представить «в плоском варианте (4х4)», то есть приняв во внимание только две первые кодирующие буквы и оставив, таким образом, только вертикальную (первые буквы кодонов) и горизонтальную (вторые буквы кодонов) координаты (выделены серым), а кодирущие буквы (азотистые основания) вдоль этих координат упорядочить по нарастанию молекулярных масс, то глицин G, кодируемый дублетом GG, займет шестнадцатую клетку (в правом нижнем углу таблицы):
Десятичное число 16 в системах счисления с основаниями, большими, чем 16, записывается символом G (который в данном случае является цифрой, а не буквой). Пронумеровав приведенную таблицу генетического кода в этих системах счисления построчно, получим:
Забавное тройное совпадение, не правда ли? Благодаря ему Автор и выбрал номер этой главы – выбор, конечно, произвольный. Но Бог не играет в кости, и совпадения, о которых пойдет речь далее, будут уже не так забавны. Более того, они вряд ли будут даже совпадениями. Замечу теперь, что практически все идеи, которые лежат в основе последующих рассуждений, содержатся в этом пояснении – явно или нет.
Часть вторая. Машина генетического кодирования
Глава [email protected]С.
Генетический код – явление «героя» (Х)
События, связанные с эволюцией Вселенной и коротко описанные выше, привели, в конечном счете (а может быть, и «в том числе») к возникновению жизни, центральным феноменом которой стало объединение мира нуклеиновых кислот и мира белков в единую автокаталитическую суперсистему, для чего потребовалось связующее звено обоих миров, доведенное до необходимого состояния – так называемый генетический код. Генетический код – это набор инструкций для однонаправленного перевода нуклеотидной последовательности в полипептидную. Таким образом, сегодняшний код составляют два компонента. Первый – кодирующий – компонент – это четыре азотистых основания (или нуклеотида, когда они фосфорилированы и составляют цепи РНК или ДНК).
Общее обозначение азотистых оснований приведено в таблице:
Из них состоит полинуклеотид – рибо– или дезоксирибонуклеиновая кислота, РНК или ДНК. В случае РНК четыре нуклеотида – это два пурина (аденин и гуанин в табличках ниже) и два пиримидина – урацил и цитозин. В молекуле ДНК одно из перечисленных оснований – урацил – заменен на тимин (T):
Полимером правовращающего сахара – рибозы или дезоксирибозы – в цепочку РНК или ДНК соединены трифосфаты этих оснований. Здесь показаны структуры одноцепочечных молекул ДНК (вверху) и РНК (внизу):
Второй – кодируемый – компонент генетического кода – это аминокислоты, из которых состоят полипептиды или белки. Из более ста пятидесяти природных аминокислот кодируемыми являются (по преимуществу) только 20:
Для обозначения аминокислот (напомним, что кодируемыми являются альфа-L-аминокислоты) используют либо трех-, либо однобуквенные символы; мы – как уже сказано – будем пользоваться последними. В таблице выделены гидрофильные (синие ячейки и белые буквы названий) и гидрофобные (желтые ячейки) аминокислоты, аминокислоты, способные нести заряд, отмечены знаками (+) или (-), ароматические аминокислоты (бирюзовые ячейки в колонке символов, иминокислота пролин – бирюзовое выделение); серусодержащие аминокислоты (желтые ячейки в колонке символов). В формуле молекул справа – одна и та же константная часть (участвующая в пептидной связи; полужирный шрифт), слева – боковая часть молекулы или радикал (R). Молекула пролина приведена к общей схеме гипотетическим размыканием (релаксацией) иминного кольца.
Очевидно, что аминокислоты отличаются друг от друга химической природой боковой цепи, которая состоит из группы атомов в молекуле аминокислоты, связанной с α-углеродным атомом и не участвующей в образовании пептидной связи при синтезе белка. Всѐ разнообразие особенностей структуры и функции белковых молекул связано с химической природой и физико-химическими свойствами радикалов аминокислот. Именно благодаря им, белки наделены рядом уникальных функций, не свойственных другим биополимерам, и обладают химической индивидуальностью. Благодаря им, вновь синтезирующаяся полипептидная цепочка приобретает вторичную структуру, образуя определенной длины однотипные спирали, складчатость и повороты (изломы). Эта структура, в свою очередь, складывается в уникальную третичную, которая и обладает определенными функциями. Они могут быть усилены или модифицированы четвертичной белковой структурой, которую формируют уже не отдельные полипептиды, а их комбинация.
Это общие сведения (trivia) о компонентах генетического кода. Приводим его стандартную (каноническую) таблицу. Синим выделены в ней кодирующие и кодируемые элементы группы вырожденности IV октета 1 (см. ниже); серым – элементы октета 2 групп вырожденности I (темно-серые), III (светлее) и II (еще светлее). В неокрашенных ячейках – терминирующие кодоны. Чтобы подчеркнуть характер непосредственных участников процесса декодирования, то есть молекул РНК, четырьмя основаниями в таблице часто выбираются основания U, C, A и G. Именно на таком порядке настаивал Френсис Крик – не помню точно, почему, – может быть, потому, что, скажем, теория граничных орбиталей химической реактивности, которая была разработана для сравнения вероятностей стабилизации избыточных электронов для различных ДНК-составляющих, предсказывает снижение электронного сродства и потенциалов ионизации, подтверждаемое экспериментальными данными, именно в порядке TCАG51.
ВТОРОЙ НУКЛЕОТИД
Функция молекулы ДНК – не декодирование, но хранение генетической информации. Поскольку выбор «главной» из этих двух функций – задача очевидно нелепая, таблицы кода с ДНК-основаниями Т, C, A и G встречаются не менее часто.
Напомним теперь восемь основных свойств генетического кода, определяющих сопоставление нуклеотидов и аминокислот, и девятое – альтернативное.
Первое из них – триплетность, означающая, что каждую используемую в живых структурах аминокислоту кодируют три последовательно (то есть от 5`– к 3`-концу цепи) расположенных азотистых основания. Их называют триплетом или кодоном. В таблице первым двум основаниям соответствуют вертикальная и горизонтальная координаты; третье основание показано по вертикали справа, оно делает двумерную таблицу трехмерным кубом 4 х 4 х 4.
Физических промежутков между кодонами нет, поскольку код характеризуется непрерывностью. Если бы код был синглетным, то есть если бы каждой кодируемой аминокислоте соответствовало бы только одно основание (из четырех), кодирующая емкость кода и составляла бы только четыре аминокислоты. Между тем, таких аминокислот двадцать, и только этого числа (не меньше!) достаточно для обеспечения существующего белкового разнообразия. Если бы код был дублетным, то есть, если бы каждой кодируемой аминокислоте соответствовало бы два основания, кодирующая емкость кода составляла бы только шестнадцать аминокислот (42) – то есть очевидно недостаточно. Емкость триплетного кода составляет 64 аминокислоты (43). Этого хватает с избытком.