Этот рисунок иллюстрирует румеровское преобразование, переводящее дублеты одного октета в другой. Третье основание кодона неявно присутствует здесь в составе октета II, продукты которого организованы в две строки: верхнюю кодируют триплеты с третьим пиримидином, нижнюю – с третьим пурином.
Идеи Юрия Румера были продолжены и развиты работами Владимира Щербака. Два румеровских октета Щербак преобразовал таким образом, чтобы выделить в них группы вырожденности, пронумеровав их справа налево, а продукты кодирования (аминокислоты) он упорядочил в каждой группе по нарастанию молекулярной массы слева направо; триплеты, соответствующие продуктам кодирования, он записал по вертикали сверху вниз. Тогда первые, вторые и третьи основания кодонов образовывали три строки в каждом кодоне. Вот что у него получилось (цифры под третьими основаниями – характеристики кодируемого продукта):
1. номер октета
2. номер группы вырожденности
3. продукт кодирования (аминокислота или терминирующий сигнал 0)
4. 1-е основание кодона
5. 2-е основание кодона
6. 3-е основание кодона
7. Bulkiness (мера формы или объѐма или «громоздкости» боковой цепи)
8. Объем (рассчитанный по Ван-дер-Ваальсовым радиусам)
9. Полярность (сила электрического поля вокруг молекулы)
10. Изоэлектрическая точка
11. Гидрофобность 1; гидрофильные аминокислоты – выделены темносерым и отрицательными значениями
12. Гидрофобность 2 (другие данные)
13. Поверхность, доступная для воды в развернутом пептиде
14. Доступная воде поверхность, теряемая при свертывании пептида
15. Polar requirement, PR (эмпирические данные по хроматографии водных растворов). Темный> 7.5; светлый <5.6
16. Частота встречаемости аминокислот в белках современных организмов
17. ars-класс
18. неканоническое кодирование ( – нет продукта)
В двух прямоугольных блоках – два румеровских октета (строка 1), упорядоченные по нарастанию номера, каждый из которых разделен на группы вырожденности, помеченные соответствующими римскими цифрами (строка 2) и упорядоченные по убыванию номера. Строка 3 – продукты кодирования, упорядоченные по нарастанию масс в «своих» группах вырожденности (что – как и в первых двух случаях – подчеркивается градиентом насыщенности серого цвета). Символы оснований кодирующих триплетов расположены вертикально – сверху вниз, от 5` до 3` – для удобства сравнения кодонов по первым, вторым и третьим буквам соответственно. Четное содержание продуктов кодирования в октетах позволяет провести посередине вертикаль, которая оказывается осью симметрии по отмеченным ниже характеристикам. R – пурины (A, G), Y – пиримидины (С, Т), N – любое из четырех азотистых оснований. 0 – стоп-кодон. Строки 7—15 – физико-химические свойства аминокислот.
Эта несложная организация приводит к поразительно красивой общей картине: в октете 1 первые основания триплетов (первая строка) оказываются взаимно комплементарными относительно упомянутой вертикали; вторые основания – зеркально симметричны по пуринам и пиримидинам. Симметрия третьих оснований – это симметрия их монотонного ряда. Симметрии подчеркиваются оттенками серого (интенсивность которого нарастает с увеличением молекулярной массы продукта кодирования в составе группы вырожденности).
Симметрия кодирующих триплетов и продуктов кодирования, относящихся к октету 2, в этой таблице немного сложнее, но также вполне наглядна. Она требует двух предварительных пояснений. Первое – это позиция цистеина, С. Универсальный код предписывает дублету TG кодирование цистеина, если третьим основанием кодона является пиримидин Y, а кодирование триптофана, если третья буква кодона – G. Аденин в третьей позиции образует пунктуационный знак – стоп-кодон TGA. То обстоятельство, что при этом нарушается симметрия, ставит определенную проблему, которую Владимир Щербак разрешил, обнаружив, что обозначенная в таблице позиция цистеина принципиально не противоречит Природе, поскольку существуют одноклеточные микроорганизмы (Euplotida, реснитчатые, инфузории), генетический код которых отличается от универсального как раз по кодированию цистеина: триплет TGA у них транслируется как С и не имеет функции «стоп». Второе пояснение относится именно к функции «стоп», которая рассматривается в таблице как «законный» продукт кодирования, не имеющий массы.
Итак, упорядочивание продуктов кодирования октета 2 по нарастанию молекулярной массы так же, как и в случае октета 1, приводит к симметриям первых, вторых и третьих оснований соответствующих кодонов. При этом основной особенностью этого представления является зеркальная симметрия пар кодирующих дублетов пяти краевых позиций и симметрия со сдвигом трех пар внутренних, кодирующих триплетов. Так же, как и в октете 1, осью этой симметрии является вертикаль, которая делит строки точно посередине. Симметрию третьих оснований нечетных групп вырожденности (H|G) Владимир Щербак рассматривал в данном случае как вариант симметрии Y|R.
Как мы упоминали, симметрия описанного представления генетического кода имеет место не только по молекулярной массе аминокислот, но и по другим их параметрам (строки 11—15). Замена в третьей позиции пары симметричных кодонов пурина пиримидином – и наоборот – в определенной мере сохраняет, например, гидрофобность кодируемых продуктов, хотя размер аминокислоты при этом, конечно, основательно меняется. Однако, ни гидрофобность, ни еще одна характеристика – PR (строка 15) – которую Карл Вѐзе и его группа описали, как основу регулярности генетического кода и соответствия кодонов и продуктов кодирования, не могут сравниться по строгости симметрий с молекулярной массой аминокислот, что хорошо демонстрирует приведенная таблица Владимира Щербака. Неканонические ключи кодирования (строка 17) тоже выглядят в этих таблицах довольно беспорядочными и случайными отклонениями.
За весь этот рисунок кооперативной симметрии генетического кода, на основе молекулярных масс его компонентов, за ее красоту и гармонию, не имеющую к тому же сколько-нибудь внятного физического, химического или молекулярно-биологического обоснования, мой друг назвал описанную таблицу каллиграммой (красивой записью). Термин этот принадлежит Гийому Апполинеру, который – в экспериментальном порядке попытался организовать некоторые свои тексты так, чтобы продемонстрировать их симметрию. Их он и называл calligrammes.
В следующей главе мы покажем, что симметрии каллиграммы Щербака имеют неожиданный количественный характер, то есть, по-видимому, даже более сущностны, нежели только что описано. Стоит, однако, отметить, что известные небольшие отклонения от универсального генетического кода могут серьезно нарушать симметрии каллиграммы. Например, генетический код митохондрий позвоночных, который, по одним представлениям, был предшественником универсального, а по другим – сам происходил из него, отличается тем, что у него отсутствуют нечетные группы вырожденности, так что две четные прямо соответствуют двум октетам Румера. При этом дублет TG кодирует цистеин, если в третьей позиции триплета стоит пиримидин, и триптофан, если в третьей позиции – пурин. То же относится и к дублету АТ: ATY=I, ATR=M. И еще одно отличие от универсального: триплет AGR кодирует не аргинин, а сигналы терминации (0). Это означает, что описанная каллиграмма Щербака, сама по себе, как будто, не является обязательным условием организации генетического кодирования (земных?) организмов. Вместе с тем, Андрей Хренников и Сергей Козырев56, используя так называемые р-адические числа, показали наличие значительной регулярности и в этой версии генетического кода. Автор не берется комментировать их работу, поскольку ровно ничего не понимает в р-адических числах и в d-адических плоскостях. Однако, она каким-то образом связывает регулярную организацию (в том числе и симметрии) генетического кода с его защищенностью. В своих рассуждениях Хренников и Козырев отталкивались от представления кодирующих триплетов, предложенного Роз-Мари Свансон5757 и позднее уточненного Драганом Босняцким5858 с соавторами на основе подхода, используемого для решения хорошо известной Проблемы Путешествующего Продавца (ППП). В этом представлении последовательность кодирующих триплетов образует цикл, известный как «код Грея»: