
Полная версия
Первая молекула: Как РНК раскрывает главные тайны биологии
Гамову нужен был биологический аналог Розеттского камня. Только вместо текста, написанного одновременно египетскими иероглифами и греческим языком, там должна была изображаться последовательность аминокислот и кодирующая ее последовательность РНК. Но такого камня не существовало – ученым необходимо было его создать. И для этого надо было определить, существует ли на самом деле гипотетический посредник, может ли РНК быть недостающим звеном между нашими генами и структурными элементами живого – белками.
ТЫ ПОЛУЧИЛ МОЕ СООБЩЕНИЕ?В 1950-х гг. множество ученых, в том числе Джим Уотсон и Фрэнсис Крик, искренне верили в теорию, утверждавшую, что РНК может переносить информацию из ядра клетки, от ДНК, к цитоплазме, где синтезируются белки. Но когда исследователи попытались найти эмпирические доказательства того, что РНК выступает посредником в живых системах, вначале их ожидали неудачи. Первое разочарование наступило, когда выяснилось, что в большей части молекул РНК в цитоплазме клетки основания А, Г, Ц и У встречаются в одинаковых пропорциях, независимо от того, какие белки синтезирует клетка. В этом было не больше смысла, чем если бы обнаружилось, что в Девятой симфонии Бетховена и в "Bad Romance" Леди Гаги разные ноты встречаются в одних и тех же пропорциях. Можно ожидать, что у этих совершенно разных музыкальных произведений будет соответственно разное соотношение фа-диезов, си-бемолей и других нот. Аналогично предполагалось, что у матричных РНК (мРНК), кодирующих разные белки, состоящие из разных последовательностей аминокислот, должно быть разное соотношение А, Г, Ц и У.
Второе разочарование было связано с тем, что большинство молекул РНК в цитоплазме очень стабильны: появившись, они довольно долго сохраняются. Однако исследователи наблюдали случаи, когда клетка быстро, всего за несколько минут, переключалась с одного набора белков на совершенно другой. Например, если поменять источник пищи для бактерий, они остановят производство пищеварительных ферментов для прежней еды и немедленно начнут генерировать белки, подходящие для новой. Точно так же если бактерию заразит вирус (а есть вирусы, поражающие именно бактерии, они называются бактериофагами или просто фагами), то бактерия переключится с производства бактериальных белков на белки фага. Следовательно, настоящая мРНК должна быть нестабильной, чтобы можно было быстро начать выработку другого белка. Крайне стабильная природа большинства клеточных РНК, казалось, не позволяла им быть тем посредником, который искали исследователи.
Среди ученых, все еще убежденных в том, что мРНК существует, но ускользает от наблюдения, были сотрудники Института Пастера в Париже Франсуа Жакоб и Жак Моно. Ранее они уже сделали важнейшие открытия, обосновав, как именно у бактерий включаются и выключаются гены, и теперь обратили свое внимание на РНК. В 1960 г. во время визита в Кембридж Жакоб встретился со своими друзьями Фрэнсисом Криком и Сиднеем Бреннером, возглавлявшим лабораторию в Королевском колледже[21]. Жакоб рассказал о своих последних экспериментах с регуляцией генов у бактерий, а затем разговор перешел к захватывающим догадкам о роли мРНК как связующего звена между геном и белком.
Внезапно и почти одновременно Крик и Бреннер подскочили. Они вспомнили недавние эксперименты Кена Волкина и Ларри Астрахана – исследователей из Окриджской национальной лаборатории в штате Теннесси. Изучая бактерию кишечную палочку (Escherichia coli), зараженную фагом Т2, Волкин и Астрахан обнаружили быстрое образование новых молекул РНК, которые были меньше, чем содержащиеся в клетке стабильные РНК[22] (сейчас мы знаем, что стабильные РНК – это составная часть рибосом, фабрик по производству белков). По целому ряду причин Волкин и Астрахан интерпретировали свои данные так, что РНК превращается в ДНК. Но что, если в действительности они заметили ту самую неуловимую мРНК?
Такая возможность воодушевляла, но гипотезу мРНК нужно было подтвердить экспериментально. Сидней Бреннер и Франсуа Жакоб планировали через несколько недель навестить генетика Мэтью Мезельсона в Калифорнийском технологическом институте. Было решено, что они втроем проведут необходимые тесты. Мезельсон вместе со своим коллегой Фрэнком Сталем незадолго до того применил новую методику с использованием чрезвычайно быстро вращающейся центрифуги – они проверяли предположение Уотсона и Крика, что во время репликации ДНК нити двойной спирали расходятся. Их результаты подтвердили гипотезу, согласно которой каждая дочерняя двойная спираль состоит из одной «старой» родительской нити и одной новосинтезированной.
Теперь Бреннер, Жакоб и Мезельсон хотели использовать такую же ультрацентрифугу в попытке найти иголку мРНК в стоге рибосомных РНК. Они намеревались заразить кишечную палочку фагом, который заставит бактерию начать вырабатывать другие белки. Одновременно с фагом ученые добавили бы радиоактивный урацил (помеченный углеродом–14), который встроился бы только в новообразованные молекулы мРНК фага, но не в существующие бактериальные РНК. Если гипотеза верна, то мРНК фага должна была появиться как раз в этот момент. Такой результат позволил бы найти пропущенное звено между ДНК и белком.
И действительно, Бреннер, Жакоб и Мезельсон с помощью ультрацентрифуги обнаружили радиоактивную мРНК фага, которая была явно меньше, чем РНК в рибосомах. Как и предсказывалось, эти молекулы РНК были короткоживущими, они соединялись с существующими бактериальными рибосомами для синтеза белков новых видов, необходимых вирусу для его черного дела[23]. Какой бы неуловимой ни была мРНК, ее наконец удалось поймать.
Чтобы понять этот биологический процесс, представьте себе проигрыватель пластинок. Рибосома – сам проигрыватель, мРНК – виниловая пластинка, а белок – музыка, которую вы слышите, когда опускаете иглу. В зависимости от вашего настроения вы можете менять пластинки, но оборудование остается неизменным. Точно так же как проигрыватель заставляет звучать любую пластинку, рибосома может работать с любой попавшейся мРНК. Именно от мРНК зависит, какой конкретный белок производится, будь то белки фага, кишечной палочки или какие-либо другие; пластинка определяет, какую музыку вы слышите.
Ученым было так сложно найти мРНК, потому что только 5% от всего множества РНК, содержащихся в клетке бактерии, – те, что представляют матричную РНК. Остальные 95% – это рибосомные РНК. Более того, у кишечной палочки около 4000 генов, каждый из которых дает мРНК разного размера и с разной последовательностью оснований. То есть мРНК конкретной разновидности в клетке гораздо меньше 5%. И, наконец, большинство молекул мРНК живут всего несколько минут, поэтому их очень трудно ухватить. Рибосомные РНК, напротив, не только широко распространены в цитоплазме, но и живут довольно длительное время, так что легко понять, почему ученым, стоявшим у истоков данного направления науки, потребовалось столь много времени, чтобы разобраться во всей этой истории с разными РНК.
ЛИНГВИСТИЧЕСКАЯ ИНТЕРМЕДИЯСравнение с проигрывателем помогает объяснить, как рибосомы и мРНК работают совместно, чтобы в итоге образовать белок. Но когда требуется понять, как РНК кодирует белок, нам стоит выключить музыку и открыть книгу.
Страницы большинства книг заполнены письменной речью – буквами, словами, предложениями. В алфавите книги жизни, записанной на языке ДНК, не 26 букв, как в английском языке, и не 22 буквы, как в иврите, а всего 4 буквы: А, Г, Ц и Т. Значение каждого слова и каждого предложения определяется последовательностью этих четырех букв – тем, в каком порядке они расположены.
Итак, сколько потребуется книг, чтобы передать суть жизни, то есть описать всю ДНК в определенном организме? Конечно, ответ зависит от размера генома – общего количества ДНК в клетке организма. Геном человека насчитывает около 3 млрд букв, или оснований, упакованных в 23 хромосомы[24].
Предположим, что страница, написанная обычным шрифтом, содержит примерно 3000 знаков; значит, для записи генома человека потребуется миллион страниц. Большая книга может содержать до 500 страниц, тогда для последовательности всего генома необходимо 2000 книг – это многовато для домашней библиотеки, но лишь малая часть хранилища городской библиотеки. Каждая хромосома состоит из одной молекулы ДНК и соответствует примерно 90 книгам. Геном бактерий, например кишечной палочки, намного меньше. У бактерий весь геном расположен на одной кольцевой хромосоме. Он содержит 4,5 млн оснований и вполне мог бы разместиться в трех библиотечных книгах.
Как мы уже выяснили, для создания белка нам нужен посредник в виде РНК, чтобы перенести информацию от ДНК к рибосоме. РНК, которые образуются естественным путем, не копируют постранично огромную книгу ДНК. У них есть определенные точки начала и окончания, которые, скорее всего, не совпадают с разрывами страниц. В общем, мы можем представить мРНК не как фотокопию целой страницы бумажной книги, а как выделенный участок текста из электронной книги, скопированный в несколько кликов в отдельный электронный документ. Мы просто выделяем движением курсора определенный фрагмент текста и затем вставляем его в пустой документ в нашем текстовом редакторе. А с помощью простой функции «найти/заменить» мы можем одновременно заменить все Т в ДНК на У в РНК, смоделировав таким образом естественный химический процесс.
Эта процедура копирования и вставки, когда фрагмент ДНК копируется в виде молекулы РНК, постоянно происходит в нашем теле, ведь она запускается всякий раз при необходимости синтезировать новые белки. мРНК копирует разные области ДНК в зависимости от того, что требуется в конкретное время и в конкретном месте. У детей копируются иные участки генома, чем у взрослых. В сердце копируются одни участки генома, а в мозге, печени и коже – другие. То есть процесс копирования строго регулируется.
После того как процедура копирования и вставки завершена, мы можем рассмотреть последовательность нашей мРНК. Это набор из А, Г, Ц и У, например такой:

Допустим, что мы знаем, как расшифровываются группы из трех оснований – триплетные кодоны. Вот наш словарь. Вместо аминокислот для каждого кодона я выбрал трехбуквенные слова:
АУГ = тот
ЦЦУ = наш
УЦГ и УЦЦ = кот
ААА и АГА = ест
АУА = суп
УУУ = или
УГУ и УАУ = уху
ЦГЦ = вол
ЦУЦ = жук
ЦУУ = как
ГГА = сын
ГУА и ГУУ = шли
ГАА и ГАГ = лес
ААУ = зал
АУУ = мал
УУГ = пес
УУА и УАА = оба
ГЦГ и ГЦЦ = яма
УГГ = там
АГУ и АГЦ = хор
Мой словарь чрезвычайно ограничен, в нем всего 20 слов по аналогии с 20 аминокислотами. Некоторые из этих слов закодированы единственным кодоном («жук» закодирован ЦУЦ). Другие слова (кот, ест, уху и т. д.) закодированы более чем одним кодоном, точно так же как и в генетическом коде. Вы можете спросить, почему в природе сформировалась система, где используется так много кодонов (64), чтобы зашифровать всего 20 слов (аминокислот). Неужели код нельзя организовать более изящным способом?
Эта кажущаяся неказистость – одна из тех вещей, которые всегда ставят физиков вроде Гамова в тупик. Если вы знаете уравнения Максвелла, вы можете решить проблему классической физики. Но в биологии действует только одно правило: «Главное, чтобы работало». Как только система, какой бы заумной она ни казалась, начинает хорошо функционировать, она закрепляется в процессе эволюции и ее практически невозможно изменить. И неважно, что хороший инженер мог бы сделать это устройство проще и эффективнее.
Теперь, когда мы знаем, как перевести сообщение из последовательности кодонов в содержательный текст, нам надо понять, где начинать чтение и где его заканчивать. Следует ли начать с левого конца, прочтя ГУА как «шли», и продолжить чтение до правого конца строки? Это может показаться разумным, но у природы есть другой способ. Триплет АУГ используется для обозначения начала предложения. Соответствующее правило для нашего словаря означает, что предложение должно начинаться со слова «ура», которое закодировано как АУГ. То есть мы просто просматриваем последовательность слева направо в поисках первого АУГ, а затем оттуда начинаем читать с помощью словаря.

Все идет хорошо, пока мы не наткнулись на кодон УАГ, которого нет в нашем словаре. Ах да, нам нужен еще один триплет, чтобы обозначать конец предложения – точку[25]. Так и сделаем.
УАГ = конец предложения = точка
Теперь наша расшифровка завершена:

Когда мы определили старт– и стоп-кодоны (АУГ и УАГ), разделять кодоны пробелами уже нет необходимости. Если у нас есть последовательность мРНК в виде непрерывной строки букв и мы знаем, что надо читать по три буквы за раз, то мы все равно получим нужную информацию.

Хотя Гамов предложил триплетную природу кода, на протяжении 1950-х гг. это оставалось лишь хорошей догадкой. А в 1961 г. Фрэнсис Крик со своими коллегами провел остроумный эксперимент с мутациями в гене фага, вызванными акридиновыми красителями, и окончательно доказал наличие триплетов[26]. Акридиновые красители – плоские молекулы, похожие на основания ДНК. Они встраиваются в двойную спираль, и при удвоении молекулы ДНК их ошибочно принимают за основания, что приводит к вставке неправильных оснований в дочернюю цепь. Представьте себе книги, расположенные в ряд на книжной полке. Если вы втиснете туда еще одну книгу, то все другие должны сдвинуться на одну позицию, чтобы вставленная книга поместилась. А если вы добавите две книги, то остальные сдвинутся на толщину этих томов.
С помощью нашей лингвистической аналогии можно продемонстрировать, как такие вставки могут повлиять на сообщение и как множественные вставки подтверждают идею триплетного кода. Начнем с нашего гипотетического сообщения. Я выделил старт– и стоп-кодоны курсивом:

А вот что происходит, если из-за акридинового красителя в случайное место будет вставлена У (выделено подчеркиванием):

Наше предложение начинается правильно, но вставка У сдвигает рамку считывания. Мы называем это «мутацией со сдвигом рамки». В геноме человека такие мутации происходят довольно часто и могут приводить к неприятным результатам, например к муковисцидозу, болезни Крона и болезни Тея – Сакса. Сдвиг рамки так опасен потому, что после вставки получается бессмысленный набор слов. Более того, кодон УАГ, который раньше обозначал конец предложения, теперь не прочитывается, поэтому бессмысленное предложение все продолжается и продолжается. Если бы эта мРНК кодировала белок, то он был бы бесполезным.
Давайте теперь посмотрим, что произойдет, если мы добавим две молекулы акридинового красителя, приведя к вставке двух оснований. Это так же разрушительно, как и вставка одного основания:

В данном случае сдвиг рамки считывания привел к появлению стоп-кодона УАГ в правом конце строки, но полученное предложение все равно бессмысленно. Если бы это была мРНК, то измененный белок опять же оказался бы бесполезен.
И, наконец, давайте обратимся к последствиям вставки трех оснований:

Если код триплетен, как показано, то в предложении появляется лишнее слово «или», но остальные слова на месте. В целом предложение более или менее можно понять.
Именно это показал Крик с коллегами, подтвердив, таким образом, исходную гипотезу Гамова. Вставка одного основания была фатальна. Двух – тоже фатальна. Но вставка трех более или менее сохраняла функциональность! То есть кодоны должны были быть образованы группами из трех оснований.
ВЗЛОМ КОДАГамов и его Клуб РНК-галстуков предположили, что генетический код трехбуквенный, а РНК, вероятно, выступает связующим звеном между ДНК и белками. Бреннер, Жакоб и их коллеги подтвердили второе предположение – убедительно идентифицировали мРНК, которая переносит информацию из нашей ДНК в клеточные фабрики по производству белков – рибосомы. Но мы все еще не могли прочитать эту информацию. К началу 1960-х гг. генетический код так и не был расшифрован – пока за дело не взялся молодой ученый Маршалл Ниренберг.
В 1959 г. Ниренберг получил должность независимого исследователя в Национальном институте артрита и метаболических заболеваний[27] в Бетезде (штат Мэриленд). Прежде чем заняться биохимией и защитить в этой области диссертацию, Ниренберг выполнил магистерскую работу во Флоридском университете на ручейниках – насекомых, чьи личинки живут в воде, а взрослые особи напоминают мотыльков. Возможно, Ниренберг не хотел признавать, что начал свою научную карьеру, работая с букашками, так как впоследствии он опустил этот факт в своей нобелевской лекции. Ниренберг смело предпринял попытку взломать генетический код. Он мало общался с ведущими авторитетами в этой области и никогда не получал шерстяной РНК-галстук. В отличие от Гамова, полагавшегося только на перо и бумагу, Ниренберг решил подступиться к проблеме кода как экспериментатор, с помощью биохимии. Для этого требовалось воссоздать в пробирке процесс синтеза белка, когда белок получается на основе мРНК.
Ниренберг опирался на революционное достижение коллег-биохимиков из Массачусетской больницы общего профиля (MGH) в Бостоне – Элизабет Келлер и Пола Замечника, которые разработали метод синтеза белков вне клетки с помощью компонентов, выделенных из печени крысы[28]. Замечник и другие авторы впоследствии показали, как то же самое можно делать и с экстрактом клеток кишечной палочки. Эту разработку и применил Ниренберг. Если описывать кратко, его подход заключался в том, что клетки бактерии разрушались, чтобы получить неочищенные рибосомы, а затем к ним добавляли разные последовательности РНК в качестве матрицы для синтеза белка[29]. Пройдя несколько раз по ложному следу, Ниренберг и его сотрудник Генрих Маттеи наконец столкнулись с тем, что простая молекула РНК, состоящая только из У, так называемая поли(У), определяет синтез белка, в состав которого входит лишь аминокислота фенилаланин. Прелесть молекулы поли(У) была в том, что, откуда бы рибосома ни начинала считывать информацию, получался один-единственный вариант триплета – УУУ, который неизменно кодировал фенилаланин. Так впервые был разгадан один из элементов генетического кода: УУУ кодирует фенилаланин[30].
После этого стал понятен дальнейший путь: скармливать рибосомам различные последовательности РНК и смотреть, какие белки получаются. Выяснилось, что поли(Ц) и поли(А) кодируют соответственно полипролин и полилизин. Таблица расшифрованных значений кодонов росла: три были найдены, оставалось определить еще 61. Безусловно, первые три кодона были простыми, потому что все буквы в каждом кодоне были одинаковыми. Для более сложных вариантов кодонов требовался другой подход.
И тут на сцене появился Гобинд Корана[31]. Он родился в бедной индуистской семье в Райпуре, который сейчас часть Пакистана, а тогда относился к Индии. Корана учился в Англии и Швейцарии. Впервые он получил известность благодаря работам в области изучения генетического кода, когда был профессором в Висконсинском университете в Мадисоне. Корана со своей группой изобрел метод химического синтеза ДНК, при котором нуклеотиды присоединялись к процессу по одному. Затем он использовал недавно открытый фермент, который синтезировал копию РНК с ДНК[32]. Красота этого метода заключалась в том, что он позволял очень точно задать последовательность ДНК и, соответственно, скопированной с нее молекулы РНК. Эти РНК помещали в систему синтеза белка в искусственных условиях, где они работали как матрицы для синтеза соответствующей последовательности аминокислот[33]. Корана получал все возможные комбинации трех оснований, скармливал их системе синтеза белка в искусственных условиях и анализировал, какие цепочки аминокислот образуются в результате. Таким образом, он помог заполнить таблицу генетического кода, за что в 1968 г. разделил Нобелевскую премию по физиологии и медицине с Маршаллом Ниренбергом[34].
Когда Гамов прочитал об этих открытиях в новостях, он обрадовался, что проблема кода наконец решена, хотя и не мог удержаться от выпада в адрес экспериментального подхода. «Это решение выглядит значительно менее элегантным, чем простая теоретическая корреляция, которую я изначально мысленно представлял, – сказал он. – Но у него есть неоспоримое преимущество – оно верное»[35].
МАЛЕНЬКАЯ РНК С ВАЖНОЙ ЗАДАЧЕЙРасшифровка кода, используемого мРНК для записи структуры белков, была огромным достижением, но без ответа оставался еще один большой вопрос. Наличие кода важно, но что потом? Должен совершаться процесс, который «прочитывает» всё, что закодировано. Как же мРНК обеспечивает расстановку аминокислот в нужной последовательности, чтобы они соединились и получился белок?
Фрэнсис Крик в 1955 г. пришел к ответу на этот вопрос путем умозаключений, и его предположение стало беспрецедентным триумфом теоретического подхода в биологии. Он вообразил не описанный ранее класс молекул, руководствуясь исключительно убеждением, что они должны представлять собой недостающее звено в большой системе генетического кода[36]. Так Крик предсказал существование группы «адаптерных молекул», у которых по два конца. Одним концом каждая молекула соединена с какой-либо из 20 аминокислот. Другой конец должен распознавать соответствующий триплетный кодон на мРНК и связываться с ним[37].
Эти адаптеры, соединяющие аминокислоты и мРНК, можно сравнить с переходниками, с помощью которых разные электронные устройства подключаются к розеткам. Чтобы зарядить наушники, вам нужен правильный переходник для нужной вилки, форма которой зависит от того, находитесь вы в США, Великобритании или Германии. С аминокислотами то же самое, что и с наушниками. У вас есть розетка (триплетный кодон) и подходящая к ней трехштырьковая вилка – антикодон. Поскольку кодон и антикодон комплементарны друг другу, они соединяются за счет связей между парами оснований. И, подобно удлинителю, вмещающему несколько розеток, молекулы-адаптеры выстраиваются в ряд, соединяя кодоны мРНК с соответствующими аминокислотами, так что получаются растущие цепочки, которые в итоге обеспечивают образование белков. По крайней мере, такова была гипотеза Крика.

Фрэнсис Крик предположил, что каждый триплетный кодон на мРНК (снизу) должен быть распознан некой «адаптерной молекулой», несущей соответствующую аминокислоту, например лизин или валин, показанные на рисунке. Это можно сравнить с зарядными кабелями для телефонов и наушников, которые выступают в качестве переходников, соединяя трехштырьковую розетку и электронное устройство
Однако чистая теория может завести нас слишком далеко. Кто-то должен был отправиться в лабораторию и проверить, можно ли найти такие молекулы-адаптеры. Этим кем-то стал Пол Замечник, разработавший метод синтеза белка, благодаря которому Ниренберг и открыл первый кодон. Замечник предварительно пометил аминокислоты радиоактивным изотопом углерода, чтобы можно было их отследить, – примерно так действуют банки, когда прячут в мешки с деньгами взрывающуюся капсулу с краской, чтобы выявить купюры, если их украдут. Когда Замечник добавил эти радиоактивные аминокислоты в свою систему синтеза белка в искусственных условиях, случилось нечто удивительное. РНК малого размера стали радиоактивны. Это означало, что аминокислоты присоединились к РНК. Никто прежде такого не наблюдал, но это именно то, что должно было бы произойти, если бы существовали РНК, выполняющие функцию адаптеров между кодонами и аминокислотами[38]. Позднее эти малые молекулы получили название транспортные РНК (тРНК), потому что они переправляют нужную аминокислоту к белковой цепи, растущей внутри рибосомы. И, как мы увидим еще неоднократно, тРНК хоть и мелкие, но могущественные молекулы.

