Полная версия
Логика случая. О природе и происхождении биологической эволюции
Аналогично методу НЭ, в методе наибольшего правдоподобия (НП) оцениваются переходы между состояниями признаков и выбираются деревья, набравшие наибольший вес. В отличие от метода НЭ, метод НП является параметрическим статистическим подходом, который использует детальную модель эволюции признака для оценки вероятности данных на основе имеющегося эволюционного дерева. Дерево, которое имеет наибольшую вероятность возникновения наблюдаемых данных, признается наиболее вероятным. Метод НП зачастую производит деревья, аналогичные тем, которые получаются методом НЭ, но теоретически он предпочтительнее, будучи (в отличие от НЭ) статистически более достоверным (то есть при наличии достаточного количества данных гарантирует получение наиболее правдоподобного дерева). На практике метод НП часто превосходит метод НЭ. Методы НП чрезвычайно затратны с вычислительной точки зрения и непрактичны при работе с большими наборами данных. Таким образом, методы НП зачастую используются для оптимизации предварительных деревьев, полученных методом объединения ближайших соседей и методом Фитча. Для тех же филогенетических исследований, где точность построения дерева важнее скорости, следует выбирать методы НП. Более того, недавние алгоритмические достижения более чем на порядок ускорили построение филогенетических деревьев методами НП без серьезных потерь точности (Price et al., 2010).
Байесовский подход
Подобно методу НП, этот подход использует функцию правдоподобия, но прибегает к теореме Байеса с целью связать апостериорную вероятность дерева с правдоподобием данных и априорную вероятность дерева с эволюционной моделью. В отличие от методов НЭ и НП, которые выводят наилучшее дерево или набор деревьев, методы байесовского вывода выбирают деревья пропорционально их правдоподобию и определяют представительный набор деревьев. Метод хорошо работает для относительно небольших объемов данных, но непрактичен для больших.
Проверка точности филогенетических методов и достоверности деревьев
Модельные деревья
Филогенетические методы постоянно проверяются на искусственно смоделированных данных, для которых известна точная история эволюции. Методы сравниваются по критерию точности реконструкции топологии для искусственно построенных деревьев. Как правило, различные методы НП и байесовские методы превосходят все остальные для небольших наборов данных. Наилучшие результаты показывают итерационные методы, которые используют исходное дерево, построенное по методу НП, чтобы выравнивать данные, перестраивать дерево и повторять так до сходимости.
Бутстреппинг
Наиболее часто используемый тест на надежность топологии филогенетического дерева, при котором рассматриваются выборки данных (колонки выравнивания) и дерево оценивается по большому числу выборок. Процент выборок (то есть репликаций), в которых реконструируется данный узел дерева, называют уровнем поддержки. Статистика бутстреппинга еще не полностью разработана, поэтому пороговые значения для «достаточно высокого» уровня поддержки определяются путем моделирования или эмпирического анализа и могут варьировать в зависимости от целей конкретного исследования (например, значения более 90 процентов, или более 70 процентов; поддержка ниже 50 процентов обычно не считается надежной).
Статистические критерии проверки филогенетических гипотез (топологий деревьев)
Для сравнения правдоподобия различных топологий деревьев, выводимых из одного и того же набора данных, разработаны статистические критерии, основанные на различных моделях правдоподобия (самые известные – критерий Кишино – Хасегавы и приблизительно несмещенный критерий).
Когда исследователь интересуется филогенетическим сродством конкретного таксона, соответствующая ветвь переносится в различные положения в дереве, при сохранении топологии остальных ветвей, и правдоподобие каждого из полученных деревьев сравнивается при помощи статистических критериев с правдоподобием исходного дерева, полученного методом НП. Разновидность этого критерия применяется к деревьям с ограничениями, используемым для проверки филогенетических гипотез, таких как монофилия определенной группы (например, архей) в определенном наборе данных. В этом случае сравнивается правдоподобие дерева с ограничениями (монофилия в данном примере) с правдоподобием исходного НП-дерева.
Часто встречающиеся аномалии филогенетического анализа
Ни один филогенетический метод не застрахован от аномалий, которые часто оказывают заметное влияние на топологию дерева. Двумя основными классами филогенетических аномалий являются гомоплазия и притяжение длинных ветвей (ПДВ). Гомоплазия включает в себя параллельные, сходящиеся и обратные мутации, которые филогенетически не информативны и неверно истолковываются филогенетическими методами. ПДВ называется чрезвычайно распространенный случай, когда длинные ветви (быстро эволюционирующие линии) в дереве кластеризуются вместе только потому, что ни одна из них не проявляет сродства к другим группам, а не потому, что они на самом деле образуют монофилетическую группу. Филогенетики также иногда говорят о притяжении коротких ветвей, то есть ошибочной кластеризации коротких ветвей дерева. Разработка новых методов филогенетического анализа в большой степени побуждается необходимостью преодолеть эти аномалии, сохраняя притом вычислительный метод приемлемым с практической точки зрения.
Общие производные признаки
Важным подходом филогенетического анализа, дополняющим традиционные молекулярные филогенетические методы, является анализ общих производных признаков (так называемых синапоморфий), которые могут быть использованы для разграничения монофилетических групп (клад). Синапоморфии суть признаки, объединяющие всех членов монофилетической группы и исключающие все другие виды. В принципе одна достоверная синапоморфия может определять кладу. Однако это верно только в отсутствие гомоплазии, которую невозможно исключить для большинства признаков. Предполагаемые синапоморфии выбираются таким образом, чтобы свести вероятность гомоплазии к минимуму, например уникальные вставки в консервативных генах, в частности вставки мобильных элементов, мутации, которые требуют нескольких нуклеотидных замен, и слияния генов. В филогеномике идет активный поиск подобных редких геномных изменений. Одних синапоморфий часто недостаточно для несомненных филогенетических выводов, но они предоставляют дополнительные свидетельства для филогений, основанных на геномных последовательностях.
Деревья, не основанные на геномных последовательностях
Филогенетические методы пригодны не только для выравнивания гомологичных последовательностей, но и для анализа дистанционных матриц, полученных полногеномным сравнением любого числа других признаков (таких как содержание общих генов или оперонная организация). Например, в случае содержания общих генов расстояние между двумя геномами определяется как Dij = nij/ni, где nij – число генов, общих для двух геномов, а ni – полное число генов в меньшем геноме. Геномные деревья, полученные этим методом, обычно не являются надежными филогениями из-за обширной гомоплазии. Однако эти деревья могут быть информативными для сравнения образа жизни организмов.
Нейтральная теория молекулярной эволюции
Вероятно, важнейшим прорывом в эволюционной биологии после СТЭ стала нейтральная теория молекулярной эволюции. Как правило, ее связывают с именем Мото Кимуры (Kimura, 1983), хотя Джукс и Кинг одновременно и независимо развивали аналогичные идеи. Вначале нейтральная теория развивалась как логическое продолжение популяционно-генетических идей Райта, основанных на важности генетического дрейфа в эволюции. Согласно нейтральной теории, значительное большинство всех фиксируемых в процессе эволюции мутаций являются относительно нейтральными; таким образом, фиксация возникает на основе случайного дрейфа. Следствием этой теории, неоднократно подчеркиваемым Кимурой, является то, что геномная последовательность эволюционирует равномерно, как по часам (в подтверждение исходной гипотезы молекулярных часов Цукеркандля и Полинга), при этом полезные мутации, подверженные естественному отбору, настолько редки, что ими можно с успехом пренебречь в целях количественного описания эволюционного процесса. Естественно, нейтральная теория отнюдь не подразумевает, что естественный отбор не важен для эволюции. На самом деле теория подчеркивает, что доминирующим способом отбора является не дарвиновский позитивный отбор на основе адаптивных мутаций, а отсекающий (очищающий) отбор, который удаляет вредные мутации, в то же время допуская фиксацию нейтральных мутаций путем генетического дрейфа.
Последующие исследования довели эту теорию до более реалистичной формы: чтобы зафиксироваться, мутация должна быть не в буквальном смысле нейтральной, а всего лишь достаточно мало вредной, чтобы избежать немедленного удаления отсекающим отбором. Современная теория «почти нейтральных» мутаций была разработана в первую очередь Томоко Отой (Ohta, 2002). То, какие мутации распознаются как вредные при вычищении отбором, в большой степени зависит от величины популяции: в небольших популяциях в ходе генного дрейфа могут зафиксироваться даже существенно вредные мутации, тогда как в больших популяциях даже малого негативного эффекта будет достаточно для удаления мутантной аллели (см. табл. 1–1).
Главной эмпирической проверкой теории (почти) нейтральных мутаций является измерение постоянства скорости эволюционного процесса в семействах генов. Несмотря на то что зачастую можно наблюдать значительную дисперсию молекулярных часов, такие измерения с уверенностью показывают, что доля нейтральных мутаций среди зафиксированных и в самом деле весьма существенна (Bromham and Penny, 2003; Novichkov et al., 2004). Теория почти нейтральных мутаций является значительным отступлением от селекционистской парадигмы СТЭ, поскольку однозначно утверждает, что большинство мутаций, зафиксированных в ходе эволюции, не подвержены дарвиновскому (позитивному) отбору. Хотя Дарвин и предвидел нейтралистскую парадигму, утверждая, что для целей классификации лучше всего подходят селективно нейтральные характеристики, однако он не развил эту прозорливую идею, и она, таким образом, не стала частью СТЭ.
Важно отметить, что в ходе последующего развития «нейтральной» теории Кимура, Ота и другие осознали, что те мутации, которые были почти нейтральными во время их фиксации, не были в то же время не важными для эволюции. Напротив, такие мутации составили резервуар вариаций (почти нейтральную сеть аллелей), который может использоваться естественным отбором в свете меняющихся условий среды, – феномен, важный как для микро-, так и для макроэволюции (Kimura, 1991). Эта идея стала ключевой для некоторых позднейших открытий в эволюционной теории, мы обсудим ее более детально позднее в этой книге (в частности, в гл. 8 и 9).
Измерение естественного отбора сравнением последовательностей ДНК
Несмотря на всю свою важность, дарвиновский естественный отбор является концепцией, определенной в качественных терминах. В рамках же популяционной генетики и СТЭ отсекающий и положительный отбор оказались более конкретными и математически определенными. В описании СТЭ отбор скорее можно приравнять к силе в классической механике или потоку в классической термодинамике, то есть к феноменологически определяемому количеству. С появлением сравнения последовательностей ДНК стало возможно обнаруживать и измерять отбор в определенных механистических терминах, базируясь на подсчете различных типов замещений нуклеотидов. Для измерения отбора путем сравнения последовательностей используются две очень простые идеи (см. табл. 2–2). Эти два подхода имеют в своей основе очень много общего, поскольку оба определяют два класса сайтов, один из которых принимается в качестве фона нейтральной эволюции. Первый метод заключается в сравнении числа замен нуклеотидов в позициях, важных с точки зрения кодирования аминокислот (несинонимичные позиции), и в позициях, которые, из-за избыточности генетического кода, не имеют значения для кодирования белков (синонимичные замены). Если отношение скоростей несинонимичных и синонимичных замен (Ka/Ks, см. табл. 2–2) значительно ниже 1, то эволюция соответствующего гена в основном определяется отсекающим отбором, направленным на данную последовательность белка; напротив, в случае Ka/Ks > 1 эволюция определяется в основном положительным дарвиновским отбором (см. табл. 2–2). Второй, более точный подход использует так называемый критерий Макдональда – Крейтмана для измерения отбора, при котором соотношение Ka/Ks сравнивается для внутривидовых вариантов (полиморфизмы) и межвидовых вариантов (фиксированные мутации). Поскольку незафиксированные полиморфизмы в основном нейтральны, то межвидовое отношение Ka/Ks должно быть значительно меньше, чем Ka/Ks для полиморфизмов в случае отсекающего отбора, и значительно больше, чем значение для полиморфизмов в случае положительного отбора.
Таблица 2–2. Измерение отбора путем анализа последовательностей белок-кодирующих генов (Hurst, 2002; Li, 1997)
Белок-кодирующие последовательности состоят из двух видов сайтов:
• синонимичные, в которых замены не влияют на последовательность кодируемых аминокислот;
• несинонимичные, в которых замены ведут к заменам аминокислот.
Отношение Ka/Ks (где Ka – частота несинонимичных замен, Ks – синонимичных; обе вычисляются с коррекцией на множественные замены) является количественной мерой отбора, действующего на уровне белковых последовательностей.
Ka/Ks = 1 – нейтральная эволюция белковой последовательности (кодируемый белок не подвергается отбору).
Для большинства белок-кодирующих генов Ka/Ks ≪ 1 – отсекающий отбор.
Для прокариот типично Ka/Ks < 0,1.
Для эукариот типично Ka/Ks ≈ 0,1–0,2.
• Ka/Ks > 1 – положительный отбор; достаточно редко встречается для белок-кодирующих генов, но для некоторых категорий генов, несомненно, наличествует, например для генов, участвующих в антипаразитической защите или в сперматогенезе, а также в вирусных белках, таких как гемагглютинин вируса гриппа.
• Для измерения Ka/Ks для индивидуальных сайтов используют методы наибольшего правдоподобия; большинство белоккодирующих генов содержат несколько сайтов, подверженных положительному отбору.
• Использование Ka/Ks для измерения уровня отбора предполагает нейтральность синонимичных сайтов.
• Однако Ka и Ks положительно коррелируют между собой – таким образом, отбор затрагивает и синонимичные сайты.
• Некодирующие сайты, такие как интронные последовательности, могут использоваться как фон нейтральной эволюции при измерении отбора на синонимичных сайтах (Ks/Ki, где Ki – частота замен для интронных сайтов).
• Критерий Макдональда – Крейтмана (Aquadro, 1997; McDonald and Kreitman, 1991) широко используется для измерения отбора. Он сравнивает внутривидовые вариации (частота полиморфизма, P) с межвидовыми вариациями (дивергенция, D).
• Dn/Ds = Pn/Ps – нейтральная эволюция белковой последовательности.
• Dn/Ds < Pn/Ps – отсекающий отбор.
• Dn/Ds > Pn/Ps – положительный отбор.
Появление таких количественных подходов к анализу отбора примечательно не только благодаря их технической применимости в изучении эволюции: они также являются признаком фундаментальных изменений в способах осмысления отбора биологами. Дарвиновская качественная идея, которая была выражена в абстрактной математической форме Фишером и впервые измерена с использованием генетических методов Добржанским и его учениками, теперь превратилась в прямо измеряемую статистическую характеристику ансамблей нуклеотидных сайтов. Такая трансформация концепции отбора сродни тому, как классическая термодинамика с ее абстрактными потоками превратилась в статистическую физику Больцмана и Гиббса (см. гл. 4).
Эгоистичные гены, мусорная ДНК и мобильные элементы
Хоть это и редко утверждается без обиняков, классическая генетика предполагает, что почти все части генома (все нуклеотиды, если употреблять более современные, молекулярные термины) имеют определенные функции. Это неявно выраженное утверждение также важно и с точки зрения СТЭ, с ее панадаптационистским подходом. Однако это понимание подверглось сомнению еще в 1960-х и 1970-х годах по мере накопления данных об отсутствии прямой связи между размером генома и фенотипической сложностью организма. Даже с использованием приблизительных методов, доступных в то время, становилось ясно, что организмы с примерно одинаковым уровнем фенотипической сложности зачастую имеют геномы, на порядок различающиеся по размеру (так называемый парадокс гаплоидной величины). Этот парадокс был концептуально разрешен с помощью двух связанных друг с другом фундаментальных идей: эгоистичных генов и мусорной ДНК[21]. Концепция эгоистичных генов была предложена Ричардом Докинзом в одноименной книге, изданной в 1976 году (Dawkins, 2006). Резко отступив от организм-центричной парадигмы СТЭ, Докинз приходит к выводу, что естественный отбор может действовать не только на уровне организма в целом, но и на уровне индивидуального гена. Этот взгляд, поданный в умышленно провокационной манере, представляет геномы и организмы, по сути, средствами размножения генов.
Концепция эгоистичных генов породила множество важных выводов, и некоторые из них мы рассмотрим ниже в этой книге. Один из аспектов, имеющий непосредственное отношение к парадоксу гаплоидной величины, был всесторонне рассмотрен Фордом Дулиттлом и Кармен Сапиенцей (Doolittle and Sapienza, 1980), а также Лесли Оргелом и Фрэнсисом Криком (Orgel and Crick, 1980). Они предположили, что немалая или даже основная часть геномной ДНК (по крайней мере в сложных многоклеточных организмах) состоит из различных классов повторов, которые образуются в результате амплификации эгоистичных элементов – абсолютных паразитов, говоря хлестким языком Оргела и Крика. Другими словами, с точки зрения организма, большая часть геномной ДНК должна быть признана избыточной. Такой взгляд на геном в корне отличается от панселекционистской парадигмы, присущей СТЭ, в рамках которой большинство или даже все нуклеотиды в геноме подвержены влиянию отсекающего или положительного отбора, действующего на уровне организма.
Концептуально родственным важным открытием стало обнаружение транспозонов, или «прыгающих генов», сначала Барбарой Макклинток в 1940-х годах в растениях, а затем и в животных. Эти транспозоны стали затем известны как мобильные элементы (то есть генетические элементы, которые имеют тенденцию часто менять свое место в геноме; McClintock, 1984). Демонстрация вездесущности мобильных элементов привела к концепции высокодинамичных, постоянно меняющихся геномов задолго до рождения современной геномики[22].
Эволюция путем дупликации генов и геномов: ортологи и паралоги
СТЭ в полной мере унаследовала центральное положение дарвиновской теории, провозгласившей постепенные малые изменения единственно возможным материалом для эволюции. Однако эта концепция была поставлена под сомнение альтернативной концепцией эволюции дупликацией гена, разработанной Сусуму Оно в его классической книге 1970 года (Ohno, 1970). Мысль о том, что дупликация частей хромосом может служить одной из движущих сил эволюции, восходит к основателям современной количественной генетики, в частности к Фишеру и Холдейну[23]. Однако Оно первым предположил, что дупликация генов является основой эволюции геномов и организмов, и первым подвел качественную теорию под это положение. Начав с цитогенетических свидетельств полногеномной дупликации (ПГД) в начале эволюции хордовых, Оно выдвинул гипотезу о том, что дупликация генов является важным, если не единственным, путем эволюционии новых биологических функций. Согласно гипотезе Оно, дупликация гена высвобождает одну из копий от ограничений отсекающего отбора и, таким образом, эта копия получает потенциал развития новой функции (феномен, позднее названный неофункционализацией). Очевидно, что возникновение нового гена в результате дупликации, не говоря уже о дупликации геномного участка или ПГД, является огромным отличием от дарвиновских ничтожно малых изменений. Если такие крупные события в самом деле являются ключевыми для эволюции, то парадигма постепенных изменений в опасности. Позднейшие исследования дупликации генов, обсуждаемые далее в этой книге (см. гл. 8 и 9), привели к предположению о том, что неофункционализация вряд ли является основным путем эволюции дуплицированных генов. Однако факт остается фактом: дупликация, как важнейший механизм эволюции, бросает вызов градуализму.
Примерно в то же время, когда была издана книга Оно об эволюции путем дупликации генов, Уолтер Фитч опубликовал весьма плодотворную статью, всю значимость которой стало возможным оценить лишь в свете более поздних достижений геномики. Фитч исследовал понятие гомологии (общего предка) генов и провел различие между двумя классами гомологичных генов: ортологами и паралогами (Fitch, 1970). Ортологи – это гены, которые эволюционировали вертикально от одного предкового гена, принадлежащего общему предку сравниваемых организмов, тогда как паралоги – гены, эволюционировавшие в результате дупликации. Понятия ортологии и паралогии очевидным образом тесно связаны между собой и зависят от конкретной топологии филогенетического дерева данного семейства генов, так что дупликация в определенном узле дерева порождает новый набор паралогов в поддереве-потомке (подробнее см. в гл. 3). Более того, концептуальное определение паралогии осложнено специфичными для каждой линии эволюции потерей и горизонтальным переносом генов (см. гл. 5 и 7). Тем не менее, если не принимать во внимание эти осложнения, классификация гомологов Фитча остается центральной для эволюционной геномики[24].
Прерывистое равновесие и несостоятельность градуализма
Недостача межвидовых переходных форм в палеонтологической летописи – постоянная тема эволюционной биологии. Дарвин осознавал эту проблему и традиционно считал ее (так же как и палеонтологи, следующие дарвиновским традициям) следствием драматической неполноты этой летописи. Однако обширное накопление палеонтологических данных в XX веке мало помогло (если не сказать совершенно не помогло) в решении этой проблемы, что привело к возникновению иной точки зрения, сначала с появлением концепции квантовой эволюции Джорджа Гэйлорда Симпсона, затем оформившейся в концепцию прерывистого равновесия Стивена Джея Гулда и Нильса Элдриджа (Eldredge and Gould, 1997; Gould, 2002). Гулд и Элдридж собрали обширную доказательную базу, свидетельствующую о том, что история большинства видов животных, отраженная в палеонтологической летописи, соответствует в основном состоянию покоя – то есть, фактически, отсутствия изменений. Состояние покоя (стасис) перемежается «внезапным» исчезновением видов, последовательно замещаемых новыми. Следствием такой модели является очень быстрое в сравнении с продолжительностью стасиса видообразование; возникновение новых видов в определенной области является следствием миграции из области видообразования; градуалистское видообразование (постепенная трансформация видов в новые) – довольно редкий процесс. Такая модель прерывистого равновесия кажется применимой и к эволюции высших таксонов и зачастую обобщается до несостоятельности градуализма в целом, хотя правомерность такого вывода часто подвергается критике.
Пандативы, экзаптация, эволюция как ремесленник и ошибочность панглоссианской парадигмы эволюции
Пусть и неявно, но принципу градуализма был брошен вызов гипотезой Оно об эволюции генов и геномов путем дупликации, a затем, в явной форме, концепцией прерывистого равновесия. Адаптационистская программа эволюционной биологии подверглась решительной, сметающей все на своем пути атаке в статье 1979 года «Пандативы Святого Марка» Гулда и Левонтина (Gould and Lewontin, 1979), одной из самых необычных и влиятельных статей в истории биологии. Гулд и Левонтин саркастически описали адаптационистскую картину мира как панглоссианскую парадигму, названную так в честь примечательного персонажа вольтеровского «Кандида», который утверждал, что «все к лучшему в этом мире» [пер. Ф. Сологуба] (даже катастрофы). Гулд и Левонтин подчеркивали, что вместо того, чтобы стряпать на скорую руку «сказки просто так»[25] о правдоподобных адаптациях, эволюционным биологам следовало бы искать объяснение наблюдаемых черт организации биологических организмов исходя из плюралистского подхода, который принимает во внимание не только отбор, но также и внутренние ограничения, случайный дрейф и другие факторы. Метафора пандатива означает, что многие функционально важные элементы биологической организации вовсе не эволюционировали как специальные устройства для выполнения определенных функций, но скорее являются продуктами неадаптивных архитектурных ограничений, подобно пандативам (spandrels), появляющимся в арках соборов и других зданий исключительно вследствие требований конструкции, и могут использоваться для различных целей, например для украшения собора (см. рис. 2–2). Процессу использования пандативов в биологии было дано специальное название экзаптация, и Гулд провозгласил его важным путем эволюции (Gould, 1997a). Концепция пандативов связана с почти нейтральной теорией, но в каком-то смысле идет дальше и подходит ближе к сути эволюционного мышления, показывая, что даже те фенотипические черты, которые выглядят как типичные адаптации, не обязательно эволюционировали под давлением естественного отбора.