Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Повторы в геномах бактерий; связь с эволюцией






Г. Б. Смирнов

НИИ эпидемиологии и микробиологии им. Н.Ф. Гамалеи РАМН, Москва

E-mail: smirngb@yandex.ru

Общие положения.

Для того чтобы функционировать, ДНК геномов должна взаимодействовать с белками. Это нужно для обеспечения самых разнообразных механизмов регуляции активности оперонов и отдельных генов, для репликации, репарации и, конечно, рекомбинации. Рекомбинация, в свою очередь, совершенно необходима для осуществления перестроек геномов, без которых невозможно себе представить эволюцию. Взаимодействия белков и ДНК происходят не по всей длине её молекулы, а в избранных специфических местах, которые белки должны правильно узнавать.

Как для узнавания вообще, так и для узнавания белками ДНК, в частности, нужны какие-то признаки, определяющие отличия одного сайта от другого. Отличительным признаком, узнаваемым белками, может служить последовательность нуклеотидов как таковая. Действительно, такой механизм работает. Однако появляется всё больше и больше данных, которые говорят о том, что этот механизм не является единственным и, более того, не является мажорным. Гораздо чаще для формирования сайтов взаимодействия белков с ДНК геном использует фигуры симметрии, а именно, повторы нуклеотидных последовательностей.

Окончательной и единой классификации повторов не существует, поэтому в данной работе, в основном, будут использованы наиболее часто встречающиеся определения. В качестве первичной классификации повторов можно представить следующую.

По ориентации частей повторов их можно разделить на прямые (DR) и обращённые (IR).

По длине их можно разделить на короткие (SSR) и длинные (LR).

По расположению друг относительно друга их можно разделить на прилежащие или смежные (contiguous) и диспергированные (interspersed или SPIDR - Spacer interspersed direct repeats), иногда употребляется термин близкие повторы (СR). Одна из разновидностей первых – тандемные повторы (TR).

По расположению относительно генов их можно разделить на внутригенные (intragenic) и межгенные (intergenic).

По степени связи с другими структурами повторы можно разделить на автономные или диспергированные (FR – free repeats) и связанные с генами или элементами (EAR – element-associated repeats).

 

Настоящая работа посвящена повторам в бактериальных геномах, однако, учитывая то, что надцарство прокариот кроме бактерий содержит домен архей, представляется целесообразным в подходящих случаях обращаться к их сравнению с бактериями.

Сравнение геномов бактерий и архей показывает, что размеры большинства архейных геномов находятся в очень узком диапазоне, тогда как размеры бактериальных геномов варьируют в очень широких пределах (Рис. 1). При этом, у бактерии Carsonella rudii геном (159 662 п.о.) близок к минимально возможному для эндосимбионтов, рассчитанному на компьютере, а у Sorangium cellulosum – почти не отличается от верхнего «бюрократического» предела Ван Нимвегена, рассчитанного для свободноживущей прокариотической клетки, и составляет 13 033 779 п.о. (20).

 

Рис. 1. Диапазоны размеров геномов бактерий и архей.

По оси абсцисс: размеры геномов в млн. п.о.

По оси ординат: количество геномов.

Сплошная кривая – геномы бактерий; пунктирная кривая – геномы архей.

А – геном C.rudii; B – геном N.equitans; C – минимальный размер для свободноживущих микроорганизмов; D – основной пик размера генома для бактерий и архей; Е – минорный пик размера генома для бактерий; F – геном Nostoc punctiforme; G – геном Sorangium cellulosum; H – предел Ван Нимвегена.

Рис. 2. Схема строения сайта интеграции.

att – сайт интеграции.

О – центральная уникальная часть.

LR – левый повтор.

RR – правый повтор.

Стрелки обозначают ориентацию повторов нуклеотидных последовательностей ДНК.

 

a

               
 
Б
   
 
 
     
 

 


a b

 

 

       
 
   
 

 

 


 

 

Рис. 3. Делеции и дупликации CR (A) и SSR (Б).

Прямоугольники – повторы.

а – делеции; b – дупликации.

 

Рис. 4. Схема строения CRISPR-cas системы.

Участок ДНК между генами cas и повторами CRISPR – лидерная последовательность; спейсеры имеют различные нуклеотидные последовательности.

 

 

 

Рис. 5. Схема строения белка ActA.

SS – сигнальная последовательность;

TM – трансмембранный домен;

АP – участок, требуемый для полимеризации актина;

PRR – повторы;

LR1 и LR2 – спейсеры, гомологичные между собой;

LR3 – спейсер, не гомологичный LR1 и LR2.

 

 

У архей этого не наблюдается. Применительно к эволюционному значению диапазонов размеров геномов бактерий и архей уместны следующие соображения. То, что внешне очень похожие клетки бактерий и архей резко отличаются по этому показателю, трудно объяснить за счёт различий в условиях их существования. Известны гипер-термофильные, психрофильные, мезофильные, ацидофильные, алкалифильные, барофильные, галофильные, ксерофильные археи. Отрезок времени, в течение которого эволюционировали бактерии и археи, один и тот же. Кривые, представленные на рис.1, говорят о том, что и археи, и бактерии имели исходный геном размером почти 2 МВ. В ходе эволюции бактерии активно теряли и приобретали ДНК, в результате чего и возникло наблюдаемое в настоящее время разнообразие геномных размеров. Ничего подобного не происходило с археями, существовавшими в то же время на той же планете. Вопросу о том, как могли изменяться геномы бактерий, и как они изменяются сейчас, посвящено очень большое количество исследований (см. 2). Однако остаётся совершенно непонятным, почему бактерии создали разнообразие размеров геномов, а археи – нет. Карл Уойз – исследователь, открывший археи, писал: «Почему археабактерии и эубактерии так различны? Как нам понять эти принципиальные различия между двумя типами прокариот? Являются ли они следствием различных условий внешней среды на ранних стадиях эволюции в этих двух линиях? Отражают ли различия в организации у клеток этих двух типов различные эволюционные наклонности? Сейчас мы не в состоянии ответить на эти вопросы. Дело не в том, что просто не хватает фактов; не хватает ключевой концепции» (46). Со времени этого высказывания Уойза прошло больше 20 лет. Но мы, по-прежнему, не имеем ответов на поставленные им вопросы. 1)

Накопленные к настоящему моменту факты, на мой взгляд, неопровержимо указывают на то, что а) именно повторы обеспечивают регуляцию разнообразных генетических процессов в ходе жизненного цикла, и б) повторы являются основой наследственной изменчивости бактерий. Повторы есть и в геномах архей, но там они распределены, в основном, иным образом, нежели в бактериальных. Эти данные будут представлены ниже.

1) По современным оценкам общая биомасса архей на Земле составляет 1014 тонн, что значительно больше, чем суммарная биомасса всех живущих на Земле организмов (см. О.В. Морозова. Вестник ВОГиС, 2005, Том 9, № 1, С.55-66), и на несколько порядков превышает общую биомассу бактерий (около 2-5х1011 тонн). Такой абсолютный эволюционный успех находится в противоречии с относительно слабо выраженным видовым разнообразием архей. Количество известных видов бактерий составляет около 2 500, тогда как у архей их, как минимум, на порядок меньше. До сих пор считалось, что видовое разнообразие является одним из основных признаков эволюционной успешности. Видимо, для архей это положение несправедливо.

 

 

Геномы бактерий различных видов (а иногда даже штаммов) отличаются по наличию или отсутствию повторов определённых типов, и по количеству повторов в геноме (см. 2). Плотность повторов обратно пропорциональна размеру генома (35 ).

Несмотря на максимальную компактность бактериальных геномов и априорную направленность селекции против сохранения прямых повторов (24), практически не существует геномов, в которых вообще не было бы повторов. Достаточно сказать, что даже один из самых маленьких – геном Nanoarchaeum equitans содержит незначительное количество не кодирующих повторов (45).

Повторы могут быть диспергированными, т.е. относительно беспорядочно разбросанными по длине молекулы ДНК, или организованными в определённые структуры. К последним относятся повторы, входящие в состав мобильных элементов, сайтов интеграции геномов умеренных бактериофагов, сайтов принадлежащих интегронам или сцепленных с генами тРНК. Будем называть их «организованные повторы». Обычно общая схема строения таких повторов выглядит следующим образом: левый элемент повтора – уникальная часть – правый элемент повтора (Рис. 2). В подавляющем большинстве случаев элементы, построенные по такой схеме, содержат повторы в обратной ориентации (IR). Исключение составляет, например, Tn9. Как диспергированные, так и организованные повторы, играют первостепенную роль в процессах рекомбинации. Попытаемся оценить вклад этих разновидностей повторяющихся последовательностей в каждый из известных типов рекомбинации.

Принципиально одинаковые структуры, содержащие повторы, могут находиться как в мобильном (донорном) элементе, так и в реципиентной молекуле ДНК. В зависимости от присутствия организованных повторов в реципиентном геноме или в донорном сегменте я предлагаю разделить типы их взаимодействия на классы.

Класс I. Организованные повторы присутствуют только в структуре донорного сегмента ДНК. В этом случае специфичность интеграции низкая, т.е. количество сайтов интеграции большое и выбор сайта интеграции относительно независим от структуры реципиентной молекулы ДНК. Примеры: IS-элементы, транспозоны. (Исключение составляет интеграция Tn7 в хромосому E. coli.).

Класс II. Организованные повторы присутствуют только в структуре реципиентного сегмента ДНК. В этом случае специфичность интеграции относительно высокая, т.е. количество сайтов интеграции небольшое и зависит от структуры реципиентной молекулы ДНК. Примеры: инегроны, сайты интеграции, сцепленные с генами тРНК, возможно DUS-элементы.

Класс III. Организованный повтор присутствует в структуре как донорного сегмента, так и реципиентной ДНК. При этом, донорный и реципиентный повторы коэволюционировали и имеют структурное родство. В этом случае специфичность интеграции абсолютная, т.е. существует только один сайт интеграции в реципиентном геноме. Примеры: интеграция геномов умеренных бактериофагов.

Таким образом, мы видим, что присутствие организованных повторов в донорном сегменте или реципиентной структуре принципиально определяет результат взаимодействия этих структур. Конечно, количество сайтов интеграции внешней ДНК в геном реципиента и локализация этих сайтов имеют безусловное значение для эволюционного процесса.

Теперь рассмотрим, какое значение для геномных перестроек имеют диспергированные повторы. Эти повторы разнообразны по нуклеотидным последовательностям, размеру, количеству копий и самому наличию в геномах бактерий. Повторы являются горячими точками геномных перестроек, вовлекающих крупные сегменты генома. Такими перестройками могут быть инверсии, делеции, дупликации и транслокации. Обычно прямые повторы стимулируют делеции, дупликации и транслокации, а инвертированные повторы – инверсии (38, 37, 36).

Диспергированные повторы могут также служить и сайтами интеграции для мобильных элементов. Так, предпочтительными сайтами узнавания для транспозаз в геномах микроорганизмов различных видов оказались внегенные повторяющиеся палиндромы REP (repetitive extragenic palindromes) (41). Тем не менее, специфичность интеграции IS- элементов и большинства транспозонов достаточно низкая (23).

Роль повторов в возникновении геномных перестроек сейчас доказана, в том числе в исследованиях по сравнительной геномике близкородственных микроорганизмов. Сравнивали нуклеотидные последовательности геномов пар Mycobacterium leprae - Mycobacterium tuberculosis, Bordetella pertussis - Bordetella bronchiseptica, Bartonella quintana - Bartonella henselae, Burkholderia mallei-Burkholderia pseudomallei. Отличия между геномами членов пар во многих случаях были представлены делециями, транслокациями и инверсиями. На границах сегментов ДНК, претерпевших указанные перестройки, всегда обнаруживались те или иные повторы, IS-элементы, гены тРНК, части геномов профагов (10, 7, 27).Та же закономерность имеет место у Y.pestis: делеция 102 т.н.п. локуса pgm происходит с высокой частотой (10-4) за счёт рекомбинации между двумя копиями фланкирующих элементов IS100 (15).

Тип и локализация в геноме повторов различных типов определяют вероятность, характер и локализацию геномных перестроек. При этом, не только локализация, но и само присутствие IS-элементов в геномах не случайно. Например, максимальный размер повторов колеблется от 29 н.п. у Buchnera aphidicola до 14 317 н.п. у Xylella fastidiosa, а плотность повторов на 106 н.п. – от 12 у Chlamydia trachomatis до 5, 069 у Streptococcus pneumoniae ( 4). Различная плотность повторов определяет и различную длину участка ДНК, который может быть вовлечён в рекомбинационный акт. Средняя длина такого участка варьирует от 185 н.п. у C. trachomatis до 1, 024, 894 н.п. у цианобактерий (Nostoc sp.) ( 4). Известно, что локализация, количество и тип повторов в геномах в существенной мере видоспецифичны, соответственно, характер и частоты геномных перестроек являются относительно видоспецифичными (4).

Образование повторов.

Как возникают повторы, каковы их основные свойства и что определяет их распределение по геномам?

Геномы бактерий содержат преимущественно короткие тандемные повторы, такие как семейство " variable number of tandem repeats" (VNTR), семейство SSR и близкие повторы - семейство CR. Они могут образовываться как в результате различных вариантов неравного кроссинговера, так и ошибок репликации при редактировании (slipped strand mispairing) или репарации. Проскальзывание наблюдается при временной остановке репликативной вилки, которая сопровождается частичной денатурацией матричной и вновь синтезированной цепей ДНК и спариванию с близлежащим участком полной или частичной гомологии. Это может, в частности, привести как к делеции, так и к дупликации с образованием прямого повтора (Рис. 3) (21, см. 44).

В целом, динамика образования повторов в бактериальной ДНК выглядит следующим образом: образовавшиеся короткие повторы (CR, SSR) служат праймерами для последующей амплификации, т.е. образования тандемных дупликаций, которые в свою очередь за счёт перестроек преобразуются в диспергированные повторы (3)..

Повторы определяют тип и параметры рекомбинационных событий.

Наличие прямых повторов способствует рекомбинационным событиям типа незаконных, причём их вероятность намного выше, если повторы расположены недалеко друг от друга (8, 22 ). Отмечена также прямая зависимость между размером повтора и вероятностью рекомбинации (30, 31). Наконец, частота незаконной рекомбинации зависит от нуклеотидного состава повтора (14) и его локализации в геноме(42).

Установлено, что близко расположенные прямые повторы (close direct repeats - СDR) находятся в избытке по сравнению с повторами других типов во всех геномах. В наибольшей степени это характерно для одного из самых маленьких геномов M.genitalium.

Увеличение расстояния между повторами приводит к их стабилизации и достигается за счёт транспозиций (внедрения между повторами) и других геномных перестроек. Частота делеций частей повтора прямо пропорциональна размеру повторяющихся последовательностей и обратно пропорциональна длине спейсера, поэтому, чем длиннее стабильные повторы, тем больше должно быть расстояние между ними (8, 22, 5, 30).

Повторы, стимулирующие незаконную рекомбинацию, преимущественно представлены 4-мя классами:

- близкие повторы (CR-close repeats) – это не мультикопийные повторы из 8-10 оснований, разделённые небольшими спейсерами (32) имеют незначительный рекомбинационный потенциал; в бактериальных геномах встречаются относительно часто, причём чаще в составе генов, чем между генами;

- диспергированные повторы (SPIDR – spacer interspersed direct repeats) – это мультикопийные CR, разделённые спейсерами, которые не повторяются, т.е. разными (18);

- простые повторы (SSR-simple sequence repeats) – это очень короткие тандемные повторы из 1-5 оснований, имеющие значительный рекомбинационный потенциал, в бактериальных геномах встречаются намного реже, чем в эукариотических (44);

- TR – это тандемные повторы большей протяжённости (больше 5).

Следует отметить, что именно локализация SSR составляет одно из отличий геномов эубактерий и архей. У бактерий эти повторы располагаются, в основном, в межгенных областях, тогда как у архей - находятся преимущественно в пределах кодирующих последовательностей. Динуклеотидные повторы в геномах архей почти не обнаруживаются. Преимущественными типами архейных SSR являются три- и пентануклеотиды. Плотность повторов у архей никак не коррелирует с размером геномов. И, что очень важно, количество, плотность и тип повторов во многих случаях носят видоспецифический характер (изучены 19 видов архей) (43). Другим существенным отличием является представленность в геномах бактерий и архей повторов CRISPR (см. ниже).

Гомологическая рекомбинация у E. coli также определяется многочисленными диспергированными повторами октамера (5' - GCTGGTGG - 3'), названного последовательность Chi и узнаваемого экзонуклеазой V (RecBCD). Интересно, что у бактерий разных видов последовательности Chi отличаются, т.е. эволюционировали независимо.






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.