Интернет-журнал дачника. Сад и огород своими руками

Сколько генов содержит геном человека. Гены человека. Перекрывание генных текстов

Геном рыбы фугу примерно в восемь раз меньше, чем геном человека, и в 330 раз меньше, чем геном двоякодышащей рыбы протоптер. Какие «призраки» живут на «кладбищах геномов», и сколько мусора в нашей с вами ДНК?

Известный молекулярный биолог Дэвид Пенни из Центра молекулярной экологии и эволюции Аллена Вилсона в новозеландском Университете Массей как-то сказал: «Я бы весьма гордился работой в группе, которая разработала геном кишечной палочки. Однако я бы никогда не признался, что участвовал в проектировании генома человека. Ни в одном университете этот проект не смогли бы настолько испортить». Тема о количестве мусора в нашей ДНК - одна из самых «горячих» тем в научном сообществе. Вокруг этого вопроса среди ученых разгораются настоящие словесные баталии.

Немного молекулярной генетики

Напомним, что в основе передачи наследственной информации лежит двухцепочечная молекула ДНК. Она представляет собой полимер из четырех типов мономеров (нуклеотидов): аденина (A), тимина (T), цитозина (С) и гуанина (G) - и уложена в хромосомы. У человека 23 пары расположенных в ядре хромосом (22 пары неполовых и одна пара половых). Они и составляют основу нашего генома (еще 37 генов содержат кольцевые ДНК митохондрий). Если бы мы взяли одну клетку человека, сшили весь диплоидный (парный) набор хромосом вместе и вытянули в нить, то получили бы молекулу длиной в два метра, состоящую из шести миллиардов пар оснований (нуклеотидов). Три миллиарда от папы и три - от мамы.

Наиболее изученный тип функциональных последовательностей ДНК - гены, кодирующие белки. С таких генов считывается молекула РНК, которая затем играет роль матрицы для синтеза белков и определяет их аминокислотную последовательность. Кодирующая часть молекулы РНК может быть разделена на тройки нуклеотидов (кодоны), которые либо соответствуют некоторой аминокислоте, либо определяют место окончания синтеза белка (стоп-кодоны). Правило соответствия кодонов аминокислотам называется генетическим кодом. Например, кодон GCC кодирует аминокислоту аланин.

Померимся генами?

Когда-то думали, что у столь сложного организма, как человек, должно быть очень много генов. Когда проект «Геном человека» подходил к завершению, ученые даже устроили тотализатор: сколько генов будет обнаружено?

Каково же было их удивление, когда оказалось, что количество генов у человека и маленького круглого червя Caenorhabditis elegans примерно одинаковое. У червяка около 20 000 генов, а у нас - 20−25 тысяч.

Для «венца творения» факт довольно обидный, особенно если учесть, что существует много организмов как с бóльшим по размеру геномом (геном двоякодышащей рыбы протоптер, Protopterus aethiopicus , в 40 раз больше человеческого), так и с бóльшим количеством генов (у риса - 32−50 тысяч генов).

Но на самом деле у человека менее 2% генома кодируют какие-либо белки. Для чего же нужны остальные 98%? Может, там скрывается секрет нашей сложности? Оказалось, что существуют важные некодирующие участки ДНК. Например, это участки промоторов - последовательностей нуклеотидов, на которые садится фермент РНК-полимераза и откуда начинается синтез молекулы РНК. Это участки связывания транскрипционных факторов - белков, регулирующих работу генов. Это теломеры, защищающие концы хромосом, и центромеры, необходимые для правильного расхождения хромосом по разным полюсам клеток при делении. Известны некоторые регуляторные молекулы РНК (например, микроРНК, препятствующие синтезу белков соответствующих генов на матричной РНК - копии гена-исходника), а также молекулы РНК, входящие в состав важных ферментативных комплексов - например, рибосом, которые собирают из отдельных аминокислот белки, передвигаясь по матричной РНК. Есть и другие примеры важных некодирующих участков ДНК.

Тем не менее бóльшая часть нашего генома напоминает пустыню: повторяющиеся последовательности, останки «мертвых» вирусов, которые когда-то давно встраивались в геномы наших предков; так называемые эгоистичные мобильные элементы - последовательности ДНК, способные перескакивать из одного участка генома в другой; различные псевдогены - нуклеотидные последовательности, утратившие способность кодировать белки в результате мутаций, но все еще сохранившие некоторые признаки генов. Это далеко не полный список «призраков», обитающих на «кладбище генома».

Минимальная мышь

Существует точка зрения, что бóльшая часть генома человека нефункциональна. В 2004 году журнал Nature опубликовал статью, описывавшую мышей, из генома которых были вырезаны значительные фрагменты некодирующей ДНК размером в 0,8 и даже 1,5 млн нуклеотидов. Было показано, что эти мыши не отличаются от обычных строением тела, развитием, продолжительностью жизни или способностью оставлять потомство. Разумеется, какие-то отличия могли остаться незамеченными, но в целом это был серьезный аргумент в пользу существования «мусорной ДНК», от которой можно избавиться без особых последствий. Конечно, было бы интересно вырезать не пару миллионов нуклеотидов, а миллиард, оставив только предсказанные последовательности генов и известные функциональные элементы. Удастся ли вывести подобную «минимальную мышь», и сможет ли она нормально существовать? Может ли человек обойтись геномом длиной лишь в полметра? Возможно, когда-нибудь мы об этом узнаем. Тем временем еще один важный аргумент в пользу существования мусорной ДНК - наличие достаточно близких организмов с очень разными размерами геномов.

Геном рыбы фугу примерно в восемь раз меньше, чем геном человека (хотя генов в нем примерно столько же), и в 330 раз меньше, чем геном уже упомянутой рыбы протоптер. Если бы каждый нуклеотид в геноме был функционален, то непонятно, зачем луку геном в пять раз больший, чем у нас?

На колоссальные различия в размерах геномов сходных организмов обратил внимание эволюционный биолог Сусуму Оно. Считается, что именно Оно ввел термин «мусорная ДНК» (junk DNA). Еще в 1972 году, задолго до того, как был прочитан геном человека, Оно высказал правдоподобные представления как о количестве генов в геноме человека, так и о количестве «мусора» в нем. В своей статье «Столько мусорной ДНК в нашем геноме» он отмечает, что в геноме человека должно быть около 30 000 генов. Это число, на тот момент совсем не очевидное, оказалось удивительно близко к реальному, которое узнали десятки лет спустя. Кроме того, Оно приводит оценку функциональной доли генома (6%), объявляя более 90% генома человека мусором.


специалист по эволюционной биологии и интегративной геномике, адъюнкт-профессор канадского Университета Гэльфа в провинции Онтарио:


«Луковый тест - хорошая проверка для любого, кто думает, что каждый нуклеотид в человеческом геноме имеет определенную функцию. Независимо от того, каковы эти предполагаемые функции, спросите себя: зачем обычному репчатому луку нужен геном примерно в пять раз больше вашего?»

Находка или мусор?

Вызов представлению о существовании мусорной ДНК бросил проект ENCODE - The Encyclopedia of DNA Elements, «Энциклопедия элементов ДНК» (первые его результаты опубликованы в журнале Nature в 2012 году). Получив многочисленные экспериментальные данные о том, какие части генома человека взаимодействуют с различными белками, участвуют в транскрипции - синтезе РНК-копий генов для последующей трансляции (синтеза белка из аминокислот на матрице информационной РНК) - или других биохимических процессах, авторы пришли к выводу, что более 80% генома человека так или иначе функциональны. Разумеется, данный тезис вызвал бурное обсуждение в научном сообществе.

Одна из наиболее ироничных статей, опубликованная Дэном Грауром, специалистом по молекулярной эволюционной биоинформатике, профессором Хьюстонского университета, и его коллегами в 2013 году в журнале Genome biology and evolution , называется так: «О бессмертии телевизоров: «функция» в геноме человека по лишенному эволюции Евангелию от ENCODE». Ее авторы отмечают, что отдельные члены консорциума ENCODE расходятся в том, какая часть генома функциональна. Так, один из них вскоре уточнил в журнале Genomicron , что речь идет не о 80% функциональных последовательностей в геноме, а о 40%, а другой (в статье в Scientific American ) и вовсе снизил показатель до 20%, но при этом продолжал настаивать, что термин «мусорная ДНК» нужно устранить из лексикона.

По мнению авторов статьи «О бессмертии телевизоров», члены консорциума ENCODE слишком вольно интерпретируют термин «функция». Например, существуют белки, которые называют гистонами. Они могут связывать молекулу ДНК и помогают ей компактно укладываться. Гистоны могут подвергаться определенным химическим модификациям. Согласно ENCODE, предположительная функция одной из таких модификаций гистонов - «предпочтение находиться в 5"-конце генов» (5"-конец - это конец гена, от которого движутся ферменты ДНК- и РНК-полимеразы при копировании ДНК или при транскрипции). «Примерно так же можно сказать, что функция Белого дома - занимать площадь земли по адресу 1600, Пенсильвания-авеню, Вашингтон, округ Колумбия», - отмечают оппоненты.

Возникает проблема и с приписыванием функции участкам ДНК. Предположим, что к определенному участку ДНК способен прикрепляться важный для функционирования клетки белок, и поэтому ENCODE приписывает этому участку «функцию». Например, некоторый транскрипционный фактор - белок, инициирующий синтез информационной (матричной) РНК - связывается со следующей последовательностью нуклеотидов: TATAAA. Рассмотрим две идентичные последовательности TATAAA в разных частях генома. После того как транскрипционный фактор связывается с первой последовательностью, начинается синтез молекулы РНК, служащей матрицей для синтеза другого важного белка. Мутации (замены любого из нуклеотидов) в этой последовательности приведут к тому, что РНК будет считываться плохо, белок не будет синтезирован, и это, скорее всего, негативно скажется на выживании организма. Поэтому правильная последовательность TATAAA будет поддерживаться в данном месте генома с помощью естественного отбора, и в этом случае уместно говорить о наличии у нее функции.

Другая последовательность TATAAA возникла в геноме по случайным причинам. Поскольку она идентична первой, с ней тоже связывается транскрипционный фактор. Но никакого гена рядом нет, поэтому связывание ни к чему не приводит. Если в этом участке возникнет мутация, ничего не изменится, организм не пострадает. В данном случае говорить о функции второго участка TATAAA нет смысла. Впрочем, может оказаться, что наличие в геноме большого количества последовательностей TATAAA вдали от генов нужно просто для того, чтобы связывать транскрипционный фактор и уменьшать его эффективную концентрацию. В таком случае отбор будет регулировать число таких последовательностей в геноме.

Чтобы доказать, что некоторый участок ДНК функционален, недостаточно показать, что в этом участке происходит некий биологический процесс (например, связывание ДНК). Члены консорциума ENCODE пишут, что функцией обладают участки ДНК, которые вовлечены в транскрипцию. «Но почему нужно акцентировать внимание на том, что 74,7% генома транскрибируется, в то время как можно сказать, что 100% генома принимает участие в воспроизводимом биохимическом процессе - репликации!», - снова шутит Граур.

Репликация

Репликация (от лат. replicatio - возобновление) - процесс синтеза дочерней молекулы дезоксирибонуклеиновой кислоты на матрице родительской. При следующем за этим делении каждая из дочерних клеток получает по одной копии молекулы ДНК, идентичной ДНК исходной материнской клетки. Репликацию ДНК осуществляет реплисома - сложный ферментный комплекс, состоящий из 15−20 различных белков.

Хорошим критерием функциональности участка ДНК является то, что мутации в нем достаточно вредны и значительные изменения этого участка не наблюдаются из поколения в поколение. Как определить такие участки? Здесь на помощь и приходит биоинформатика, современная наука на стыке биологии и математики об анализе последовательностей генов и белков. Мы можем взять геномы человека и мыши и найти в них все похожие участки ДНК. Окажется, что у этих двух видов какие-то участки последовательностей нуклеотидов очень похожи. Например, гены, необходимые для синтеза рибосомальных белков, довольно консервативны, то есть мутации в них достаточно вредны, чтобы носители новых мутаций вымирали, не оставляя потомства. Про такие гены говорят, что они находятся под отрицательным отбором, очищающим от вредных мутаций. Другие участки геномов будут иметь значительные расхождения между видами, что указывает на то, что мутации в этих участках, скорее всего, безвредны, а значит, их функциональная роль невелика или не определяется конкретной последовательностью нуклеотидов. В ряде работ оценили долю участков ДНК человека, находящихся под давлением отрицательного отбора. Оказалось, что к ним относятся только около 6,5−10% генома, причем некодирующие участки, в отличие от кодирующих, гораздо меньше подвержены отрицательному отбору. Получается, что с точки зрения эволюционных критериев функциональны менее 10% генома человека. Обратите внимание, как близок к этой оценке был Оно в 1972 году!

Мусорная крепость

Но неужели остальные 90% генома человека - мусор, от которого лучше избавиться? Не совсем так. Есть соображения, что большой размер генома может быть полезен сам по себе. У бактерий репликация генома служит серьезным ограничивающим фактором, требующим значительных затрат энергии. Поэтому их геномы, как правило, маленькие, а от всего лишнего они избавляются. У крупных организмов, как правило, репликация ДНК делящихся клеток вносит не столь большой вклад в общее количество энергозатрат организма на фоне расходов на работу мозга, мышц, органов выделения, поддержания температуры тела и т. д. В то же время большой геном может быть важным источником генетического разнообразия, увеличивая шансы на появление новых функциональных участков из нефункциональных за счет мутаций, потенциально полезных в процессе эволюции. Мобильные элементы могут переносить регуляторные элементы, создавая генетическое разнообразие в регуляции работы генов. То есть организмы с крупными геномами теоретически могут быстрее адаптироваться к условиям среды, расплачиваясь сравнительно небольшими дополнительными затратами на репликацию более крупного генома. Подобный эффект мы не обнаружим у отдельного организма, но он может играть важную роль на уровне популяции.

Наличие крупного генома может также уменьшать вероятность того, что какой-нибудь вирус встроится в функциональный ген (что может привести к поломке гена и в ряде случаев к раку). Иными словами, не исключено, что естественный отбор может действовать не только на поддержание конкретных последовательностей в геноме, но на сохранение определенных размеров генома, нуклеотидного состава в некоторых его участках и т. д.

Впрочем, хотя идея, что только 80% или даже 20% генома человека функциональны - спорна, это вовсе не значит, что критике подлежит весь проект ENCODE. В его рамках получено огромное количество данных о том, как разные белки связываются с ДНК, информации о регуляции генов и т. д. Эти данные представляют большой интерес для специалистов. Но едва ли в ближайшее время удастся избавиться от «мусора» в геноме - как от концепции, так и от самих ненужных последовательностей.

Введение ………………………………………………………………………...3

1. Сколько генов в человеческом организме?………………………...……… 5

2. Проект "Геном человека"…………. ……………………………………...…7

3. Результаты проекта "Геном человека"………………………………….….12

Заключение …………………………………………………………………….18

Список литературы………………………………………………………..….. 19

Введение

"...Но прежде прибери в комнатах, вымой окна, натри пол, выбели кухню, выполи грядки, посади под окнами семь розовых кустов, разбери семь мешков фасоли: белую отбери от коричневой, познай саму себя…"

Е.Л. Шварц. "Золушка"

Наверное, самым трудным для Золушки в заданиях злой и коварной мачехи было: «Познай саму себя!» Все остальное трудно, но понятно - действия привычные, выдумывать ничего не надо, только поспевай... А что значит: «Познай саму себя»? Узнать, как ты движешься, думаешь или дышишь, когда перебираешь фасоль? А может быть, первый шаг к настоящему пониманию человека - узнать, как он воспроизводит себе подобных?

Когда несколько американских ученых в 1986-1987 годах принялись неслыханно дерзко уговаривать руководителей Министерства энергетики США выделить несколько миллиардов долларов на фантастический проект: узнать строение всех генов человека - это был правильный шаг к познанию самих себя. Узнав строение генов, можно было посягнуть и на то, чтобы вторгнуться реально в понимание процессов мышления и реагирования на стимулы, приходящие из окружающей среды и т.д. Как только проект, названный «Геном человека», был объявлен, начались новые муки: множество людей во всем мире, причем не просто обыватели, а профессора и руководители институтов, стали его резко критиковать, называя его «завиральным», нереальным и попросту глупым. Вложенных средств он не оправдает, усилий потребует столько, что все ученые, забросив остальные дела, справиться с ним не смогут и т. п. Деньги затея поглотит, а толку все равно не будет. Рановато еще к этому приступать, твердили эти знатоки, наука не созрела для решения таких задач, технических возможностей не создано, лучше прекратить с самого начала нелепую выдумку, а деньги пустить на действительно реальные проекты.

Если бы на этом настаивали специалисты по ядерной физике или физической химии, было бы понятно, ведь из-за «Генома человека» приостановили другие дорогие проекты, прежде всего в области физики. Но в хоре протестов выделялись и голоса биологов, особенно из Западной Европы и СССР. Правда, в СССР были и другие ученые, в частности, академик А.А. Баев, которые сразу же постарались включиться в международный проект и извлечь из него максимальную пользу.

Когда проект только начинал свою работу, казалось, что для его завершения понадобится не менее 20 лет. Однако уже в 2000 г. усилиями ученых всего мира геном человека был прочитан. Его можно сравнить с книгой, которая содержит в себе последовательность знаков в 800 раз длиннее, чем Библия, однако смысл большинства «предложений» в тексте книги нам еще непонятен, и его предстоит расшифровывать еще долгие годы. Чем больше текста нашего генома удастся разгадать, тем больше появится возможностей для профилактики и лечения наследственных заболеваний, в том числе и таких, которые затрагивают психическую сферу человека.

Сколько генов в человеческом организме?

Молекулярную основу генома человека составляет молекула ДНК - знаменитая «нить жизни», двуспиральная модель структуры, которой была гениально предсказана и обоснована в работе нобелевских лауреатов Джеймса Уотсона и Фрэнсиса Крика еще в 1953 году. Спираль состоит из 4-х пар оснований (нуклеотидов); двух пуринов (аденин, гуанин) и двух пиримидинов (тимин и цитозин), соединенных между собой через дезоксирибозу и остатки фосфорной кислоты в длинную нить. Две нити соединяются между собой посредством водородных связей своих нуклеотидов, причем так, что аденин всегда соединен с тимином, а гуанин - с цитозином. В дальнейшем оказалось, что именно в чередовании пар оснований в ДНК и заложен генетический код для каждой из 20 аминокислот, причем этот код оказался трехбуквенным, то есть каждой аминокислоте соответствует свои три нуклеотида, свой триплет. Было так же установлено, что в каждой клетке человека длина молекулы ДНК около 1,5–2 м, а число нуклеотидов, составляющих эту уникальную «нить жизни» достигает 3.3 миллиарда. Фрагменты этой нити и составляют то, что называется генами, то есть кодирующими участками генома, определяющими структуру всех белков организма. Естественно, поэтому точное данные о структуре генома человеке, т.е. о первичной последовательности его нуклеотидов, равно как и данные обо всех генах человека давно привлекали и привлекают самое пристальное внимание ученых-биологов.

Как представить себе 3 млрд. оснований зримо? Чтобы воспроизвести информацию, содержащуюся в ДНК единственной клетки, даже самым мелким шрифтом (как в телефонных справочниках), понадобится тысяча 1000-страничных книг! Сколько же всего генов, то есть последовательностей нуклеотидов, кодирующих белки, в ДНК человека? Года три назад полагали, что около 100 тыс. , затем решили, что не более 80 тыс. В конце 1998 г. пришли к выводу, что в геноме человека 50–60 тыс. генов. На их долю приходится только 3% общей длины ДНК. Роль остальных 97% пока не ясна.

Проект «Геном человека»

Белки выполняют в организме самые различные функции. В качестве ферментов они служат катализаторами химических реакций; в роли гормонов они, наряду с нервной системой, управляют работой различных органов, передавая химические сигналы. Белки используются в организме и как строительный материал (например, в мышечной ткани), и как транспортные средства (гемоглобин крови переносит кислород).

Размах синтеза белка, происходящего в клетке, огромен. Геном человека (набор последовательностей ДНК, определяющих генетическую индивидуальность человека) содержит порядка 6 биллионов нуклеотидов, из которых сформировано примерно 100 000 генов, чьи Размеры варьируют в пределах от 1000 до 2 миллионов нуклеотидных пар.

Описание всех генов человека и расшифровка соответствующих последовательностей ДНК - основная задача международного исследовательского проекта «Геном Человека», который является самым крупным генетическим проектом в мире. Благодаря усилиям многих генетических лабораторий мира ученые будут иметь в своем распоряжении полное описание генома человека.

Цель проекта - выяснить последовательности азотистых оснований и положения генов (картирование) в каждой молекуле ДНК каждой клетки человека, что открыло бы причины наследственных заболеваний и пути к их лечению. В проекте заняты тысячи специалистов со всего мира: биологов, химиков, математиков, физиков и техников. Это один из самых дорогих научных проектов в истории. В 1990 г. на него потрачено 60 млн. долл., в 1991 г. - 135 млн., в 1992-1995 гг. - от 165 до 187 млн. в год, а в 1996-1998 гг. только США израсходовали 200, 225 и 253 млн.

Интерес к уже полученным результатам огромен: самые цитируемые в 1998 г. авторы (не только в генетике или биологии, но во всех областях науки) Марк Адамс и Крэйг Вентер из Института исследований генома в штате Мэриленд (США) - частной компании, занимающейся только составлением "генных карт".

Вехи проекта

Проект состоит из пяти основных этапов:

1. Составление карты, на которой помечены гены, отстоящие друг от друга не более, чем на 2 млн. оснований, на языке специалистов, с разрешением 2 Мб (Мегабаза - от английского слова "base" - основание);

2. Завершение физических карт каждой хромосомы с разрешением 0,1 Мб;

3. Получение карты всего генома в виде набора описанных по отдельности клонов (0,005 Мб);

4.К 2004 г. полное секвенирование ДНК (разрешение 1 основание);

5. Нанесение на карту с разрешением в 1 гб основание всех генов человека (к 2005 г.). Когда эти этапы будут завершены, исследователи определят все функции генов, а также биологические и медицинские применения результатов.

Три карты

В ходе проекта создают три типа карт хромосом: генетические, физические и секвенсовые (от англ. sequence - последовательность). Выявить все гены, присутствующие в геноме, и установить расстояния между ними - значит локализовать каждый ген в хромосомах. Такие генетические карты помимо инвентаризации генов и указания их положений ответят на исключительно важный вопрос о том, как гены определяют те или иные признаки организма. Ведь многие признаки зависят от нескольких генов, часто расположенных в разных хромосомах, и знание положения каждого из них позволит понять, как происходит дифференцировка (специализация) клеток, органов и тканей, а также успешнее лечить генетические заболевания. В 20-е и 30-е годы, когда создавалась хромосомная теория наследственности, выяснение положения каждого гена привело к тому, что на генетических картах сначала дрозофилы, а затем кукурузы и ряда других видов удалось отметить особые точки, как тогда говорили, "генетические маркеры" хромосом. Анализ их положения в хромосомах помог снабдить генетические карты хромосом человека новыми сведениями. Первые данные о положении отдельных генов появились еще в 60-е годы. С тех пор они множились лавинообразно, и в настоящее время известно положение уже десятков тысяч генов. Три года назад разрешение генетической карты составляло 10 Мб (для некоторых участков - даже 5 Мб).

Другое направление исследований - составление физических карт хромосом. Еще в 60-е годы цитогенетики стали окрашивать хромосомы, чтобы выявить на них особые поперечные полосы. После окрашивания полосы было видно в микроскоп. Между полосами и генами удалось установить соответствие, что позволило изучать хромосомы по-новому. Позже научились "метить" молекулы ДНК (радиоактивными или флуоресцентными метками) и следить за присоединением этих меток к хромосомам, что значительно повысило разрешение их структуры: до 2 Мб, а потом и до 0,1 Мб (при делении клеток). В 70-е годы научились "разрезать" ДНК на участки специальными «рестрикционными» ферментами, распознающими короткие отрезки ДНК, в которых информация записана в виде палиндромов - сочетаний, читаемых одинаково от начала к концу и от конца к началу. Так возникли «рестрикционные» карты хромосом. Использование современных физических и химических методов и средств улучшило разрешение физических карт в сотни раз.

Наконец, разработка методов секвенирования (изучения точных последовательностей нуклеотидов в ДНК) открыла путь к созданию секвенсовых карт с рекордным на сегодня разрешением (на этих картах будет указано положение всех нуклеотидов в ДНК).

Два подхода

Число хромосом и их длина различны у разных биологических видов. В клетках бактерий всего одна хромосома. Так, размер генома бактерии Mycoplasma genitalium 0,58 Мб (в нем 470 генов), у бактерии кишечной палочки (Escherichia coli) в геноме 4200 генов (4,2 Мб), у растения Arabi dopsis thaliana - 25 тыс. генов (100 Мб), у плодовой мушки Drosophila melanogaster - 10 тыс. генов (120 Мб). В ДНК мыши и человека 50-60 тыс. генов (3000 Мб). Конечно, для составления карт столь разных объектов одни и те же методы неприменимы, поэтому используют два разных по методологии подхода. В первом делят ДНК на небольшие куски и, изучив их по отдельности, воссоздают всю структуру, Этот подход увенчался успехом при составлении сравнительно простых карт. Для более сложных геномов эффективнее второй подход. В этих случаях неразумно делить молекулу ДНК на короткие куски, удобные для детального изучения. Их оказалось бы так много, что путаница в последовательностях была бы неразрешимой. Поэтому, принимаясь за расшифровку, молекулу делят, наоборот, на как можно более длинные куски и сравнивают их в надежде найти общие концевые участки. Если это удается, куски объединяют, после чего процедуру повторяют. С совершенствованием компьютеров и математических методов обработки информации объединенные по такому принципу куски становятся все крупнее, постепенно приближаясь к целой молекуле. Этот подход, в частности, позволил составить генетическую карту 3-й хромосомы дрозофилы.

Кладезь новых технологий

Важный аспект проекта «Геном человека» - разработка новых методов исследований. Еще до старта проекта был развит ряд весьма эффективных методов цитогенетических исследований (теперь их называют методами первого поколения). Среди них: создание и применение упомянутых рестрикционных ферментов. Получение гибридных молекул, их клонирование и перенос участков ДНК с помощью векторов в клетки-доноры (чаще всего - кишечной палочки или дрожжей). Синтез ДНК на матрицах информационной РНК. Секвенирование генов. Копирование генов с помощью специальных устройств. Способы анализа и классификации молекул ДНК по плотности, массе, структуре.

В последние 4-5 лет благодаря проекту "Геном человека" разработаны новые методы (методы второго поколения), в которых почти все процессы полностью автоматизированы. Почему это направление стало центральным? Самая маленькая хромосома клеток человека содержит ДНК длиной 50 Мб, самая большая (хромосома 1) - 250 Мб. До 1996 г. наибольший участок ДНК, выделяемый из хромосом с помощью реактивов, имел длину 0,35 Мб, а на лучшем оборудовании их структура расшифровывалась со скоростью 0,05-0,1 Мб в год при стоимости 1-2 долл. за основание. Иными словами, только на эту работу понадобилось бы примерно 30 тыс. дней (почти век) и 3 млрд. долларов.

Совершенствование технологии к 1998 г. повысило производительность до 0,1 Мб в день (36,5 Мб в год) и понизило стоимость до 0,5 долл. за основание. Использование новых электромеханических устройств, которые к тому же потребляют меньше реактивов, позволит уже в 1999 г. ускорить работы еще в 5 раз (к 2003 г. планируется довести скорость расшифровки до 500 Мб в год) и уменьшить стоимость до 0,25 долл. за основание (для человеческой ДНК еще дешевле).

В этом разделе описываются генетические характеристики различных живых организмов.

Общие сведения

С парадокс - длина геномов не зависит от сложности организма.
Сравнительные размеры геномов в разных группах организмов.

Размеры геномов и количество генов

Объект размер генома, пн
Микоплазмы 10 4 -10 6
Эубактерии (E.coli) 10 5 -10 7
Грибы (2-5)x10 7
Вид Число генов Длина генома, пн
Eubacteria
Mycoplasma genitalium 477 580.070
Synechocystis sp. 3168 3573 тыс.
E.coli 4280 4.639.221
Helicobacter pylori 1590 1667 тыс
Bacillus subtilis 4099 4214 тыс
Aquifex aelolicus 1544 1551 тыс
Micobacterium tuberculosis 4402 4447 тыс
Treponema pallidum 1041 1138 тыс
Rickettsia prowazekii 834 1111 тыс
Thermotoga maritima 1877 1860 тыс
Archaea
Methanococcus sannaschii 1750 1664 тыс
Archaeoglobus fulgidus 2493 2178 тыс
Aeropyrum pernix 2620 669 тыс
Eucaryotes
Saccharomyces cerevisiae ~6300 12.069 тыс
Arabidopsis thaliana ~26000 142.000 тыс
Caenorhabditis elegans ~19000 97.000 тыс
Drosophila melanogaster ~14000 137.000 тыс
X.laevis
Homo sapiens ~30000 3.200.000 тыс
Водоросли (5-7)x10 Черви ~10 8 Моллюски 5x10 8 -5x10 9 Насекомые 10 8 -5x10 9 Ракообразные ~10 9 Иглокожие 2x10 8 -2x10 9 Рыбы 3x10 8 -10 10 Амфибии 7x10 8 -7x10 10 Рептилии (2-3)10 9 Птицы 10 9 Млекопитающие 3x10 9 Цветковые растения 2x10 8 -10 11

Геном эукариот

Геном человека

У человека 23 пары хромосом, 22 аутосомы и 1 пара половых XX (женский пол) или XY (мужской пол).
Гаплоидный геном человека включает более 3 биллионов пар оснований ДНК, общей длинной приблизительно 1,8 м. Полный объем информации записанной в ДНК человека занимает около 750 мегабайт.
Гаплоидный геном человека содержит около 20,000–25,000 генов кодирующих белки.
Около 1.5% генома белок кодирующая, в то время как остальная ДНК включает регуляторные последовательности, интроны, РНК кодирующие последовательности, различные повторы и т.д.
~8% генома приходится на инактивированные последовательности некогда функционировавших ретровирусов HERV (Human endogenous retrovirus), самым молодым из которых, HERV-K, около 5-ти миллионов лет.
Французские исследователи восстановили последовательность одного из ретровирусов семейства HERV-K, содержащиеся в геноме. В клетках линии 239Т происходила транскрипция вирусной ДНК и продукция вирусных частиц. Более того, сам вирус, получивший название Phoenix, оказался способным самостоятельно осуществлять полный ретровирусный цикл от заражения клетки до интеграции в геном и сборки вирусных частиц. В некоторых опухолях, таких как тератокарцинома и меланома, экспрессируются отдельные белки HERV. Этого не достаточно для сборки полноценного вируса - слишком много мутаций. Однако, "воскрешение" полноценного вируса вполне может произойти за счет спонтанной рекомбинации - принципиальная возможность этого подтверждается результатами французских ученых.

Хромосома Генов Длина, пн Секвенировано
1 3,148 247,200,000 224,999,719
2 902 242,750,000 237,712,649
3 1,436 199,450,000 194,704,827
4 453 191,260,000 187,297,063
5 609 180,840,000 177,702,766
6 1,585 170,900,000 167,273,992
7 1,824 158,820,000 154,952,424
8 781 146,270,000 142,612,826
9 1,229 140,440,000 120,312,298
10 1,312 135,370,000 131,624,737
11 405 134,450,000 131,130,853
12 1,330 132,290,000 130,303,534
13 623 114,130,000 95,559,980
14 886 106,360,000 88,290,585
15 676 100,340,000 81,341,915
16 898 88,820,000 78,884,754
17 1,367 78,650,000 77,800,220
18 365 76,120,000 74,656,155
19 1,553 63,810,000 55,785,651
20 816 62,440,000 59,505,254
21 446 46,940,000 34,171,998
22 595 49,530,000 34,893,953
X 1,093 154,910,000 151,058,754
Y 125 57,740,000 22,429,293

Геном шимпанзе

Геном дрозофилы

Геном нематоды

Геном митохондрий

ДНК в митохондриях представлена циклическими молекулами, не образующими связь с гистонами, в этом отношении они напоминают бактериальные хромосомы.
У человека митохондриальная ДНК содержит 16,5 тыс. н.п., она полностью расшифрована. Найдено, что митохондральная ДНК различных объектов очень однородна, отличие их заключается лишь в величине интронов и нетранскрибируемых участков. Все митохондриальные ДНК представлены множественными копиями, собранными в группы, кластеры. Так в одной митохондрии печени крысы может содержаться от 1 до 50 циклических молекул ДНК. Общее же количество митохондриальной ДНК на клетку составляет около одного процента. Синтез митохондриальных ДНК не связан с синтезом ДНК в ядре. Так же как и у бактерий митохондральная ДНК собрана в отдельную зону – нуклеоид, его размер составляет около 0, 4 мкм в диаметре. В длинных митохондриях может быть от 1 до 10 нуклеоидов. При делении длинной митохондрии от нее отделяется участок, содержащий нуклеоид (сходство с бинарным делением бактерий). Количество ДНК в отдельных нуклеоидах митохондрий может колебаться в 10 раз в зависимости от типа клеток. При слиянии митохондрий может происходить обмен их внутренними компонентами.
рРНК и рибосомы митохондрий резко отличны от таковых в цитоплазме. Если в цитоплазме обнаруживаются 80s рибосомы, то рибосомы митохондрий растительных клеток принадлежат к 70s рибосомам (состоят из 30s и 50s субъединиц, содержат 16s и 23s РНК, характерные для прокариотических клеток), а в митохондриях клеток животных обнаружены более мелкие рибосомы (около 50s). В митоплазме на рибосомах идет синтез белков. Он прекращается, в отличие от синтеза на цитоплазматических рибосомах, при действии антибиотика хлорамфеникола, подавляющего синтез белка у бактерий.
На митохондриальном геноме синтезируются и транспортные РНК, всего синтезируется 22 тРНК. Триплетный код митохондриальной синтетической системы отличен от такового, используемого в гиалоплазме. Несмотря на наличие казалось бы всех компонентов, необходимых для синтеза белков, небольшие молекулы митохондриальной ДНК не могут кодировать все митохондриальные белки, только лишь их небольшую часть. Так ДНК размером 15 тыс.н.п. может кодировать белки с суммарным молекулярным весом около 6х105. В это же время суммарный молекулярный вес белков частицы полного дыхательного ансамбля митохондрии достигает величины около 2х106.

Рис. Относительные размеры митохондрий у различных организмов.

Интересны наблюдения за судьбой митохондрий в дрожжевых клетках. В аэробных условиях дрожжевые клетки имеют типичные митохондрии с четко выраженными кристами. При переносе клеток в анаэробные условия (например, при их пересеве или при перемещении в атмосферу азота) типичные митохондрии в их цитоплазме не обнаруживаются, и вместо них видны мелкие мембранные пузырьки. Оказалось, что в анаэробных условиях дрожжевые клетки не содержат полную дыхательную цепь (отсутствуют цитохромы b и a). При аэрации культуры наблюдается быстрая индукция биосинтеза дыхательных ферментов, резкое повышение потребления кислорода, а в цитоплазме появляются нормальные митохондрии.
Расселение людей на Земле

Геном пластид

Подобно митохондриям, хлоропласты имеют собственную генетическую систему, обеспечивающую синтез ряда белков внутри самих пластид. В матриксе хлоропластов обнаруживаются ДНК, разные РНК и рибосомы. Оказалось, что ДНК хлоропластов резко отличается от ДНК ядра. Она представлена циклическими молекулами длиной до 40-60 мкм, имеющими молекулярный вес 0,8-1,3х108 дальтон. В одном хлоропласте может быть множество копий ДНК. Так, в индивидуальном хлоропласте кукурузы присутствует 20-40 копий молекул ДНК. Длительность цикла и скорость репликации ядерной и хлоропластной ДНК, как было показано на клетках зеленых водорослей, не совпадают. ДНК хлоропластов не состоит в комплексе с гистонами. Все эти характеристики ДНК хлоропластов лизки к характеристикам ДНК прокариотических клеток. Более того, сходство ДНК хлоропластов и бактерий подкрепляется еще и тем, что основные регуляторные последовательности транскрипции (промоторы, терминаторы) у них одинаковы. На ДНК хлоропластов синтезируются все виды РНК (информационная, трансферная, рибосомная). ДНК хлоропластов кодирует рРНК, входящую в состав рибосом этих пластид, которые относятся к прокариотическому 70S типу (содержат 16S и 23S рРНК). Рибосомы хлоропластов чувствительны к антибиотику хлорамфениколу, подавляющему синтез белка у прокариотических клеток.
рис.
Образование шпилек в ДНК некоторых хлоропластов.

Так же как в случае хлоропластов мы вновь сталкиваемся с
существованием особой системы синтеза белка, отличной от
таковой в клетке.

Эти открытия вновь пробудили интерес к теории симбиотического
происхождения хлоропластов. Идея о том, что хлоропласты
возникли за счет объединения клеток-гетеротрофов с прокариотическими
синезелеными водорослями, высказанная на рубеже XIX и XX
вв. (А.С. Фоминцин, К.С.Мережковский) вновь находит свое
подтверждение. В пользу этой теории говорит удивительное
сходство в строении хлоропластов и синезеленых водорослей,
сходство с основными их функциональными особенностями, и
в первую очередь со способностью к фотосинтетическим процессам.


рис. Состав генома пластид у арабидопсиса.

Известны многочисленные факты истинного эндосимбиоза синезеленых
водорослей с клетками низших растений и простейших, где
они функционируют и снабжают клетку-хозяина продуктами фотосинтеза.
Оказалось, что выделенные хлоропласты могут также отбираться
некоторыми клетками и использоваться ими как эндосимбионты.
У многих беспозвоночных (коловратки, моллюски), питающихся
высшими водорослями, которые они переваривают, интактные
хлоропласты оказываются внутри клеток пищеварительных желез.
Так, у некоторых растительноядных моллюсков в клетках найдены
интактные хлоропласты с функционирующими фотосинтетическими
системами, за активностью которых следили по включению С14О2.

Как оказалось, хлоропласты могут быть введены в цитоплазму
клеток культуры фибробластов мыши путем пиноцитоза. Однако
они не подвергались атаке гидролаз. Такие клетки, включившие
зеленые хлоропласты, могли делиться в течение пяти генераций,
а хлоропласты при этом оставались интактными и проводили
фотосинтетические реакции. Были предприняты попытки культивировать
хлоропласты в искусственных средах: хлоропласты могли фотосинтезировать,
в них шел синтез РНК, они оставались интактными 100 ч, у
них даже в течение 24 ч наблюдались деления. Но затем происходило
падение активности хлоропластов, и они погибали.

Эти наблюдения и целый ряд биохимических работ показали,
что те черты автономии, которыми обладают хлоропласты, еще
недостаточны для длительного поддержания их функций и тем
более для их воспроизведения.

В последнее время удалось полностью расшифровать всю последовательность
нуклеотидов в составе циклической молекулы ДНК хлоропластов
высших растений. Эта ДНК может кодировать до 120 генов,
среди них: гены 4 рибосомных РНК, 20 рибосомных белков хлоропластов,
гены некоторых субъединиц РНК-полимеразы хлоропластов, несколько
белков I и II фотосистем, 9 из 12 субъединиц АТФ-синтетазы,
части белков комплексов цепи переноса электронов, одной
из субъединиц рибулозодифосфат-карбоксилазы (ключевой фермент
связывания СО2), 30 молекул тРНК и еще 40 пока неизвестных
белков. Интересно, что сходный набор генов в ДНК хлоропластов
обнаружен у таких далеко отстоящих представителей высших
растений как табак и печеночный мох.

Основная же масса белков хлоропластов контролируется ядерным
геномом. Оказалось, что ряд важнейших белков, ферментов,
а соответственно и метаболические процессы хлоропластов
находятся под генетическим контролем ядра. Так, клеточное
ядро контролирует отдельные этапы синтеза хлорофилла, каротиноидов,
липидов, крахмала. Под ядерным контролем находятся многие
энзимы темновой стадии фотосинтеза и другие ферменты, в
том числе некоторые компоненты цепи транспорта электронов.
Ядерные гены кодируют ДНК-полимеразу и аминоацил-тРНК-синтетазу
хлоропластов. Под контролем ядерных генов находится большая
часть рибосомных белков. Все эти данные заставляют говорить
о хлоропластах, так же как и о митохондриях, как о структурах
с ограниченной автономией.

Транспорт белков из цитоплазмы в пластиды происходит в принципе
сходно с таковым у митохондрий. Здесь также в местах сближения
внешней и внутренней мембран хлоропласта располагаются каналообразующие
интегральные белки, которые узнают сигнальные последовательности
хлоропластных белков, синтезированных в цитоплазме, и транспортируют
их в матрикс-строму. Из стромы импортируемые белки согласно
дополнительным сигнальным последовательностям могут включаться
в мембраны пластиды (тилакоиды, ламеллы стромы, внешняя
и внутренняя мембраны) или локализоваться в строме, входя
в состав рибосом, ферментных комплексов цикла Кальвина и
др.

Удивительное сходство структуры и энергетических процессов
у бактерий и митохондрий, с одной стороны, и у синезеленых
водорослей и хлоропластов – с другой, служит веским аргументом
в пользу теории симбиотического происхождения этих органелл.
Согласно этой теории, возникновение эукариотической клетки
прошло через несколько этапов симбиоза с другими клетками.
На первой стадии клетки типа анаэробных гетеротрофных бактерий
включили в себя аэробные бактерии, превратившиеся в митохондрии.
Параллельно этому в клетке-хозяине прокариотический генофор
формируется в обособленное от цитоплазмы ядро. Так могли
возникнуть гетеротрофные эукариотические клетки. Повторные
эндосимбиотические взаимоотношения между первичными эукариотическими
клетками и синезелеными водорослями привели к появлению
в них структур типа хлоропластов, позволяющих клеткам осуществлять
автосинтетические процессы и не зависеть от наличия органических
субстратов (рис. 236). В процессе становления такой составной
живой системы часть генетической информации митохондрий
и пластид могла изменяться, перенестись в ядро. Так, например
две трети из 60 рибосомных белков хлоропластов кодируется
в ядре и синтезируются в цитоплазме, а потом встраивается
в рибосомы хлоропластов, имеющие все свойства прокариотических
рибосом. Такое перемещение большой части прокариотических
генов в ядро привело к тому, что эти клеточные органеллы,
сохранив часть былой автономии, попали под контроль клеточного
ядра, определяющего в большей степени все главные клеточные
функции.

Перекрывание генных текстов

Принцип компактности записи информации в ДНК проявляется еще в одном. Важный факт, обнаруженный первоначально при анализе последовательностей генов у вирусов, заключается в том, что в одном и том же участке ДНК иногда может быть записана информация о двух совершенно разных РНК (и, соответственно, о совершенно разных белках). Такое случается и в геноме высших организмов, включая человека. Как же это осуществляется? Вспомним, что записанный в ДНК текст явно не разбит на слова (буквы – нук–леотиды – следуют в молекуле ДНК одна за другой). Но слова в этом тексте есть, просто знаки пунктуации и разрывы между словами скрыты от глаза и узнаются клеткой после перекодировки информации из ДНК в РНК. Для большей наглядности приведем широко известный пример такого текста:

НАПОЛЕОНКОСИЛТРАВУПОЛЯКИПЕЛИСОЛОВЬЯМИ.

В зависимости от разбивки этого текста на слова получается два предложения с совершенно разным значением:

НА ПОЛЕ ОН КОСИЛ ТРАВУ ПОЛЯ КИПЕЛИ

СОЛОВЬЯМИ

НАПОЛЕОН КОСИЛ ТРАВУ ПОЛЯКИ ПЕЛИ

СОЛОВЬЯМИ.

Теоретически на двух цепях ДНК с учетом того, что код триплет–ный, можно записать 6 разных текстов: три на одной цепи и три на другой. Это может быть достигнуто за счет сдвига точки начала считывания информации, что называют сдвигом рамки считывания (начало считывания возможно с любого из 3–х разных рядом лежащих нуклеотидов) (см. рис. 21). Такое явление получило название перекрывания генов. Впервые оно было обнаружено у вирусов. И здесь было понятно, зачем это потребовалось. Вирусные геномы обычно очень маленькие. Перекрывание генов диктовалось необходимостью как можно компактнее разместить информацию на отно


Рис. 21. Схематическое изображение перекрывания двух ДНКовых текстов, записанных на одном участке ДНК. Белок А образуется на мРНК, которая транслируется с одних кодо–нов, а белок Б образуется на мРНК, читаемой (транслируемой) со сдвигом в один нуклеотид. В результате кодоны (они разделены пробелами) совершенно разные, и, соответственно, при трансляции мРНК образуются совершенно разные белки сительно коротких молекулах ДНК. Большой геном человека теоретически позволяет обойтись без такого перекрывания. Однако и в геноме человека, хотя и относительно редко, перекрывание генов также имеется.

Каков может быть смысл в сохранении этого феномена в геноме человека? Пока еще не все ясно, но кое–какие моменты уже проясняются. Например, в ряде случаев обнаружили считывание РНК с разных цепей одного участка ДНК. Это приводит к образованию таких РНК, которые в силу комплементарности могут взаимодействовать друг с другом в клетке, образуя в результате двунитевые РНК. А в дву–нитевом виде мРНК не способна к такому важному процессу, как трансляция. Таков реальный механизм специфической регуляции (инактивации) экспрессии генов человека, число которых, по последним оценкам, составляет ~ 1600.

Не все гены кодируют белки

Прежде всего, следует отметить, что кроме генов, кодирующих белки, в геноме имеются еще гены, на которых синтезируется РНК, которые не являются мРНК (то есть, не кодируют белок), но выполняют ряд самостоятельных важных функций в клетках. В результате получается ситуация, что традиционное привычное определение гена надо расширять, включив в него гены, кодирующие белки, и гены, не кодирующие белки, но кодирующие функционально значимые РНК.

Давно уже известно, что кроме мРНК на ДНК синтезируются разнообразные вспомогательные РНК, которые сами не транслируются (т. е. они не кодируют белки), но участвуют в разных клеточных процессах. В первую очередь это РНК «домашнего хозяйства» – ри–босомные РНК (рРНК), транспортные РНК (тРНК) и др., которые участвуют непосредственно в синтезе белка на мРНК. Эти РНК кодируются участками, которые также называются генами, и составляют основную массу РНК в клетках. рРНК входят в состав рибосом, являясь важным компонентом их структурной организации. У человека присутствует два основных типа рРНК размером около 1900 нуклеотидов и более 5000 нуклеотидов в малой и большой субчастицах соответственно. Еще одни некодирующие белок РНК – тРНК, которые обеспечивают аппарат трансляции, подтаскивая к рибосомам различные аминокислоты, вступающие в реакцию друг с другом. В геноме человека гены, кодирующие рРНК и тРНК, представлены многочисленными копиями. Так, в секвенированной ДНК человека обнаружено около 500 генов, кодирующих тРНК. Генов для рРНК в геноме человека выявлено около 200 копий, которые расположены на 5–ти разных хромосомах (13, 14, 15, 21 и 22).

Изучение свойств РНК привело к тому, что представление об исключительности белков в катализе биохимических реакций пришел конец. Выяснилось, что в природе имеются виды РНК, которые, подобно белкам, обладают высокоспецифической каталитической активностью.

Очень важным стало обнаружение в геноме человека множества других генов, также производящих РНК, но не способных кодировать белок. Постепенно выяснилось, что некоторые из таких не кодирующих белки РНК принимают участие в важнейших процессах, происходящих в клетке: регуляции транскрипции ДНК, сплайсинга и трансляции мРНК, модулировании функций белков и их пространственного распределения в клетке. По этой причине их назвали риборегуляторами. И примеров таких риборегуляторов уже сейчас можно привести немало. Так, установлено, что не кодирующий белок участок гена H19 имеет отношение к ряду процессов, протекающих в клетках, и, в частности, к их злокачественному перерождению. Другой РНК–кодирующий ген контролирует работу белок–ко–дирующего гена HFE, вовлеченного в метаболизм железа и связанного с наследственным заболеванием хемохроматозом. В последнем случае РНК–продукт кодируется тем же самым геном, который он регулирует, но его образование осуществляется на другой нити ДНК. В результате так называемый антисмысловой (комплементарный) РНК–продукт способен взаимодействовать с мРНК, образуя гибриды, неспособные транслироваться в рибосомах с образованием белка. Еще один интересный ген – ген РНК–активатора стероидного рецептора. Он обеспечивает активность стероидных рецепторов за счет образования комплекса с этим белком.

В клетках человека, как и у других организмов, выявлены короткие двунитевые РНК (микроРНК), отдельные из которых, по–видимому, могут участвовать в процессе регуляции экспрессии генов через механизм, названный РНК–интерференцией. Этот механизм впервые был обнаружен в 1998 году у низших организмов. Различные микроРНК в клетках червя C. elegans оказались в состоянии «приглушать» работу строго определенных генов путем воздействия на процесс синтеза кодируемых ими белков. Вполне вероятно, и у человека микроРНК играют подобную роль.

Таким образом, мы видим, что продукты генов, кодирующих только РНК, вмешиваются в различные клеточные процессы, используя при этом совершенно разные механизмы. Гены риборегу–ляторов составляют, по–видимому, заметную часть генома человека. Примерные оценки говорят о величине на порядок больше, чем доля белок–кодирующих нуклеотидных последовательностей. Сам факт существования таких генов, неспособных кодировать белок, но реально проявляющих себя в производстве функционирующих в клетках РНК, ставит большой вопрос перед исследователями генома. И, в первую очередь, что следует после этого считать собственно геном?

Ген в гене (генная матрешка)

Изредка обнаруживаются варианты, когда внутри одного гена целиком содержится другой, меньший по размерам ген. Этакая своеобразная «матрешка», построенная из генов. Такая организация генов весьма редка. Так, в хромосоме 22 имеется лишь 2 таких случая. Чаще всего белок–кодирующий ген располагается в интроне другого белок–кодирующего гена. Но встречаются и другие варианты. В качестве примера можно привести ситуацию, имеющую место для ми–тохондриального гена одной из рибосомных РНК. Ген, кодирующий эту рРНК, обеспечивает ею рибосомы митохондрий в качестве структурного компонента (т. е. не кодирует белок). Однако вместе с тем небольшой участок, расположенный внутри этого гена, кодирует короткий белок (полипептид), получивший название гуманин (от англ. human – человек), который принимает участие в процессе программированной клеточной гибели. То есть в РНК–кодирующем гене может содержатся белок–кодирующий ген. Другой вариант-уже упоминавшийся выше ген H19. Здесь, наоборот, ген, кодирующий белок, содержит внутри своей кодирующей части другой более короткий ген, кодирующий только РНК, которая принимает участие в регуляции работы этого гена.

Генные семейства

Как у людей имеются семьи, так и у генов нередко существуют семейства. Семейством генов называют набор из двух или более генов, чьи экзоны родственны между собой, т. е. похожи (хотя и не идентичны) по нуклеотидной последовательности. В геноме человека присутствует около полутора тысяч таких семейств генов. Причем только около сотни из них специфичны для человека и других позвоночных животных, тогда как основная масса генных семейств имеется и у человека, и у червя.

Разные члены одного семейства генов возникали в эволюции из одного гена–предшественника (условно – от одного прапрапрадеда, как и в человеческой популяции). Процесс, в результате которого появлялись «копии», получил название дупликации, т. е. удвоения. Такие дупликации в некоторых случаях происходят не одноразово, а многократно. Сейчас стало ясно, что дупликации играют очень важную роль в эволюции. Подсчитано, что в геноме человека в сумме дуплицировано около 3,6% нуклеотидных последовательностей размером в 1000 и более п. н.

Разные копии одного семейства генов могут располагаться в геноме рядом и следовать друг за другом (это называют тандемной дупликацией). Рассмотрим несколько примеров. Так, гены, кодирующие рибосомную РНК (рРНК) и белки гистоны, расположены в геноме человека в виде кластеров, построенных из одних и тех же последовательностей, следующих друг за другом (рис. 22).



Рис. 22. Строение участка генома человека, состоящего из множества генов, кодирующих рибосомные РНК. Утолщенные линии – транскрибируемые участки


Такие «гроздья» одинаковых генов обычно требуются организму для того, чтобы нарабатывать большие количества определенного продукта. Действительно, рРНК составляет по массе основную часть всей клеточной РНК, входя в состав таких важных «машин» клетки, как рибосомы. Огромная масса гистонов нужна клетке для упаковки гигантских молекул ДНК и плотной укладки их в хромосомы. Во всех таких случаях говорят о большой «дозе» гена в геноме, которая в конечном итоге и обеспечивает клетку большим количеством продукта.

Однако в большинстве других случаев возникающие в результате дупликации «копии» генов постепенно претерпевают изменения (мутации), что приводит к возникновению определенных различий между ними, хотя формальное родство при этом сохраняется. Такой процесс был назван дивергенцией, т. е. расхождением. Дивергенцию обычно выражает в процентах различий между двумя родственными последовательностями нуклеотидов в ДНК или последовательностями аминокислот в белках.

Однако даже после того, как разные «копии» генов одного семейства становятся не совсем похожими друг на друга, они чаще всего выполняют сходную функцию. Они остаются очень дружной семейкой! Но экспрессируются разные члены одного такого семейства обычно в разное время или в разных типах клеток. Так, в геноме человека обнаружено тридцать генов, кодирующих родственные факторы роста клеток кожи (фибробластов). А вот у низших организмов число таких генов существенно меньше (у дрозофилы и червя их всего 2). Другой пример – гены, кодирующие кератины – белки наружного слоя кожи и ее производных (волосы, ногти). Их у человека 111 штук! Но и это не предел. Геном человека, как ни удивительно, имеет около 1 000 копий генов–рецепторов обоняния.

Дивергировавшие в ходе эволюции человека гены семейства иногда оказываются разбросанными в разных местах на одной или даже разных хромосомах. При этом ген может быть удвоен целиком, а может происходить удвоение небольшого набора его экзонов или даже всего лишь одного из его экзонов.

Как и в семье не без урода, так и в семействах генов встречаются иногда такие члены, которые не утруждают себя никакой работой. Нарушение их способности функционировать в клетке обычно связано с накоплением опечаток в их ДНКовом тексте. Такие гены–тунеядцы получили название «псевдогенов». Перед их названием ставят греческую букву ψ. Не совсем ясно, зачем геному нужны такие гены, почему он сохранил их в эволюции, не избавился от них. Но факт остается фактом. По имеющимся оценкам, в геноме человека имеется около 20000 таких, подобных вымершим реликтам, псевдогенов. В частности, в огромной семействе генов–рецепторов обоняния, состоящем из примерно 1000 генов, около 60% являются псевдогенами. Считается, что массивная потеря функциональных генов произошла за последние 10 млрд. лет, и связано это со снижением роли обоняния у человека по сравнению с другими позвоночными организмами. Здесь, по–видимому, действует принцип отмирания из–за неупотребления. Установлено, что существует, по крайней мере, два механизма, приводящих к образованию псевдогенов. Один из них заключается в удвоении уже существующего гена (дупликация), а потом дополнительная копия накапливает мутации, которые препятствуют его работе. Другой механизм связан с процессом сплайсинга и обратной транскрипции. На сформировавшейся мРНК синтезируется ее ДНК–копия, которая в дальнейшем встраивается в геном. Такие псевдогены не содержат ни интроны, ни промоторные участки. Кроме того, в них со временем накапливаются многочисленные мутации, не позволяющие этим генам обеспечивать синтез нормального белка.

Все вышесказанное можно проиллюстрировать на примере семейства генов, кодирующих белки крови человека (рис. 23). У человека имеется два семейства глобиновых генов (альфа и бета). Эти семейства расположены на разных хромосомах. Каждое семейство состоит из нескольких членов, имеются здесь и псевдогены. Нормальные гены глобиновых семейств экспрессируются в клетках крови на разных стадиях развития человека. Одни у эмбрионов (ξ, ε), другие у плода (G γ , А γ , a1), а третьи – у взрослого организма (α2, δ, β). Функция у всех глобиновых генов одинакова – синтез глобинов, участвующих в переносе кислорода клетками крови. И место их работы одно – клетки крови эритроциты. Отличаются они лишь тем, что включаются в разное время, в результате чего выполняют одну и ту же роль, но на разных стадиях развития организма.



Рис. 23. Строение двух локусов генома, состоящих из кластеров родственных глобиновых генов человека. Экспрессирую–щиеся гены указаны стрелками (направление транскрипции), молчащие гены (псевдогены) – квадратиками

Организация кластеров глобиновых генов у человека совершенно одинакова с организацией этих генов у гориллы и павиана. Это указывает на то, что такая организация полностью сформировалась еще от 20 до 40 млн. лет назад и с тех пор не изменялась. Анализ мутаций в межгенных областях позволил сделать вывод об эволюции не отдельных генов, собранных в такой кластер, а кластера как единого целого супергена.

По–иному ведут себя многочисленные гены семейства актинов, которые кодируют сократительные белки клетки. Эти гены экспрес–сируются почти все время, и их экспрессия происходит как в мышечных клетках, так и во многих других немышечных. При этом функция актинов везде одинакова.

Новые предложения из фрагментов старых текстов

Экзон–интронная организация генов способствует еще одному механизму возникновения новых генов – созданию новых ДНКовых текстов из фрагментов старых. Это осуществляется в результате «тасования» уже предсуществующих экзонов, что может приводить к появлению нового их сочетания и новых белков с новыми функциями. Чаще всего это происходит за счет процесса присоединения новых экзонов к старым. Примером этому может служить случай, представленный на рис. 24.



Рис. 24. Пример формирования новых генов за счет различного сочетания уже имеющихся экзонов. Изображены четыре разных белка, состоящих из сходных блоков–доменов (обозначены разными символами), которые кодируются разными экзонами

В процессе эволюции из общего предшественника образовались гены дрозофилы trx и ген человека alr. Ген человека hrx возник в результате присоединения к гену trx четырех новых экзонов. Это приводит к появлению в белке, кодируемом этим геном, четырех новых функциональных доменов, что существенно меняет его свойства по сравнению с предшественником. Такая ситуация вообще–то характерна для всех высших организмов, но у человека она встречается в 2-5 раз чаще, чем, например, у дрозофилы или червя.

После получения всех этих новых многочисленных сведений об особенностях организации и эволюции генов у человека (сходным образом обстоит дело и у других высших организмов) стало ясно, что дать строгое определение того, что же такое собой представляет ген, довольно сложно. Но даже если бы такое определение сегодня имелось, его, как и всякое другое, не следовало бы считать незыблемым. Не зря говорил Спиноза: «Всякое определение есть ограничение». Однако в целом базовое представление о гене осталось в силе. Ген – это физическая (определенный участок ДНК) и функциональная (кодирует белок или РНК) единица наследственности.

Сколько же всего генов у человека?

Это наиболее интересный вопрос, ради которого собственно и затевалось полное секвенирование генома человека. После получения основной информации о структуре генома человека в первую очередь были произведены различные анализы по поиску генов и определению их числа. Однако задача оказалась не простой. Это может показаться странным для читателя, но однозначного ответа на поставленный вопрос до сих пор нет.

Сколько же всего генов в ДНК человека? Еще несколько лет назад полагали, что их около 100 тыс., затем решили, что не более 80 тыс. В конце 1998 г. пришли к выводу, что в геноме человека не более 50-60 тыс. генов и на их долю приходится около 3% общей длины ДНК.

Последние подсчеты общего числа генов в геноме человека проводили несколько международных команд ученых. Уже упоминавшаяся компания «Celera» провела собственные исследования, результаты которого изложены в журнале «Science» в 2001 году. По ее оценкам общее число генов в геноме человека составляет от 26383 до 39114. Средний размер гена оценивается равным примерно 3000 п. н. Если принять, что число генов у человека порядка 30 тысяч генов и на каждый ген приходится примерно 3 тыс. п. н., то нетрудно подсчитать, что в кодировании белков принимает участие менее 1,5% хромосомной ДНК. Таким образом, генетические инструкции по формированию человеческой личности занимают меньше 3 сантиметров на двухметровой молекуле ДНК. Удивляет и малое количество генов, несущих эти инструкции, – их всего в пять раз больше, чем, например, у такого на наш взгляд совершенно примитивного организма, как муха дрозофила.

Вторая команда исследователей из Национального института геномных исследований США во главе с Френсисом Коллинзом, подсчитав число генов у человека независимым способом и на основе своих данных, получила сходный результат – около 32000 генов содержится в геноме каждой клетки человека.

Разнобой в окончательные оценки пока вносят два других коллектива ученых. Доктор Вильям Хезелтайн (руководитель фирмы «Хьюмэн Геном Сайенс») продолжает настаивать, что в их банке содержится приватизированная информация на 120 тыс. генов. Этой информацией он не собирается пока делиться с мировой общественностью. Фирма вложила деньги в патенты и собирается заработать на полученной информации, поскольку она относится к генам широко распространенных болезней человека. Фирма «Инсайт» сообщила о том, что имеет в настоящее время каталог, состоящий из 140 тысяч идентифицированных ей генов человека, и также настаивает на этом количестве общего числа генов у человека.

Очевидно, что наспех приватизированная генетическая информация будет еще тщательно анализироваться и проверяться в ближайшие годы, пока точное число генов станет окончательно «канонизировано». Дело в том, что устройство генов весьма многообразно и до конца еще не поняты все возможные варианты. Вот мы прочитали последовательность нуклеотидов ДНК. Определено, что она способна кодировать белок. Но один ли? Выше уже говорилось о том, как транскрипция и последующие модификации РНК, а затем трансляция и модификации полипептидов, способны обеспечить огромное многообразие белков, кодируемых одним участком ДНК. И понять это исходя только из нуклеотидной последовательности ДНК очень часто просто невозможно. Тем не менее структура генома представляет собой единственную базу для осмысления данных, получаемых такими новыми направлениями, рожденными геномикой, как транскриптомика (исследует совокупность РНК–транскриптов организма), протеомика (исследует совокупность белков организма), метаболомика (исследует обмен веществ – метаболизм – в организме). Эти направления призваны дополнить лежащий в основе структурной геномики метод геномного секвенирования, дать возможность выйти за пределы его разрешающей способности.

Выше уже также говорилось об альтернативном сплайсинге. Сейчас хорошо известно, что за счет этого процесса с одних и тех же генов могут считываться разные белки, которые затем взаимодействуют друг с другом, образуя неповторимую смесь, как из основных цветов в живописи – желтого, красного и голубого можно получить мириады оттенков. Такой сплайсинг характерен не менее чем для половины генов человека. Считается, что в среднем с одного гена человека за счет альтернативного сплайсинга может образовываться три разных пептида. Но некоторые гены имеют до 10 альтернативно сплайсируемых экзонов, что позволяет теоретически получать более 1000 различных вариантов белков всего лишь на одном гене. В реальности число разных белков, кодируемых одним геном, достигает 10. Кроме того, существуют еще и альтернативные промоторы, альтернативные кодоны инициации трансляции, редактирование РНК (превращение Ц в У или А в аналог Г – инозин). Все вышесказанное пока еще невозможно учесть при оценке общего числа генов у человека.

Но и это не все. Кроме генов, кодирующих белки, имеются еще гены, конечным продуктом которых являются РНК. Вспомним об упоминавшихся выше генах–риборегуляторах – они не кодируют белки, но производят функционирующую в клетках РНК. Так что скорее всего окончательная оценка числа генов у человека будет сделана еще нескоро.

На сегодняшний день ученым известны функции всего лишь около восьми–десяти тысяч из них. А детальные сведения о механизмах их регуляции еще более скудны. Тем не менее, приведенные выше данные о строении и функционировании генов человека свидетельствуют о том, что у человека, царствующего в природе, в отличие от других существующих на нашей планете организмов, очень высока сложность протеома – полного набора функциональных белков в клетке, которая обеспечивается не просто за счет крупного размера генома или большого числа генов, а благодаря всевозможным инновациям, связанным с функционированием генов и формированием белков: большее число доменов–модулей, более высокая комбинаторика (перемешивание) этих модулей в белках, активное использование альтернативного сплайсинга и многое другое, о чем мы поговорим дальше.

Геном человека [Энциклопедия, написанная четырьмя буквами] Тарантул Вячеслав Залманович

Сколько же всего генов у человека?

Это наиболее интересный вопрос, ради которого собственно и затевалось полное секвенирование генома человека. После получения основной информации о структуре генома человека в первую очередь были произведены различные анализы по поиску генов и определению их числа. Однако задача оказалась не простой. Это может показаться странным для читателя, но однозначного ответа на поставленный вопрос до сих пор нет.

Сколько же всего генов в ДНК человека? Еще несколько лет назад полагали, что их около 100 тыс., затем решили, что не более 80 тыс. В конце 1998 г. пришли к выводу, что в геноме человека не более 50–60 тыс. генов и на их долю приходится около 3 % общей длины ДНК.

Последние подсчеты общего числа генов в геноме человека проводили несколько международных команд ученых. Уже упоминавшаяся компания «Celera» провела собственные исследования, результаты которого изложены в журнале «Science» в 2001 году. По ее оценкам общее число генов в геноме человека составляет от 26383 до 39114. Средний размер гена оценивается равным примерно 3000 п. н. Если принять, что число генов у человека порядка 30 тысяч и на каждый ген приходится примерно 3 тыс. п. н., то нетрудно подсчитать, что в кодировании белков принимает участие менее 1,5 % хромосомной ДНК. Таким образом, генетические инструкции по формированию человеческой личности занимают меньше 3 сантиметров на двухметровой молекуле ДНК. Удивляет и малое количество генов, несущих эти инструкции, - их всего в пять раз больше, чем, например, у такого на наш взгляд совершенно примитивного организма, как муха дрозофила.

Вторая команда исследователей из Национального института геномных исследований США во главе с Френсисом Коллинзом, подсчитав число генов у человека независимым способом и на основе своих данных, получила сходный результат - около 32000 генов содержится в геноме каждой клетки человека.

Разнобой в окончательные оценки пока вносят два других коллектива ученых. Доктор Вильям Хезелтайн (руководитель фирмы «Хьюмэн Геном Сайенс») продолжает настаивать, что в их банке содержится приватизированная информация на 120 тыс. генов. Этой информацией он не собирается пока делиться с мировой общественностью. Фирма вложила деньги в патенты и собирается заработать на полученной информации, поскольку она относится к генам широко распространенных болезней человека. Фирма «Инсайт» сообщила о том, что имеет в настоящее время каталог, состоящий из 140 тысяч идентифицированных ей генов человека, и также настаивает на этом количестве общего числа генов у человека.

Очевидно, что наспех приватизированная генетическая информация будет еще тщательно анализироваться и проверяться в ближайшие годы, пока точное число генов станет окончательно «канонизировано». Дело в том, что устройство генов весьма многообразно и до конца еще не поняты все возможные варианты. Вот мы прочитали последовательность нуклеотидов ДНК. Определено, что она способна кодировать белок. Но один ли? Выше уже говорилось о том, как транскрипция и последующие модификации РНК, а затем трансляция и модификации полипептидов, способны обеспечить огромное многообразие белков, кодируемых одним участком ДНК. И понять это исходя только из нуклеотидной последовательности ДНК очень часто просто невозможно. Тем не менее структура генома представляет собой единственную базу для осмысления данных, получаемых такими новыми направлениями, рожденными геномикой, как транскриптомика (исследует совокупность РНК-транскриптов организма), протеомика (исследует совокупность белков организма), метаболомика (исследует обмен веществ - метаболизм - в организме). Эти направления призваны дополнить лежащий в основе структурной геномики метод геномного секвенирования, дать возможность выйти за пределы его разрешающей способности.

Выше уже также говорилось об альтернативном сплайсинге. Сейчас хорошо известно, что за счет этого процесса с одних и тех же генов могут считываться разные белки, которые затем взаимодействуют друг с другом, образуя неповторимую смесь, как из основных цветов в живописи - желтого, красного и голубого можно получить мириады оттенков. Такой сплайсинг характерен не менее чем для половины генов человека. Считается, что в среднем с одного гена человека за счет альтернативного сплайсинга может образовываться три разных пептида. Но некоторые гены имеют до 10 альтернативно сплайсируемых экзонов, что позволяет теоретически получать более 1000 различных вариантов белков всего лишь на одном гене. В реальности число разных белков, кодируемых одним геном, достигает 10. Кроме того, существуют еще и альтернативные промоторы, альтернативные кодоны инициации трансляции, редактирование РНК (превращение Ц в У или А в аналог Г - инозин). Все вышесказанное пока еще невозможно учесть при оценке общего числа генов у человека.

Но и это не все. Кроме генов, кодирующих белки, имеются еще гены, конечным продуктом которых являются РНК. Вспомним об упоминавшихся выше генах-риборегуляторах - они не кодируют белки, но производят функционирующую в клетках РНК. Так что скорее всего окончательная оценка числа генов у человека будет сделана еще нескоро.

На сегодняшний день ученым известны функции всего лишь около восьми-десяти тысяч из них. А детальные сведения о механизмах их регуляции еще более скудны. Тем не менее, приведенные выше данные о строении и функционировании генов человека свидетельствуют о том, что у человека, царствующего в природе, в отличие от других существующих на нашей планете организмов, очень высока сложность протеома - полного набора функциональных белков в клетке, которая обеспечивается не просто за счет крупного размера генома или большого числа генов, а благодаря всевозможным инновациям, связанным с функционированием генов и формированием белков: большее число доменов-модулей, более высокая комбинаторика (перемешивание) этих модулей в белках, активное использование альтернативного сплайсинга и многое другое, о чем мы поговорим дальше.

Из книги ЧАВО автора Протопопов Анатолий

Как учёные выделяют инстинктивно-обусловленное поведение среди всего комплекса поведенческих актов человека? Примерно так же, как лингвисты восстанавливают древние вымершие языки. То есть, сравниваются поведенческие схемы людей, принадлежащих самым разным культурам,

Из книги Новейшая книга фактов. Том 1 [Астрономия и астрофизика. География и другие науки о Земле. Биология и медицина] автора

Из книги Геном человека [Энциклопедия, написанная четырьмя буквами] автора Тарантул Вячеслав Залманович

Из книги Новейшая книга фактов. Том 1. Астрономия и астрофизика. География и другие науки о Земле. Биология и медицина автора Кондрашов Анатолий Павлович

Из книги Читая между строк ДНК [Второй код нашей жизни, или Книга, которую нужно прочитать всем] автора Шпорк Петер

Из книги Эмбрионы, гены и эволюция автора Рэфф Рудольф А

Сколько же всего генов у человека? Это наиболее интересный вопрос, ради которого собственно и затевалось полное секвенирование генома человека. После получения основной информации о структуре генома человека в первую очередь были произведены различные анализы по

Из книги Мир животных автора Ситников Виталий Павлович

Сколько всего известно астероидов? В период с 1801 по 1891 год было открыто всего около 200 астероидов. C началом применения фотографии (в 1891 году) их стали открывать в большом количестве. К началу 1987 года было известно уже около 3500 астероидов. Частота открытия астероидов опять

Из книги Секреты наследственности человека автора Афонькин Сергей Юрьевич

Из книги Тайны пола [Мужчина и женщина в зеркале эволюции] автора Бутовская Марина Львовна

Сколько всего высших растений на Земле? Всего на нашей планете около 300 тысяч видов высших (зародышевых) растений, из них изучены приблизительно 250 тысяч. Относительно 50 тысяч видов растений науке пока не известно, полезны они или нет. Эксперты считают, что если сейчас не

Из книги Синдром Паганини [и другие правдивые истории о гениальности, записанные в нашем генетическом коде] автора Кин Сэм

Сколько волос в ресницах человека? Ресницами называют короткие жесткие волосы, расположенные в 2–3 ряда по переднему краю века у человека и млекопитающих и защищающие роговицу глаза от инородных тел (например, частиц пыли). У человека 100–150 ресниц на верхнем веке и 50–70 на

Из книги автора

Сколько генов у человека Каждый год элита молекулярной биологии собирается на симпозиум в городке Колд-Спринг-Харбор на живописном северном побережье Лонг-Айленда, что неподалеку от Нью-Йорка. В мае 2000 года там обсуждалось - иначе и быть не могло! - секвенирование

Из книги автора

Сколько генов необходимо для развития? К счастью, существуют методы, позволяющие оценить количество генетической информации, имеющейся у высших организмов. Один из самых тонких таких методов - классическая менделевская генетика. Главная трудность, связанная с этим

Из книги автора

Из книги автора

Инвентаризация генов человека Инвентаризация - периодическая проверка наличия и состояния материальных ценностей и основных и оборотных фондов в натуре, а также денежных средств. Большая энциклопедия Кирилла и Мефодия 2002 - Наши гены полны молекулярной

Из книги автора

Сколько полов у человека? Так сколько же существует полов у человека? В середине XX века ответ был бы: два пола. Однако в США и ряде европейских стран, равно как и во многих странах Азии и Африки сейчас скорее всего прозвучит иной ответ: три пола. Для европейцев и

Из книги автора

Глава 14. Три миллиарда маленьких кусочков Почему у человека не больше генов, чем у других видов? Масштаб, размах, амбиции, десятки лет работы и десятки миллиардов долларов – вот причины того, что проект «Геном человека», попытка расшифровать всю цепочку ДНК, справедливо

Похожие публикации