Во многих генах высших организмов последовательности нуклеотидов, кодирующие аминокислоты, чередуются с некодирующими. Кодирующие последовательности называются экзонами, а некодирующие — нитронами (см. дополнительный очерк «Самая загадочная молекула»). После переписывания наследственной информации из ДНК в РНК получается «сырой продукт» — молекула РНК, в которой также вперемежку расположены экзоны и интроны. Чтобы с такой РНК была считана правильная аминокислотная последовательность, из неё необходимо «вырезать» всё ненужное, т. е. интроны, а оставшиеся экзоны «склеить» друг с другом. Иными словами, РНК нуждается в дальнейшей обработке или, как говорят биохимики, созревании. Так и происходит на самом деле. В клетках высших организмов «сырая» РНК разрезается на более короткие кусочки, а потом некоторые из них склеиваются между собой.
В большинстве случаев в процессе разрезания-склеивания принимают участие целые молекулярные комплексы, состоящие из небольших молекул РНК и белков. Они играют роль ферментов, которые ускоряют и контролируют правильное протекание химических реакций, сопровождающих созревание матричной РНК. Но некоторые интроны вырезаются без всякой посторонней помощи. Учёные пришли к заключению, что в таких случаях интрон сам выступает в роли фермента, отвечающего за собственное удаление из РНК и склеивание двух обрамлявших его экзонов. Это совершенно потрясающее явление природы, поскольку ферментативную активность здесь проявляет не белок, а молекула РНК!
Помимо разрезания-склеивания молекулы РНК высших организмов претерпевают и другие химические изменения в ходе созревания. Только после такой обработки появляется «зрелая» матричная РНК, с которой может работать рибосома. По этой причине, в отличие от своих «коллег» в низших организмах, рибосомы эукариот не могут начать производство белков, пока не завершится переписывание из ДНК в РНК: они вынуждены ждать созревания матричной РНК.
Австрийский философ Филипп Франк как-то заметил: «Наука похожа на детективный рассказ». Пожалуй, в работе сыщика и учёного действительно много общего. В 1961 г. французские учёные Франсуа Жакоб (родился в 1920 г.) и Жак Моно (1910—1976) предположили, что между ДНК и белком существует посредник. Ведь в клетках высших организмов почти вся ДНК находится в ядре, а образование (синтез) новых белков происходит в цитоплазме. То есть гены, кодирующие белки, и место синтеза этих белков разделены в пространстве! Значит, некий посредник должен доставлять информацию, зашифрованную в генах, к месту синтеза белков. С другой стороны, раньше уже было известно, что как раз в таких местах в клетке присутствует ещё одна полимерная молекула - - РНК (рибонуклеиновая кислота). Более того, именно эта молекула входит в состав маленьких частиц, на которых происходит синтез белка. Ответ напрашивался сам собой: РНК и есть искомый посредник.
Рождение генной инженерии состоялось в начале 70-х гг. XX в., когда учёные обнаружили, что фрагменты ДНК, принадлежащие двум различным вилам организмов, можно соединить в пробирке (in vitro) и получить в результате новую молекулу ДНК.
Научившись делать это, люди обрели возможность управлять генами, «перетасовывать» их, комбинировать по своему вкусу. Искусственно полученные молекулы ДНК стали называть рекомбинантными (приставка «ре-» в данном случае переводится с латыни как «вновь», т. е. рекомбинантная молекула — это новая комбинация из исходных молекул).
Чтобы получить рекомбинантную ДНК, необходимо «вырезать» нужные фрагменты из исходных ДНК, а затем «склеить» их между собой. Для этого требуются очень точные и эффективные молекулярные инструменты. Оказалось, что они уже есть в живой клетке. Это ферменты — универсальное изобретение природы, взятое на вооружение генной инженерией.
Неисчислимы имена дьявола: Сатана, Люцифер, Бафомет, Мефистофель, Воланд, Леонард... Тот дьявол, каким мы его представляем - с рогами и копытами, изрыгающий серу и черный, как ночь, - был описан папой Григорием Великим (540 - 604 гг.). Но корни этого образа уходят гораздо глубже, к иранскому Ариману, богу зла, предвосхитившему Сатану иудаизма. В отличие от Аримана, Сатана не считался равным соперником Бога, его как бы терпели до поры до времени как часть Божественного Замысла.
Христианство подхватило и развило эту идею, наделив Источник Зла атрибутами самых разных языческих богов. Так, папа Григорий позаимствовал для него рога и копыта у греческого Пана, связь с огнем - у римского Вулкана, черноту - у Сатурна, бороду и серное дыхание - у скандинавского Тора.
Другие боги, преимущественно ветхозаветной поры, дали имена для свиты Сатаны: Вельзевул, Астарот, Асмодей. Сам Сатана был идентифицирован с восставшим ангелом Люцифером, который был побежден и низвергнут в адскую бездну вместе с теми, кто пошел за ним.
С момента открытия гена как единицы наследственности учёные полагали, что он представляет собой непрерывную нуклеотидную последовательность, в которой заложена информация об одном белке, что ДНК — это непрерывная череда генов и, наконец, что ген занимает строго определённое положение в хромосоме. И если бы кто-нибудь ещё в 80-х гг. XX столетия сказал, что всё это не так, его, наверное, сочли бы сумасшедшим. Однако постепенно накапливались факты, которые не поддавались объяснению исходя из общепринятых представлений. Ведь основные закономерности строения и функционирования генов были установлены при исследовании бактерий. А вот в эукариотической ДНК гены оказались организованы значительно сложнее.
Поскольку ДНК несёт генетическую информацию, её нуклеотидная последовательность должна сохраняться неизменной в течение жизненного цикла клетки и точно воспроизводиться в ходе репликации. Однако довольно часто под воздействием различных факторов (например, химических веществ или излучения) в молекуле ДНК возникают повреждения. Бывает, что основания изменяются и теряются, межнуклеотидные связи — разрываются, а некоторые основания сшиваются друг с другом. Это изменение может влиять на следующие поколения клеток. Наследуемое изменение нуклеотидной последовательности ДНК называется мутацией (от лат. mutatio — «изменение», «перемена»).
После того как учёные установили генетическую роль ДНК, возник вопрос: каким образом наследственная информация записана в этой молекуле? И прежде всего необходимо было определить, что же представляет собой эта информация.
Вначале полагали, что молекула ДНК построена из регулярно повторяющихся сочетаний четырёх различных нуклеотидов, например ...АТГЦ АТГЦ АТГЦ... или ...ГАЦТ ГАЦТ ГАЦТ... Но эти взгляды оказались ошибочными. Как следовало из экспериментов Чаргаффа, четыре основания содержатся в ДНК в различных количествах, но при этом количество А всегда равно количеству Т, а количество Г — количеству Ц. В действительности нуклеотидная последовательность ДНК нерегулярная, но строго определённая. Вот так выглядит фрагмент последовательности ДНК кишечной палочки:
Современный уровень понимания функционирования ДНК достигнут благодаря совместным усилиям различных наук. Из биологии было известно, что передача наследственной информации напрямую связана с хромосомами — сложными объектами, расположенными в клеточном ядре. Эта информация закодирована в большом количестве генов — единиц наследственности. Но что представляют собой гены, и каким образом они выполняют свои функции? Это стало ясно в 40-х гг. XX в. после опытов Эйвери. Если молекула ДНК способна передавать наследуемые свойства от одной бактерии к другой, значит, гены и ДНК — одно и то же, другими словами, гены это отдельные участки ДНК. А хромосома, как выяснилось позднее, — это одна очень длинная молекула лвухцепочечной ДНК.
В молекуле ДНК, содержащей от нескольких миллионов до нескольких миллиардов нуклеотидных пар, сосредоточено большое количество генов. Общее число генов можно оценить у таких простых организмов, как бактерии. Эти организмы не имеют ядра, иих единственная хромосома расположена в цитоплазме. Подсчитано, например, что ДНК кишечной палочки, состоящая из 4 млн. нуклеотидных пар, включает от 3000 до 5000 генов. Если предположить, что кишечная палочка содержит 3000 генов, то каждый образует примерно 1300 нуклеотидных пар (4 000 000:3000). Тот факт, что пары оснований в двойной спирали ДНК расположены на расстоянии 0,34 нм друг от друга, позволяет рассчитать физическую длину гена: 0,34 нм•1300=440 нм, или 0,44 мкм. Поскольку молекулярная масса одной нуклеотидной пары составляет примерно 650, то молекулярная масса среднего гена кишечной палочки 650•1300=845000.
Цепи ДНК могут быть очень и очень длинными. Например, в ДНК кишечной палочки Escherichia coli насчитывается 4 млн. нуклеотидов, а в ДНК человека — 5 млрд.! Запись нуклеотидной последовательности ДНК кишечной палочки в однобуквенном обозначении заняла бы 2200 страниц, а чтобы записать последовательность ДНК человека потребовалось бы 2 800 000 страниц. Линейная длина ДНК, содержащейся в клетке кишечной палочки, составляет 0,0014 м, или 1,4 мм, а человека — 1,7 м. Несмотря на огромную протяжённость, молекула ДНК имеет маленький поперечный размер: её диаметр 2 нм. Это значит, что если толщину молекулы ДНК увеличить до толщины человеческого волоса и при этом пропорционально увеличить её длину, то этим «волосом» можно было бы опоясать земной шар по экватору! Длина молекулы ДНК намного превосходит величину не только клеточного ядра, но и всей клетки.
Исходя только из химической структуры ДНК невозможно определить механизм передачи генетической информации. Для функционирования такой сложной молекулы важна не только химическая природа составляющих её элементов, но и форма, которую принимает в пространстве хитроумно уложенная цепь. Учёные понимали, что ключ к разгадке того, как работает ДНК, находится в её пространственной структуре.
Первым шагом на пути к разгадке секрета этой структуры стали результаты экспериментов американского биохимика Эрвина Чаргаффа (родился в 1905 г.). Он изучал содержание и состав ДНК в различных организмах и установил в 40-х гг. ряд важных закономерностей. Во-первых, в ДНК, выделенной из разных клеток одного организма, процентное содержание нуклеотидов А, Т, Г и Ц (биохимики называют его нуклеотидным составом ДНК) одинаковое. Это значит, что любая клетка содержит полный набор информации обо всём организме. Во-вторых, у каждого биологического вида своё характерное соотношение (Г + Ц) : (А + Т), которое всегда остаётся постоянным. У разных видов оно колеблется от 22 до 74%. И в-третьих, в любой ДНК независимо от вида организма число остатков А всегда равно числу остатков Т, а число остатков Г — числу остатков Ц. Исходя из этого, учёные сделали вывод, что основания в ДНК встречаются попарно: если есть остаток А, то обязательно должен быть остаток Т, точно так же, как появление Г вызывает появление Ц.
Решающий эксперимент выполнили английские исследователи Розалин Элси Франклин (1921—1958) и Морис Хью Фредерик Уилкинс (родился в 1916 г.). Им удалось получить рентгенограмму волокон ДНК. На снимке чётко виден крест в середине, а также сильно затемнённые зоны в верхней и нижней частях. Когда рентгеновские лучи проходят через кристалл, они отклоняются от прямолинейного движения (или, как говорят физики, претерпевают дифракцию) из-за ядер атомов, встречающихся на их пути. По отклонениям лучей можно определить расположение (координаты) атомов в исследуемом кристалле. В молекуле ДНК очень много разных атомов, поэтому дифракционная картина чрезвычайно сложная.
Крест в центре рентгенограммы говорит о том, что молекула ДНК свёрнута в спираль. Любая спираль — это повторяющаяся структура. В молекуле | ДНК на каждом новом витке атомы повторяют в пространстве положение атомов на предыдущем витке. Минимальное расстояние между двумя повторяющимися точками спирали называется её периодом. Период спирали ДНК оказался равен 3,4 нм.
Итак, после экспериментов Чаргаффа и Уилкинса выяснилось, что основания в ДНК образуют пары, а сама молекула свёрнута в спираль. Теперь перед учёными стояла задача предложить такую модель структуры ДНК, которая соответствовала бы результатам этих исследований и объясняла, как генетическая информация может передаваться по наследству с помощью ДНК.
При всём сходстве химического строения молекулы ДНК и РНК выполняют совершенно разные функции в клетке. За хранение и передачу генетической информации отвечает ДНК, а РНК — лишь посредник в процессе считывания этой информации. Так как молекула ДНК имеет огромные размеры и очень плотно упакована в ядре, то извлекать информацию непосредственно из неё неудобно. А главное, клетке не всегда нужна полная информация, иногда требуется считать лишь отдельные сведения. Очень наглядна аналогия ДНК с гигантской библиотекой, в которой собраны все литературные произведения. Ведь если требуется прочитать одно конкретное сочинение, например «Преступление и наказание», удобнее взять отдельный том, а не полное собрание мировой литературы.
ДНК — полное собрание наследственной информации, РНК — отдельный том.
Клетка пошла по такому же пути. В нашем примере отдельная книга — это молекула РНК.
РНК — почти полная копия маленького кусочка ДНК, с которого считывается генетическая информация. Разница между ДНК и РНК состоит только в структуре углеводных остатков и одного из оснований. Но эта небольшая разница в строении приводит к значительным различиям в свойствах. Из-за того что углеводный остаток РНК содержит 2'-гидроксиль-ную группу, эта молекула, в отличие от устойчивой ДНК, легко подвергается гидролизу в клетке. Она живёт всего несколько минут, но этого достаточно, чтобы считать генетическую информацию. Нестабильность РНК — отнюдь не недостаток, а ценное свойство, которое позволяет регулировать её количество в клетке. Чем важнее генетическая информация, тем больше образуется РНК-копий. Но если данная информация вдруг утратит свою значимость, РНК быстро исчезнет, и клетка не будет отвлекаться на считывание «ерунды».
Помимо углеводов, на упаковке пищевых продуктов обычно указывается содержание жиров и белков. Жиры представляют собой основное резервное топливо (его ещё называют «энергетическим депо») живых организмов. Как правило, клетка начинает извлекать энергию из жиров, когда исчерпан запас углеводов. Происходит это в клетках печени, почек, сердечной и скелетных мышц. У голодающих животных, пребывающих в состоянии спячки, у перелётных птиц жир — главный источник энергии.
Молекулы триглицеридов (основы жиров) состоят из связанных друг с другом молекул глицерина и жирных кислот — органических соединений, содержащих чётное число атомов углерода (от 14 до 22) и карбоксильную группу, из-за которой они и называются кислотами. Жиры расщепляются организмом на жирные кислоты и глицерин. Дальше их пути в клетке временно расходятся. Из глицерина образуется 1,3-дифосфоглицериновая кислота, и в таком виде он включается в гликолиз. А жирные кислоты окисляются; при этом от них отщепляются фрагменты, содержащие по два атома углерода. Эти фрагменты участвуют в .цикле Кребса. Здесь остатки жирных кислот встречаются с остатками глицерина и уже все вместе превращаются в углекислый газ.