Feb. 19th, 2017

g_ryurikov: (Default)

XII
Генетический код


Итак, информация о первичной структуре белков закодирована в структуре ДНК. Каким образом в ДНК (и вообще в нуклеиновых кислотах) может быть что-то закодировано? Вообще информация — это любые свойства объекта, который является их носителем (от лат. informare — «придавать форму»). Если мы хотим, чтобы какой-то определённый класс объектов использовался как хранилище информации, внутри этого класса должно существовать какое-то разнообразие «форм». Например, можно передавать информацию, используя разнообразие слов в языке, но если разрешено использовать только одно слово, информацию передать будет затруднительно: ведь если заранее известно, какое слово будет произнесено, где информация?

«Разнообразие форм» может быть реализовано двумя основными способами — переход от одной формы к другой может быть плавным или скачкообразным (дискретным). Скажем, текст, набранный с помощью букв, представляет собой одно из дискретных состояний (нельзя менять буквы плавно, буква или заменена на другую, или нет), поэтому существует строго определённое конечное число текстов заданной длины. Если же информация передаётся с помощью формы кусочка пластилина, то существует практически бесконечное число форм, которые он может иметь. В этом состоит разница между цифровой и аналоговой информацией: цифровая информация предполагает дискретное изменение, аналоговая — непрерывное.

Здесь надо сделать важную оговорку: на микроуровне весь наш материальный мир имеет дискретную природу: вещество состоит из атомов, которые теоретически можно пересчитать, энергия тоже передаётся в виде дискретных единиц (квантов). Нельзя передать пять с половиной молекул воды, нельзя передать полкванта энергии. Это означает, что, к примеру, количество воды в стакане, которое я, казалось бы, могу изменять плавно, на самом деле описывается конечным (хоть и очень большим) числом состояний. Но если мы говорим о кодировании информации, важное значение будут иметь свойства системы, которая информацию воспринимает, считывает. В самом общем виде под считыванием информации можно понимать изменение структуры одного материального носителя на основе информации, содержащейся в структуре другого носителя. (Когда я читаю текст — что-то меняется в моём мозгу.) Если в ходе такого считывания распознаётся изменение количества воды в стакане на одну молекулу — сигнал цифровой. Если же разрешающая способность ниже, для «считывающей» системы изменение уровня воды будет выглядеть плавным, и сигнал будет функционально аналоговым.

Наследственная информация закодирована в ДНК, а ДНК — это молекулы, то есть объекты микромира. Записана информация в них в виде последовательности нуклеотидов, то есть «ТТАГГЦАТЦГГГ» — это одно содержание, а «ГГГГААЦАТАГГ» — другое. Очевидно, существует конечное число последовательностей заданной длины; причём замена одного-единственного нуклеотида может иметь значение. Поэтому генетический код — цифровой.

Под генетическим кодом понимается именно сам способ перекодировки, «ключ» к шифру. После открытия структуры ДНК перед биологами встала задача установить, как именно последовательность нуклеотидов определяет последовательность аминокислот в белках. Прежде всего, код может быть перекрывающимся или неперекрывающимся. Можно ли провести чёткую границу, которая разделяет участок, кодирующий одну аминокислоту, от участка, кодирующего другую, или они могут «перехлёстываться»? К примеру, в тексте «СОБАКАБЛУКРОПЕРАЦИЯ» содержатся слова «собака», «каблук», «укроп», «операция» — это пример перекрывающегося кода. В пятидесятые годы XX в. было предложено много разнообразных моделей, исходивших из того, что код перекрывающийся (например, «бубновый код» Георгия Гамова). Но перекрывающийся код, очевидно, накладывает ограничения на возможные последовательности аминокислот (так же как и в примере выше не могла бы быть любая последовательность слов), тогда как со временем стало ясно, что жёстко определённых правил чередования аминокислот в белках нет. Значит, код неперекрывающийся.

Простейший способ закодировать последовательность символов из одного набора последовательностью символов из другого набора — просто сопоставить каждому символу из первого символ из второго. Так устроена куча известных нам кодов, например, шифр «пляшущих человечков» Конан Дойля:




Читать дальше )
Page generated Sep. 22nd, 2017 06:45 pm
Powered by Dreamwidth Studios