Структурный анализ
Страница 1

Первичная структура. Если имеются данные о нуклеотидной последовательности одной цепи, то большинство программ позволяют построить комплементарную цепь, вычислить нуклеотидный состав, выявить участки, богатые пуринами, пиримидинами или определенными сочетаниями оснований, и определить частоту встречаемости различных динуклеотидов. Могут быть выявлены специфические субпоследовательности в пределах определенного сегмента, что часто используется для нахождения сайтов для рестриктирующих эндонуклеаз. В программу введена информация о сайтах узнавания для известных ферментов, и по одной команде выдаются сведения о положении этих сайтов для каждого из ферментов, числе ожидаемых фрагментов, образующихся при расщеплении ими ДНК, размере каждого фрагмента в парах оснований и его процентном отношении к общей длине сегмента, а также о нуклеотидных остатках, соответствующих концам каждого фрагмента. Существуют также программы, которые могут предсказать, какие продукты будут получены при совместном действии двух или нескольких эндонуклеаз. При этом предсказания делаются как для линейных, так и для кольцевых молекул. Полученная информация может использоваться для подтверждения данных секвенирования путем сравнительного анализа ожидаемого и реального результатов действия эндонуклеаз.

Имеющиеся программы осуществляют также поиск характерных особенностей последовательностей, включая прямые и обратные повторы. Выявляются не только полностью совпадающие сегменты, но и сегменты с той или иной степенью несовпадения; для этого допускаются определенные отклонения параметров, заложенных в программу, от фиксированного значения. В примере перечислены все повторы длиной не менее шести пар оснований и гомологичные не менее чем на 75%. Предполагается, что максимальный размер образующихся петель равен двум основаниям.

Можно получить данные о гомологии или частичной гомологии различных последовательностей. Эти данные могут касаться структуры одного и того же гена у двух разных организмов или родственных генов одного организма. Такой сравнительный анализ широко используется при изучении эволюции на молекулярном уровне. Для сравнения двух последовательностей между собой или одной последовательности с группой других последовательностей разработаны специальные алгоритмы. Может использоваться описанный ранее вероятностный анализ. По результатам сравнения информации о последовательностях, полученной в разных лабораториях, был создан центральный банк данных, из которого всегда можно затребовать информацию о тех или иных последовательностях. К 1989 г. в банках имелась информация о последовательностях более 20 миллионов пар оснований, представляющая данные о многих генах и организмах.

Помимо этого общего применения, обнаружение сходства различных последовательностей является составной частью секвенирования очень длинных последовательностей с помощью дидезокси-метода, объединенного с клонированием в фаге М13. Используя компьютер для обнаружения перекрывающихся последовательностей, мы не только делаем работу менее утомительной, но и можем быстро решить, следует ли нам пытаться получить дополнительные данные.

Вторичная структура. Разработаны программы, позволяющие предсказать стабильную внутримолекулярную вторичную структуру одноцепочечных РНК или ДНК. Они позволяют, например, построить модель укладки цепи тРНК и рРНК, и многие из таких моделей получили экспериментальное подтверждение в опытах с использованием нуклеаз, специфичных к одноцепочечным участкам. Расчеты основаны на предположениях о вероятности образования определенных пар оснований, на термодинамических свойствах разных пар оснований и данных о стабильности спирали.

в. Биологическое значение

С помощью компьютерных программ можно перевести информацию с языка нуклеотидов на язык аминокислот в соответствии с правилами генетического кода. При этом указываются все три возможные рамки считывания и стоп-кодоны трансляции. В тех случаях, когда аминокислотная последовательность кодируемого полипептида известна, идентифицировать правильную рамку считывания не составляет труда. В противном случае правильную рамку можно выбрать, исходя из ее длины. Рамки, в которых часто встречаются стоп-кодоны, вряд ли могут считаться правильными. Показаны часть генома SV40, кодирующая участок вблизи г\ГИ2-конца малого и большого Т-антигенов, и полученные с помощью компьютера аминокислотные последовательности для всех трех рамок считывания. Правильной является третья рамка. Можно также рассчитать частоту, с которой встречается каждый кодон, и таким образом выявить предпочтительные кодоны для определенных аминокислот. Обращение этой процедуры позволяет воссоздать возможные нуклеотидные последовательности, исходя из известной аминокислотной последовательности полипептида, хотя эта задача не имеет однозначного решения вследствие вырожденности генетического кода. Центральный банк данных содержит информацию об аминокислотных последовательностях всех проанализированных полипептидов, что позволяет сравнивать последовательности изучаемого и известных белков.

Страницы: 1 2


Прочие статьи:

Пороки заквасок
В производственных заквасках наиболее часто могут возникать следующие пороки: снижение активности закваски или несквашивание молока, наличие бактерий группы кишечных палочек, излишняя кислотность, вспучивание, ослизнение, тягучесть и др. ...

Собаководство на Руси в IX- XIV в. Вопрос о возможности собаководства в Русском государстве
Следует заметить, что основным что основной разновидностью служебного собаководства в Русском государстве являлось охотничье собаководство. Специфичность использования различных групп пород охотничьих собак для разных видов охот, могла, е ...

Царство растений. Общая характеристика
Царство растений включает более 500 тысяч видов. – растения способны к фотосинтезу; – клетки растений покрыты плотной целлюлозной оболочкой; – у растений наблюдается высокая расчлененность тела; – существуют некоторые ограниченные дви ...

Разделы