Студенческий сайт КФУ - ex ТНУ » Учебный раздел » Учебные файлы »Биология

Разработка алгоритмов для оптимизации пространственных структур РНК

Тип: дипломная работа
Категория: Биология
Скачать
Купить
Понятие молекулярной цепи, ее моделирование. Анализ деформации молекулы, получение функционала для упругой энергии вторичной структуры РНК. Характеристика свободного состояния молекулы. Разработка программных средств для нахождения координат нуклеотидов.
Краткое сожержание материала:

Размещено на

Введение

В настоящее время одной из важных задач молекулярной биологии является математическое моделирование пространственных структур нуклеиновых кислот: дезоксирибонуклеиновых кислот (ДНК) и рибонуклеиновых кислот (РНК). Важность этой задачи обуславливается тем, что основные параметры и процессы функционирования клетки какого-либо организма в первую очередь зависят именно от пространственной структуры её молекул.

Под пространственной структурой РНК (ДНК) понимается третичная структура молекулы, у которой задана вторичная структура. Вторичная структура молекулы РНК (ДНК) - это структура Уотсон-Криковских связей, попарно связывающих нуклеотиды в молекулярной цепи. В постановке данной задачи вторичная структура заданной молекулы предполагается заранее известной из молекулярной биологии. Третичная структура для РНК (ДНК) - это какая-то форма в трёхмерном пространстве, которую принимает её молекулярная цепь под действием Уотсон-Криковских и более слабых связей. Число потенциально возможных третичных структур у молекулы РНК (ДНК) с заданной вторичной структурой очень велико и практически ничем не ограничено.

Для определения пространственной структуры молекулы, на практике чаще всего используется рентгеноструктурный анализ. Однако этот физический метод является довольно длительным и затратным, в связи с чем и возникает потребность в менее трудоёмких методах определения пространственной структуры. В работе [7] был предложен способ моделирования сворачивания молекулы РНК на полноатомном уровне. Такой подход позволяет добиться высокой точности результатов, но требует длительного времени для расчёта необходимой пространственной структуры. Одним из менее точных, но зато более быстрых способов является математическое моделирование третичной структуры молекулы в виде набора тонких упругих стержней, который и будет рассмотрен в данной работе.

Из молекулярной биологии нам известно, что молекулярная цепь РНК (ДНК) составляется из нуклеотидов четырёх видов: A - аденин, G - гуанин, C - цитозин, а также U - урацил. Среди поперечных связей, которые образуются при сворачивании молекулярной цепи в пространственную структуру, наиболее сильными являются водородные Уотсон-Криковские связи, возникающие между основаниями некоторых нуклеотидов (между A и U, между C и G и между G и U).

Все нуклеотиды в молекулярной цепи можно разбить на два класса: спаренные и неспаренные. Нуклеотид называется спаренным, когда он образует Уотсон-Криковскую связь с каким-либо другим нуклеотидом той же молекулы. Поэтому молекулу можно разбить на некоторое количество участков, каждый из которых содержит несколько идущих подряд нуклеотидов, среди которых либо только спаренные, либо только неспаренные. Участки молекулы, состоящие из спаренных нуклеотидов, образуют двухнитевые (или двуспиральные) участки во вторичной структуре РНК (ДНК). Участки же, состоящие из неспаренных нуклеотидов, однонитевые участки во вторичной структуре молекулы. Однонитевые участки называются петлями, а двухнитевые - стеблями. Таким образом, вторичная структура молекулы - это совокупность её стеблей и петель.

Каждый стебель будем рассматривать как участок винтовой лестницы, где "ступеньки" - поперечные Уотсон-Криковские связи - имеют одинаковую длину и ориентацию относительно этой лестницы. Длиной стебля называется число пар нуклеотидов в нём.

Петлю можно рассматривать как замкнутую последовательность однонитевых участков РНК (ДНК), концы которых соединены Уотсон-Криковскими связями. Начало каждого следующего участка петли соединено с концом предыдущего, а конец последнего участка соединен с началом первого. Однонитевые участки, входящие в состав петли, называются ее ветвями, или звеньями. Длиной петли называется число свободных нуклеотидов, входящих в ее состав. Выделяют следующие типы петель:

a) Шпилечная петля c) Боковая петля

b) Внутренняя петля d) Многозвенная петля

Рис. 1: типы петель

Шпилечная петля: соединяет первую и вторую нить в одном стебле. Это простейшая однозвенная петля (она состоит из одного однонитевого участка). Считается, что шпилечная петля всегда содержит не менее трех нуклеотидов.

Внутренняя петля: содержит два однонитевых участка. Длины этих участков являются параметрами, определяющими петлю.

Боковая петля: это внутренняя петля, один из участков которой вырожден. Длина невырожденного участка является параметром, определяющим петлю.

Многозвенная петля: содержит несколько однонитевых участков. Число этих участков и их длины являются параметрами, определяющими петлю.

1. Постановка задачи

1.1 Свободное состояние молекулы

Молекулярная цепь рассматривается как тонкий упругий однородный стержень, имеющий в свободном состоянии форму винтовой линии (рис. 2). Так как по сравнению с длиной молекулы (до нескольких сантиметров) её толщина (~20 А) незначительна, то поэтому такое представление можно считать вполне допустимым. Длины участков нуклеотидов, которые составляют молекулярную цепь (расстояния между Уотсон-Криковскими связями), предполагаются равными. С шагом, равным длине одного нуклеотида, в стержень вставлены жёсткие перемычки, равные по длине половине Уотсон-Криковской связи.

Рис.2. Тонкий упругий стержень в свободном состоянии

Геометрические параметры винтовой линии и ориентация перемычек (Уотсон-Криковских связей) выбираются так, что два свободных стержня одинаковой длины, которые правильно расположены в пространстве, образуют двойную спираль в A-форме (рис. 3). Пространственная структура молекулы состоит из стеблей и петель в соответствии с заданной вторичной структурой - все элементы вторичной структуры последовательно нумеруются таким образом, что элемент с меньшим номером располагается ближе к начальной точке винтовой линии. В соответствии с краевыми условиями концы стержней, образующих петли, ориентируются так же, как концы нитей в стебле А-формы РНК.

Рис.3: Двойная спираль в A-форме:

a) шаг витка; b) малая бороздка; c) большая бороздка

1.2 Исходные параметры задачи

В качестве исходных данных для задачи выступают:

§ геометрические параметры (радиус, шаг витка) винтовой линии третичной структуры для свободного состояния молекулярной цепи РНК;

§ длина и ориентация Уотсон-Криковских связей для свободного состояния молекулярной цепи РНК;

§ количество нуклеотидов в каждом элементе вторичной структуры для напряжённого состояния молекулы РНК;

§ номер и тип (стебель либо один из 4-х видов петель) каждого элемента вторичной структуры напряжённого состояния РНК;

§ механические характеристики для элементов вторичной структуры (изгибные и крутильные жёсткости).

Под механическими характеристиками для элементов вторичной структуры подразумеваются крутильные и изгибные коэффициенты жёсткости для стержня, который соответствует свободному состоянию молекулярной цепи РНК. Стержни, соответствующие этим элементам, предполагаются однородными - то есть эти коэффициенты являются константами, не зависящими от длины участка данного стержня.

Так как молекула РНК, в отличии от молекулы ДНК, может принимать практически произвольные формы, то возникает задача определить истинную третичную форму молекулы РНК - форму, которую принимает молекула, находящаяся в равновесии. Из механики твёрдого тела (см. [6]) известно, что равновесному состоянию тела соответствует состояние, при котором значение упругой энергии тела достигает минимума.

Под упругой энергией стержня понимается работа, которая была совершена какими-то внешними силами при переводе этого стержня из свободного состояния в данное. Из аксиом линейной теории упругости (см. [2]) следует, что она потенциальна и аддитивна - поэтому упругая энергия всей молекулы равна сумме упругих энергий её элементов, соответствующих вторичной структуре.

1.3 Цель работы

Основная цель работы состоит в разработке алгоритма нахождения координат всех нуклеотидов, составляющих молекулярную цепь РНК, в оптимальной по энергии пространственной форме РНК - а также в конвертации полученных данных в формат Protein Data Bank, используемый в молекулярной биологии. Сначала мы определяем, какая из пространственных форм для напряжённого состояния данной молекулы (с заранее заданной вторичной структурой) является оптимальной по упругой энергии. А затем уже вычисляем координаты всех нуклеотидов в трёхмерном пространстве - уже для найденной оптимальной пространственной структуры, а также все геометрические параметры для элементов этой новой пространственной структуры.

Все исходные данные поставленной задачи заносятся в текстовые поля ввода программы, которая осуществляет нахождение оптимальной по уп...

Другие файлы:

База данных по регистрации больных в поликлинике
Анализ характеристик объекта компьютеризации. Разработка структур данных, алгоритмов и программного обеспечения системы управления базой данных. Особе...

Разработка и реализация алгоритмов трехмерной триангуляции сложных пространственных областей: итерационные методы

Использование ассемблера для оптимизации программ на C++
Рассматривается использование языка ассемблера для оптимизации программ, написанных на языке C++. Подробно изложены вопросы применения современных тех...

Разработка алгоритмов и программ решения алгебраических задач численными методами
Создание схем алгоритмов и составление программы на языке Pascal для вычисления значений заданных функций. Сущность и порядок нахождения значения опре...

Использование генетических алгоритмов для оптимизации базы правил
Характеристика методов нечеткого моделирования и изучение системы кластеризации в пакетах прикладных программ. Разработка и реализация алгоритма для о...