Задача

Как известно из начального курса биологии, Уотсон и Крик установили, что двухцепочечная ДНК «связывается» комплементарным спариванием оснований. Каждая цепь ДНК может рассматриваться как цепочка оснований, каждое из ко- торых выбирается из множества {A, C, G, T}[8].
Пары образуются как основаниями A и T, так и основаниями C и G; именно связи A-T и C-G удерживают две цепочки вместе.

Одноцепочечные молекулы РНК являются ключевыми компонентами многих процессов, происходящих в клетках, и строятся по более или менее одинаковым структурным принципам. Однако в отличие от двухцепочечной ДНК, у РНК не существует «второй цепи» для связывания, поэтому РНК обычно образует пары оснований сама с собой; это приводит к образованию интересных форм наподобие изображенной на рис. 6.13. Совокупности пар (и полученная форма), образованные молекулой РНК в этом процессе, называются вторичной структурой; понимание вторичной структуры необходимо для понимания поведения молекулы.

Рис. 6.13. Вторичная структура РНК. Жирными линиями обозначаются смежные элементы последовательности, а тонкими — элементы, образующие пары


Для наших целей одноцепочечная молекула РНК может рассматриваться как последовательность из n символов (оснований) алфавита {A, C, G, U}[9]. Пусть B = b1b2... bn — одноцепочечная молекула РНК, в которой все b {A, C, G, U}.

В первом приближении вторичная структура может моделироваться следующим образом. Как обычно, основание A образует пары с U, а основание C образует пары с G; также требуется, чтобы каждое основание могло образовать пару с не более чем одним другим основанием, иначе говоря, множество пар оснований образует паросочетание. Также вторичные структуры (снова в первом приближении) не образуют узлов, что ниже формально определяется как своего рода условие от- сутствия пересечений.

А если более конкретно, вторичная структура B представляет собой множество пар S = {(i, j)}, где i, j {1, 2, ..., n}, удовлетворяющих следующим условиям:

(i) (Отсутствие крутых поворотов) Концы каждой пары в S разделяются ми- нимум четырьмя промежуточными основаниями; иначе говоря, если (i, j) S,

то i < j - 4.

(ii) Любая пара в S состоит из элементов {A, U} или {C, G} (в произвольном по- рядке).

(iii) S является паросочетанием; никакое основание не входит более чем в одну пару.

(iv) (Отсутствие пересечений) Если (i, j) и (к, l) — две пары в S, то невозможна ситуация i < к < j < l (рис. 6.14).

а b

Рис. 6.14. Два представления вторичной структуры РНК. Во втором представлении (b) цепочка «вытянута в длину», а отрезки, соединяющие пары, выглядят как непересекающиеся

«купола» над цепочкой


Вторичная структура РНК на рис. 6.13 удовлетворяет свойствам (i)-(iv). Со структурной точки зрения условие (i) выполняется просто из-за того, что молекула РНК не может слишком резко изгибаться, а условия (ii) и (iii) определяются фун- даментальными правилами сочетания оснований Уотсона-Крика. С условием (iv) дело обстоит сложнее: непонятно, почему оно должно выполняться в природе. Но хотя в реальных молекулах встречаются отдельные исключения (так называемые псевдоузлы), как выясняется, это ограничение хорошо аппроксимирует простран- ственные ограничения реальных вторичных структур РНК.

Итак, из всего множества вторичных структур, возможных для одной молеку- лы РНК, какие конфигурации могут возникнуть в физиологических условиях? Обычно предполагается, что одноцепочечная молекула РНК образует вторичную структуру с оптимальной общей свободной энергией. На тему правильной модели свободной энергии вторичной структуры идут ожесточенные споры; но мы будем в первом приближении считать, что свободная энергия вторичной структуры про- порциональна количеству содержащихся в ней пар оснований.

После всего сказанного базовая задача предсказания вторичной структуры РНК формулируется очень просто: требуется найти эффективный алгоритм, который получает одноцепочечную молекулу РНК B = b1b2... bn и определяет вторичную структуру S с максимально возможным количеством пар оснований.

<< | >>
Источник: Дж. Клейнберг, Е. Тардос. Алгоритмы: разработка и применение. Классика Computers Science. 2016

Еще по теме Задача:

  1. ЗАДАЧИ ОБЩИЕ И ЗАДАЧИ СПЕЦИАЛЬНЫЕ
  2. 7. Каждый школьник – это сложнейший мир проблем и задач. Забота о своевременном решении этих проблем и задач составляет основу строительства новой школы
  3. Вторая зрелость наступает тогда, когда человек выполнил задачи зрелого человека, осознал задачи второй зрелости и готов их выполнять
  4. ЗАДАЧА
  5. ЗАДАЧА: РЕШЕНИЕ
  6. Основные задачи.
  7. в) Задачи
  8. в) Задачи
  9. ПСИХОАНАЛИЗ: ЗАДАЧА
  10. ЗАДАЧА ДВИГАТЕЛЬНАЯ
  11. Основные задачи
  12. Правило решаемой психологической задачи.
  13. Задачи и упражнения