Применение информационных технологий в биохимии





Скачать 383.36 Kb.
НазваниеПрименение информационных технологий в биохимии
страница6/9
Дата публикации25.04.2015
Размер383.36 Kb.
ТипРеферат
100-bal.ru > Информатика > Реферат
1   2   3   4   5   6   7   8   9

2.3 Распознавание фолда


Поиск последовательности в базе данных последовательностей и поиск структуры в базе данных структур — это задачи, имеющие решения. Смешанные задачи (поиск по структуре в банке последовательностей или по последовательности в банке структур) менее очевидны. Они требуют метода для оценки совместимости данной последовательности с данным способом фолда [1].

Цель состоит в выделении существенного набора последовательностей и структур. Ожидается, что белки, имеющие один и тот же паттерн, имеют схожие структуры.

J. U. Bowie, R. Lüthy и D. Eisenberg проанализировали окружение каждой позиции в известных белковых структурах и соотнесли с набором предпочте¬ний двадцати аминокислот в структурном контексте [1].

Имея белковую структуру, можно классифицировать окружение каждой аминокислоты по трем отдельным категориям:

1) водородные связи основной цепи, т. е. вторичная структура;

2) степень погруженности внутрь или экспонированности на поверхность белковой глобулы;

3) полярная/неполярная природа окружения [1].

Возможны три варианта вторичной структуры: α-спиралъ (helix), β -слой (sheet) и иное. Авторы определяют 6 клас¬сов аминокислот на основе доступности и полярности окружения. Боковые цепи каждого из этих шести классов могут быть в любом из трех типов вторичной структуры. Таким образом, всего получается 18 классов. Если отнести каждую боковую цепь к одному из 18 классов, то можно, пользуясь алфавитом из 18 букв, создать описание белковой структуры, называемое профилем трехмерной структуры (ЗD-профилем). К «последовательностям», в которых таким образом закодированы структуры, можно применить алгоритмы, разработанные для поиска последовательностей. Например, можно попытаться выровнять две далекие друг от друга родственные последовательности путем выравнивания их ЗD-профилей, а не самих аминокислотных последовательностей. Метод ЗD-профилей превращает белковые структуры в одномерные объекты, не сохраняющие точно ни последовательность, ни структуру молекул, из которых они были получены [1].

Далее необходимо соотнести ЗD-профиль с набором известных последовательностей и структур. Очевидно, что некоторые аминокислоты «не рады» находиться в определенных местах; например, заряженная боковая цепь не может быть спрятана внутри совсем неполярного окружения. Остальные предпочтения не столь четки, поэтому необходимо составить таблицу предпочтений на основе статистического обзора библиотеки, содержащей белковые структуры высокого качества [1].

Когда у исследователя есть последовательность и он хочет оце¬нить вероятность того, что она принимает, скажем, фолд глобина, то из ЗD-про-филя известной структуры миоглобина кашалота он знает класс окружения у каждой позиции в последовательности. Далее исследователь рассматривает частичное «выравнивание» неизвестной последовательности с миоглобином кашалота и предполагает, что первому остатку миоглобина соответствует в неизвестной последовательности остаток фенилаланина. В ЗD-профиле класс окружения первого остатка миоглобина следующий: экспонированная боковая цепь, нет вторичной структуры. Можно оценить вероятность нахождения фенилаланина в этом классе окружения, используя таблицу предпочтений отдельных аминокислот для этого класса ЗD-профилей Распространение этих подсчетов на все позиции и на все возможные выравнивания (не допускающие разрывов внутри участков, имеющих вторичную структуру) дает число, которое оценивает, насколько хорошо данная неизвестная последовательность подходит профилю миоглобина кашалота [1].

Особое преимущество этого метода состоит в том, что он может быть автоматизирован. Новую последовательность можно сравнивать с каждым ЗD-профилем в библиотеке известных фолдов по сути таким же способом, какой отработан для сравнения новой последовательности с библиотекой известных последовательностей [1].

ЗD-профиль, полученный из структуры, весьма опосредованно зависит от аминокислотной последовательности, но вместе с тем эффективно используется для определения качества структур. Есть два интересных наблюдения:

1. Белковые структуры, хорошо соответствующие собственным профилям на родственных белках, дают высокий вес сопоставления самих структур этих белков между собой. Профиль является абстрактным свойством семейства, а не только индивидуально белка.

2. Когда родственная последовательность плохо соответствует профилю, полученному из экспериментальной структуры этой последовательности, то, по-видимому, в структуре есть ошибка. Позиции, где профиль не соответствует последовательности, могут указывать на область, где находится ошибка [1].

Методом распознавания фолда является трединг (threading — протягивание). Основная идея данного метода состоит в том, чтобы построить много грубых моделей для данной последовательности, используя всевозможные выравнивания с последовательностями, для которых известна структура. Систематическое исследование множества возможных выравниваний определило название метода. Можно представить, что осуществляется аккуратное протягивание белковой последовательности через известную трехмерную структуру. При этом допустимы вставки и делеции, но если протягивание достаточно мягкое, то метафора «протягивания» остается в силе [1].

Как трединг, так и моделирование по гомологии, имеют дело с трехмерными структурами, индуцированными выравниваниями искомой последовательности и последовательности, для которой трехмерная структура определена. Моделирование по гомологии концентрируется на множестве выравниваний и имеет целью построение детальной структуры. Трединг использует множество различных выравниваний и работает только с грубыми моделями, иногда даже не построенными явно. Для успешного распознавания с использованием трединга требуется:

1. Метод для оценки моделей, позволяющий выбрать одну.

2. Метод калибровки весов, чтобы можно было понять, на сколько выбранная модель хороша [1].

Было испытано несколько аппроксимаций взвешивания. Одна из наиболее эффективных основана на эмпирической оценке близости аминокислотных остатков, полученной из анализа известных структур. Наблюдения над межостаточными расстояниями в известных структурах для всех 20 х 20 пар типов остатков. Для каждой пары остатков было построено распределение вероятностей пространственных расстояний между остатками. Например, для пары Leu-Ile были рассмотрены все Leu и Ile во всех структурах и были вычислены пространственные расстояния между Сβ-атомами и расстояния по последовательности. Коллекция этих данных позволила построить оценку, насколько хорошо расстояния в модели соответствуют расстояниям в известных структурах [1].

Распределение Больцмана связывает энергию и вероятность. При трединге — из вероятности выводится энергия. Эта энергетическая функция используется для оценки качества модели [1].

Для каждой структуры из библиотеки процедура находит соответствие остатков, доставляющее минимум энергии. Хотя это и является задачей выравнивания, нелокальность взаимодействий не позволяет применить здесь метод динамического программирования [1].

Наилучшие методы предсказания фолда единообразно эффективны. Они включают методы, основанные на трединге, но не ограничиваются им.

Программа ROSETTA — продукт лаборатории D. Baker для предсказания структуры белка по аминокислотной последовательности. Данная программа использует информацию об уже расшифрованных структурах. В настоящий момент, данный программный продукт опережает свои аналоги на несколько корпусов [1, 3].

ROSETTA, используя данные об уже имеющихся структурах, сначала предсказывает структуру отдельных фрагментов, объединяя их впоследствии в единую структуру. Вначале последовательность разбивается на фрагменты от 3 до 9 аминокислот и происходит поиск схожих фрагментов в белках с из¬вестной структурой. Поскольку фрагменты достаточно короткие, то никаких предположений о родственных связях между белками не делается. Исходя из возможных вариантов структуры отдельных фрагментов, рассчитываются возможные варианты структуры белка в целом [1,3].

ROSETTA использует для анализа таких комбинаций метод Монте-Карло. Основная идея заключается в том, что структура, полученная наибольшее количество раз в ходе независимых испытаний Монте-Карло, и будет наиболее правдоподобной моделью [1].

Сейчас полностью автоматизированное выполнение программы Rosetta для предсказания структуры белков осуществляется с помощью Internet сервиса Robetta, который также включает средства анализа, позволяющие сделать выводы о структуре белков на основе геномных данных. Программа Rosetta была эффективно использована для описания структур CASP-5 [3].



Рисунок 2.3.1 - Результаты построения пространственных структур для белков CASP-5 с помощью программы ROSETTA

Слева изображена модель пространственной структуры белка, построенная программой ROSETTA, а справа – нативная пространственная структура данного белка. Таким образом, модель оказалась очень близка нативной пространственной структуре белка.

Сервис Robetta разбивает введенные аминокислотные последовательности белков на отдельные домены и осуществляет построение моделей не только для доменов, последовательности которых гомологичны таковым для белков с известной структурой (сравнительное моделирование – программа Rosetta), но и для доменов, лишенных такой гомологии (метод Rosetta de novo). Кроме того, сервер может определять структуры белков с помощью программы RosettaNMR на основе данных ЯМР, предоставленных пользователем. В качестве результата пользователь получает предсказания для доменов и молекулярные координаты моделей распределения для всей последовательности, которая вводилась в запросе [4, 6, 11].

Алгоритм действий для получения пространственной структуры белка с помощью программы Rosetta на сервисе Robetta следующий [11]:

1. Пользователь должен зарегистрироваться на сайте http://robetta.bakerlab.org/register.jsp прежде, чем сделать запрос на сервис Robetta.

2. Пользователь предоставляет аминокислотную последовательность белка, для которого хочет получить пространственную структуру.

Последовательности, предоставляемые на сервер для предсказания структуры, должны быть записаны в формате однобуквенных аминокислот. Они могут быть либо вставлены в форму запроса, либо загружены из файла. Пользователи могут или предоставить последовательность для идентификации отдельных доменов, или для предсказания полной последовательности. У пользователя также имеется возможность указать PDB ID того белка и той цепи, которые будут использоваться для сравнительного моделирования.



Рисунок 2.3.2 - Результаты, полученные при использовании сервера ROBETTA для предсказания структуры белка

В верхней части экрана предоставляются цифровые и статические данные (A), внизу экрана располагаются непосредственно смоделированные трехмерные белковые структуры (в данном случае первые 6 из 10 предсказанных структур (B)).

3. Для загрузки результатов по предсказанию структуры целевого белка на адрес электронной почты пользователя по завершению работы высылается особая ссылка. Поскольку библиотеки фрагментов являются большими (мегабайты), то данные по запросу удаляются с сервера через неделю после завершения работы.
1   2   3   4   5   6   7   8   9

Похожие:

Применение информационных технологий в биохимии iconПрименение информационных технологий в физиологии и биохимии растений
Характеристика информационных технологий, применяемых в физиологии и биохимии 5
Применение информационных технологий в биохимии iconПрименение информационных технологий в системе образования
Понятие информационных технологий. Роль средств новых информационных технологий в образовании 10
Применение информационных технологий в биохимии iconПрименение информационных технологий в исследованиях поэтических...
Применение информационных технологий в исследованиях поэтических особенностей стиля Ю. Левитанского 12
Применение информационных технологий в биохимии iconПрименение информационных технологий в изучении истории древнего...
Применение информационных технологий в изучении истории древнего мира в 5-ых классах
Применение информационных технологий в биохимии iconПрименение информационных технологий на уроках английского языка...
Возможности использования информационно-коммуникативных технологий в обучении английскому языку 17
Применение информационных технологий в биохимии iconПрограмма профессионального модуля пм. 07 «Применение информационных...
ПМ. 07 "Применение информационных технологий в профессиональной деятельности" разработана на основе Федерального государственного...
Применение информационных технологий в биохимии iconВыпускная работа по «Основам информационных технологий»
Реферат: «Применение информационных технологий в исследовании и описании безэквивалентной лексики» 6
Применение информационных технологий в биохимии iconВыпускная работа по «Основам информационных технологий»
«Применение информационных технологий в географии на примере оценки недвижимости» 5
Применение информационных технологий в биохимии iconВыпускная работа по «Основам информационных технологий»
Реферат по ит в предметной области: «Применение информационных и коммуникационных технологий в обучении иностранному языку» 4
Применение информационных технологий в биохимии iconВыпускная работа по «Основам информационных технологий» на тему «Применение...
Реферат «Применение информационных технологий в решении нелинейных уравнений методом последовательных приближений.» 3
Применение информационных технологий в биохимии iconПрименение информационных технологий на уроках истории и обществоведения...
Возможности использования информационно-коммуникативных технологий в обучении истории 17
Применение информационных технологий в биохимии iconКурсовая работа на тему: Применение информационных технологий на рабочем месте пользователя
Тема курсовой работы: «Применение информационных технологий на рабочем месте пользователя»
Применение информационных технологий в биохимии iconПрименение информационных технологий для эконометрического анализа...
Гоу впо «башкирская академия государственной службы и управления при президенте республики башкортостан»
Применение информационных технологий в биохимии iconПрименение информационных технологий в производственной деятельности
Реферат на тему «применение информационных технологий в производственной деятельности» Введение 4
Применение информационных технологий в биохимии iconПрименение информационных технологий в банковской сфере
Банки стараются извлекать информацию о своих клиентах, предоставлять им банковские услуги наиболее приемлемым способом, в связи с...
Применение информационных технологий в биохимии iconПрименение информационных технологий в педагогической деятельности
Для подготовки к урокам и классным часам с использованием информационных технологий приходилось затрачивать много времени и, одновременно...


Школьные материалы


При копировании материала укажите ссылку © 2013
контакты
100-bal.ru
Поиск