Решена ли проблема корректного определения элементов вторичной структуры?





Скачать 235.55 Kb.
НазваниеРешена ли проблема корректного определения элементов вторичной структуры?
Дата публикации04.03.2016
Размер235.55 Kb.
ТипВопрос
100-bal.ru > Информатика > Вопрос
Московский государственный университет имени М.В.Ломоносова

Решена ли проблема корректного определения элементов вторичной структуры?

Реферат по биоинформатике

Александров И.А., 4 курс ФББ

Москва, 2012

Как объективно определить вторичную структуру, основываясь на структуре белка - это нерешенный вопрос. Определение границу между альфа и бета-спиралями, бета-тяжами часто субъективно, поскольку общепринятых стандартов не существует. В 2007 году вышла статья за авторством В. Чжаня, А. Кейт Данкера и Я. Чжоу, в которой описывался метод, в котором определение вторичной структуры (далее ВС.) основано на схожести ВС., назначенных тестам попарных выравниваний последовательностей. Данный метод был использован для того, чтобы ранжировать шесть методов определения вторичной структуры: STRIDE, DSSP, SECSTR, KAKSI, P-SEA и SEGNO с помощью трех признанных методов выравнивания последовательностей - PREFAB, SABmark, SALIGN).

Введение

Вторичная структура белка - это конформационное расположение главной цепи полипептида независимо от конформации боковых цепей или отношения к другим сегментам [1]

Знания о вторичной структуре белка крайне важно для структурной классификации, понимании динамики и механизма сворачивания и обнаружения консервативных структурных/функциональных мотивов. Информация о вторичной структуре также полезна для секвинирования и множественного выравнивания последовательностей, структурного выравнивая, а также выравнивания последовательности и структуры. В итого, предсказание вторичной структуры из белковой последовательности активно исследуется уже 62 года с тех пор, как впервые было предсказано, что альфа-спирали и бета-тяжи являются наиболее регулярными паттернами в структуре белка. Предсказание и принятие ВС. белка основано на определении элементов ВС. в данной белковой структуре с помощью автоматических компьютерных методов или же глазом человека.

Было изобретено множество компьютерных методов, чтобы автоматизировать определение ВС., например DSSP, STRIDE, DEFINE, P-SEA, KAKSI, P-CURVE, XTLSSTR, SECSTR, SEGNO, VoTAP, SheeP. Эти методы основаны либо на паттернах водородных связей, либо на геометрическом описании, либо на знаниях эксперта или же их комбинации. Однако часто результаты их не всегда совпадают. Для примера, различие в результатах DSSP, P-CURVE, DEFINE может составлять 25% или более. XTLSSTR находит больше бета-тяжей, а SECSTR находит больше спиралей по сравнению с тем же DSSP. Это несоответствие между различными методами вызвано неидеальными и неоднозначными конфигурациями спиралей и листов. И в результате определение границ между ними является весьма проблематичным и значимым источником несоответствия методов.

Несовместимость ВС., определенных разными методами, ярко обозначает необходимость метода или теста, который станет "стандартом", который можно будет использовать для оценки и сравнения методов определения. Первый вариант - использовать вторичную структуру, обозначенную авторами, что разрешили проблему белковой структуры. STRIDE, на самом деле, был оптимизирован, чтобы достичь наибольшего соглашения с авторскими аннотациями. Однако не всегда ясно, какой метод был использован для определения ВС. различными авторами. Второй вариант - использовать согласованные предсказания различных методов как золотой стандарт. Впрочем, нет никаких очевидных причин, почему каждый метод имеет одинаковый вес в определении ВС. Более того, нельзя даже сказать, какой метод должен быть выбран для этого самого соглашения! Другие методы включают в себя склонность к кэппированю спиралей, отклонение от идеальной конфигурации спирали или листа, а также структурной точности, полученной благодаря выравниванию последовательности-структуры.

Чжань и коллеги в своей статье использовали стандартные выравнивания последовательностей, чтобы оценить ВС.[2] Эти выравнивания основаны на 3D-структурном выравнивании гомологов белков. Вместо оценки точности определения ВС. напрямую (что является пока невозможным), они сравнивали две ВС. в структурно выровненных позициях. Авторы считают, что лучшим метод должен определять те же элементы ВС. с наибольшей частотой структурно выровненных позиций. Конечно, структурно выровненные позиции не всегда имеют ту же вторичную структуру, более того, разные методы выравнивания структур не всегда на выходе дают одинаковые результаты. Но, несмотря на это, данный метод дает возможность найти такой метод определения ВС., который обладает наибольшим соответствием с выравниванием третичной структуры. Авторы предположили, что этот подход приведет к объективному сравнению методов определения ВС.

Они сравнили шесть методов (DSSP, STRIDE, SECSTR, KAKSI, P-SEA и SEGNO) с помощью трех тестов выравнивания последовательностей, основанных на структурных выравниваниях. Как результат, наилучшими методами оказались KAKSI и STRIDE, а консенсус-метод, основанный на четырех методах, улучшает результат по сравнению с STRIDE и KAKSI

METHODS

Методы определения вторичной структуры

Итак, эти самые шесть методов - пять из них доступны в интернете, о шестом после.

DSSP - вероятно, наиболее популярная программа этого типа. Она определяет ВС., учитывая паттерны водородных связей. [4]

STRIDE - другой широко используемый метод для определения ВС. Эта программа использует не только паттерны водородных связей, но и торсионные углу главной цепи. Она была оптимизирована, чтобы совпадать со структурами белка, определенными экспертами. [5]

SECSTR является методом, похожим на DSSP в определении водородных связей. Эта программа использует дополнительную информацию для определения спиралей. [6]

P-SEA использует несколько геометрических методов для определения ВС. Эта программа не только учитывает расстояние между C (альфа), но и связанные с ними углы. [7]

SEGNO, как и P-SEA, является методом, основанным на геометрии. Определение спиралей основывается на том, можно ли разместить внутри воображаемый цилиндр или нет: они должны иметь определенный радиус по центральной оси. Оценка бета-листов основана на двугранных углах цепи и изменении пептидной связи. К сожалению, я не смог получить доступ к методу SEGNO, поэтому вместо него я буду использовать другой метод - SheeP[3].

SheeP - алгоритм детекции бета-тяжей в 3D-структурах белка и демонстрации каждого листа на карте бета-листов. Алгоритм использует не только паттерн водородных связей, но и ограничения на относительное расположение C (альфа) атомов. [8]

KAKSI - метод, основанный на геометрической информации набор характеристических значений расстояния С альфа и Фи/Пси углами главной цепи. Параметры KAKSI были выбраны таким образом, чтобы лучше всего соответствовать ВС., полученной из PDB. [9]

Однако из-за недостаточного понимания основ работы с UNIX-системами и языком программирования C я не смог настроить программу, а онлайн-сервис не был найден, поэтому будут приведены данные, полученные с помощью KAKSI лишь в той части, где их получили авторы. То же самое касается SEGNO.

Тесты выравниваний последовательностей.

PREFAB 4.0 содержит 1682 пар белков. Каждая пара структурно выровнена с помощью CE выравнивателя, и лишь те пары, у которых FSSP и CE совпали на 50 или более позиций были оставлены. Авторы убрали те пары белков, у которых последовательность белков в PDB и выравнивании не совпадали. Также несколько последовательности не дали в результате некоторых методов вторичной структуры по неясной причине. Был использован набор из 416 пар белков со средней степенью совпадения последовательностей в 29,6%, которые дали в той или иной степени результаты для всех 6 методов.

SABmark - тест множественного выравнивания. Содержит два набора: supeffamily set, содержащий последовательности с совпадения от низкого до промежуточного уровня, и twilight set, сделанный из последовательностей с низким уровнем совпадения последовательностей. Выравнивание проведено с помощью SOFI и CE. Из SABmark была взята одна пара белков из каждой группы "сумеречного" набора. В итоге был использован набор из 167 пар, среднее совпадение последовательностей составило 14,9%.

SALIGN содержит 200 пар с средним совпадением последовательности в 20%, 65% структурный эквивалент суперпозиции C (альфа) и rmsd в 3.5 ангстрем. Были взяты 143 пары из 200 для определения вторичной структуры. ССП составило 16,4%.

Все методы структурного выравнивания (CE, FSSP, TM-align, SOFI), использованные для указанных выше тестов (наборов) не используют вторичную структуру.

Для оценки возможных перекрытий между тремя вышеописанными тестами, были рассчитаны структурные совпадения между последовательностями в разных тестах. Два теста содержали гомологичную пару последовательностей, если две последовательности имели совпадение более чем 40%. Было обнаружено одно перекрытие между SABmark и SALIGN, пять перекрытий между PREFAB и SALIGN, четыре перекрытия между PREFAB и SABmark. Они не были убраны, поскольку их количество незначительно мало, а эти тесты использовались для теста, а не для тренировки.

Оценка.

Авторы оценивали каждый метод по уровню успеха или распределению структурно выровненных участков, попадающихся в различных методах. Было использовано определение по трем характеристиками: бета-петля (C), альфа-спираль (H), бета-тяж (E). Для DSSP и STRIDE были использованы следующие приближения: (H,G,I) -> H, (E,B) -> E, прочее -> C. Для SECSTR: (H,G,I) ->, (E,e) -> E, прочие -> C. KAKSI и P-SEA имеют только три значения.

Методы консенсуса.

Если два значения имеют одинаковые номера у разных методов, то вторичная структура выбиралась в соответствии с приоритетами: H, E, и лишь потом C. Авторы использовали такой приоритет, поскольку искали метод консенсуса, способный дать больше структурной информации, и расположение спиралей более узнаваемо, чем расположение тяжей, которые, в свою очередь, более узнаваемы, чем петли. На самом деле эффект от данного приоритета довольно мал. Например, различие между EHC и HEC составил лишь 0,1% для SKSP в PREFAB. Также был протестирован метод консенсуса, в котором методы не имеют одинаковый вес.

Результаты




STRIDE (%)

DSSP

(%)

SECSTR (%)

KAKSI (%)

P-SEA

(%)

SEGNO (%)

PREFAB

86.4±0.4

85.4±0.4

85.8±0.4

86.1±0.4

83.2±0.4

83.2±0.4

SALIGN

79.9±0.6

78.8±0.6

79.2±0.6

80.2±0.6

76.0±0.7

76.3±0.6

SABmark

81.2±0.8

80.0±0.8

80.0±0.8

82.0±1.0

77.8±1.0

81.1±1.0

Таблица 1: Среднее распределение структурно выровненных участков с помощью одного и того же метода определения (вместе со стандартным отклонением), полученное шестью методами определения вторичной структуры для трех тестов выравнивания последовательностей.

В таблице 1 показано распределение выровненных по структуре остатков с одинаковой ВС., а, точнее, успешное определение шестью данными шестью методами. Для PREFAB наилучшую точность продемонстрировал метод STRIDE (86,4%), KAKSI же оказался наилучшим для SALIGN (80,2%) и SABmark (82.0%). Однако различие в точности между STRIDE и KAKSI статистически незначительно для всех трех тестов (банков?). Результаты DSSP и SECSTR довольно близки и лишь приблизительно на 1% ниже STRIDE или KAKSI. P-SEA и SEGNO на 3% хуже лучших методов для PREFAB и SALIGN. В случае SABmark уровень успеха P-SEA на 4% меньше, а SEGNO - лишь на 1%

Эти результаты подтверждают различную эффективность методов и, соответственно, их различия в алгоритмах и действиях. Однако, согласитесь, довольно интересно было бы узнать, в какой степени тот или иной метод согласовывается с другим. В таблице 2 демонстрируется, каков процент ситуаций, когда различные методы дают одинаковую оценку вторичной структуры. DSSP, STRIDE и SECSTR больше других походят друг на друга, их "согласие" находится в промежутке от 92 до 95%. Вероятно, это "согласие" произошло из-за того, что они похожим образом определяют водородные связи. Эти три метода значительно отличаются от оставшихся - согласие между этими двумя группами составляет 81.9-85.0%. Более того, оставшиеся три метода также заметно (82.8-86.2%) различаются друг с другом. Это различие возникло, вероятно, из-за того, что они используют разные геометрические параметры для анализа вторичной структуры.




DSSP

(%)

STRIDE (%)

KAKSI (%)

SECSTR (%)

P-SEA

(%)

SEGNO (%)

DSSP

100

95.4

83.6

94.0

82.1

82.3

STRIDE




100

85.0

92.1

83.3

81.9

KAKSI







100

83.2

82.8

85.0

SECSTR










100

81.9

83.9

P-SEA













100

86.2

SEGNO
















100

Таблица 2. Парное согласие между шестью различными методами определения вторичной структуры для теста PREFAB .

Хочется отметить следующий интересный факт: KAKSI и STRIDE различаются на 15%, однако имеют наилучшую точность. Это вызывает предположение, что совмещение этих двух методов может быть полезно для улучшения определения вторичной структуры и структурного выравнивания. В таблице 3 показано, как успешно работают различные возможные комбинации 3-5 методов. DSSP не был включен авторами из-за сильного сходства с STRIDE (95%) и SECSTR (94%). Лучшие две комбинации - это STRIDE, KAKSI и P-SEA (SKP) и STRIDE, KAKSI, SECSR и P-SEA (SKSP). Обе комбинации демонстрируют успех 87,5%, что на 1% лучше одного STRIDE. Авторы статьи обнаружили, что если немного прокалибровать вес каждого метода (а первые тесты не делали весовые различия между ними), то успех SKSP можно поднять до 87,8%, что, правда, является статистически незначительным и далее авторами статьи факт весов игнорировался.

STRIDE

KAKSI

SECSTR

P-SEA

SEGNO

Процент успеха

Х







Х

Х

85.7±0.4




X




X

X

86.1±0.4







X

X

X

85.2±0.3




X

X




X

86.3±0.3

X




X




X

86.5±0.4

X

X







X

86.7±0.3




X

X

X




87.2±0.4

X




X

X




86.6±0.4

X

X




X




87.5±0.4

X

X

X







86.7±0.4




X

X

X

X

86.7±0.3

X




X

X

X

86.1±0.4

X

X




X

X

86.9±0.3

X

X

X




X

87.3±0.3

X

X

X

X




87.5±0.3

X

X

X

X

X

87.3±0.3

Таблица 3. Процент успеха (и станд. отклонение) для PREFAB теста у различных комбинаций методов с одинаковым весом.

Совместное использование методов - например, SKSP - улучшает определение структуры. Авторами было обнаружено, что оно как-то изменяет распределение спиральный фракций и фракций тяжей. В PREFAB доля участков спиралей, тяжей и катушек составляет 45.0%, 26.3% и 28.6% для SKSP. Для DSSP же - 42.9%, 24.6%, 32.5%. Это изменение отражается в увеличении средней длины спиралей (8.6 в DSSP - 9.4 в SKSP) и тяжей (4.5 - 4.8).

Чтобы протестировать совместное использование методов, авторы решили испытать лучшие два на SALIGN и SABmark. Для SKP-сочетания успех составил 81.8% для первого и 82.1% для второго (стоит упомянуть, что лучший результат для одиночного метода - 80.2 и 82.0). Метод SKSP продемонстрировал успех в 81.4% для SALIGN и 83.0% для SABmark. Исходя из этих результатов, можно сказать, что SKSP работает лучше других, однако все же точность не 100%.

Но что же является причиной того, что точность всех методов практически не повышается выше отметки 88%? Чтобы ответить на этот вопрос, нужно сравнить уровень успеха DSSP и SKSP для двух выровненных последовательностей. Результат продемонстрирован в таблице №4. Очевидно, что оба метода крайне эффективны (успех до 93-94%) в случае выравнивания двух гомологичных белков (>50%). Однако чем сильнее различаются последовательности, тем сильнее становится различие между структурным выравниванием и анализом вторичной структуры. Структурное выравнивание удаленных гомологов не так надежно, как в случае близких, поскольку в последнем случае структуры гомологов достаточно консервативны и проще в выравнивании. Анализ вторичной структуры не должен зависеть от идентичности последовательностей, если структуры были выровнены верно, но, несмотря на это, анализ вторичной структуры тем хуже, чем сильнее различаются белки. Подобная связь между структурным выравниванием и анализом вторичной структуры гомологов говорит о том, что ошибки определения, вызванные именно недостатками методов анализа ВС., происходят лишь в 6% случаев. Стоит также отметить, что DSSP и SKSP перекрываются приблизительно на 92% независимо от идентичности последовательности.

В таблице 4 также показано распределение ошибок анализа вторичной структуры. Большая их часть - это ошибки, возникшие в разделении между участками петлей и спиралей, а также петлей и тяжей. Ошибки в различиях между спиралями и тяжами мало, независимо от идентичности последовательностей, выровненных структурно. Поэтому можно выдвинуть предположение о том, что большая часть ошибок связана с участками катушек. Также, авторы определили, что 58.3% ошибок находятся на границе (начале или же конце) тяжа или спирали, 30.5% расположены на границе выровненных участков. И лишь 11,2% ошибок - внутри спирали, тяжа или петли.

Идентичность послед. (%)

# пар

DSSP (%)

SKSP (%)

Схожесть DSSP/SKSP

Ошибка H-C (%)

Ошибка

H-E (%)

Ошибка

C-E (%)

Ошибки (%)

<15

98

79.7

82.9

92.3

7.9

0.4

8.8

17.1

15-30

177

83.8

86.0

92.8

6.9

0.4

6.7

14.0

30-50

78

89.6

91.4

92.4

4.3

0.0

4.3

8.6

>50

63

93.3

94.2

92.6

3.2

0.0

2.6

5.8

Всего

416

85.4

87.5

92.6

6.1

0.3

6.1

12.5

Таблица 4. Уровень успеха и ошибок DSSP и SKSP в тесте PREFAB.

Выдвинутый в той же статье критерий сравнения методов определения вторичной структуры может поспособствовать методу, анализ которого основан на одном типе вторичной структуры. Например, если бы существовал лишь один тип вторичной структуры, то все структурно выровненные пары всегда бы имели один и тот же тип ВС. Впрочем, любой метод, уменьшающий разнообразие типов вторичной структуры, лучше сочетается со структурным выравниванием. Разнообразие может быть посчитано следующим образом: d = 1 - (|fH-fE|+|fH-fC|+|fE-fC|)/2), где fH, fE и fC обозначаю долю спиралей, тяжей и петлей соответственно. d=0 обозначает, что есть лишь одно состояние, d = 0.5 - два, d = 1 - все три одинаково распределены.

В таблице 5 можно посмотреть степень успеха и значение разнообразия для DSSP и SKSP. Значение разнообразия у совместного метода ниже, чем у одиночного DSSP, в то время как улучшения в него больше. Заметное уменьшение разнообразия в SABmark (почти в 10 раз больше, чем в SALIGN) не привело к значительному увеличению совпадений, а потому данный факт можно не учитывать.

Метод

DSSP успех (%)

DSSP

d

SKSP успех (%)

SKSP

d

SKSP-DSSP успех (%)

SKSP-DSSP

d

PREFAB

85.4

0.817

87.5

0.813

2.1

-0.004

SALIGN

78.8

0.797

81.4

0.790

2.6

-0.007

SABmark

80.0

0.909

83.0

0.844

3.0

-0.065

Таблица 5. Уровень успеха и разнообразие для DSSP и SKSP методов исследования вторичной структуры

Поскольку авторы статьи провели довольно крупную работу, сравнив такое огромное количество белков, я лишь рассмотрю 10 белков (pdb-коды будут указаны ниже) для пяти методов+SKSP. Анализ такой малой выборки, возможно, не является статистически значимым, однако все же он подходит для демонстрации.

PDB\Метод

Зрение

DSSP

STRIDE

SECSTR

P-SEA

SheeP

1BSA

9/15

9/15

9/18

9/15

6/13

9/18

1CEX

11/5

7/5

6/5

6/5

6/5

7/8

1LFB

3/0

3/0

3/0

3/0

3/1

3/0

1VDR

8/15

8/17

8/20

8/20

8/17

8/22

1ZXQ

3/16

0/14

0/18

3/11

0/15

0/18

2ILK

6/0

9/0

5/0

6/1

7/0

9/0

2XAT

8/7

3/13

3/15

8/7

3/14

3/16

3CRD

6/0

6/0

6/0

6/0

6/0

6/0

5PTP

3/12

2/16

2/13

3/11

2/15

2/18

8ABP

10/12

10/11

10/12

9/12

10/12

10/15

Точность опр. α-спиралей

N/A

50%


50%

70%

40%

50%

Точность опр. β-тяжей

N/A

50%


50%

60%


40%

30%

Точность

N/A

50%

50%

65%

40%

40%

Таблица 6. Сравнительный анализ методов определения вторичной структуры на выборке из 10 структур.

Случайным образом было выбрано 10 белков, и был проведен сравнительный анализ всех этих методов. Из всех структур анализы выдали абсолютно идентичный результат лишь для одного. Во всех прочих структурах часто присутствовал сильный разброс. Ниже я приведу чуть более подробный анализ, итоговый результат можно обнаружить в таблице 6, а структуры – на рисунках ниже.

К сожалению, провести анализ SKSP не удалось из-за внутренней ошибки на сайте. На момент написания реферата мне не удалось связаться с администратором, так что скорее всего результаты будут опубликованы дополнительно

pic1.png

Рисунок 1. (A) 1BSA - три молекулы барназы (в исходном исследовании, похоже, проводился анализ мутаций). Практически все методы верно определили вторичную структуру. Исключения: STRIDE и SheeP находят короткий (2 аминокислоты) бета-тяж между первыми двумя спиралями. P-sea не находит третью альфа-спираль во всех случаях, а в двух молекулах из трех не находит первый бета-тяж. (B) 1CEX - молекула катиназы. Ни один из методов не смог верно обнаружить все альфа-спирали - это связано с малым размером некоторых из них. В случае SheeP была еще ошибка с лишними бета-тяжами (опять же длиной 2 аминокислоты). (C) 1LFB - фактор транскрипции LFB1/HNF1 из печени крысы. За исключением метода P-SEA, обнаружившим бета-тяж перед первой альфа-спиралью, все остальные методы верно определили вторичную структуру. (D) 1VDR - дигидрофолат редуктаза. Абсолютно верное определение альфа-спиралей, но сильный разброс в бета-тяжах. Причины дробления бета-тяжей различными методами не ясны.

pic2.png Рисунок 2. (А) 1ZXQ - кристаллическая структура ICAM-2. Ни один метод, кроме SECSTR (который, впрочем, требует зрительного анализа от исследователя, что вносит заметный субъективный вклад), не смог обнаружить альфа-спирали. Связано это, как и в прочих случаях, с их малым размером. Разброс в обнаружении бета-тяжей (ни одного верного попадания) идет как в плюс, так и в минус, а вероятные проблемы - малый размер некоторых тяжей и, похоже, слишком большой размер иных. (B) 2ILK - интерлейкин-10 человека. В SECSTR был обнаружен участок, который можно назвать бета-тяжом. Расщепление по количеству альфа-спиралей вызвано их сильным преломлением в некоторых участках. (C) 2XAT - комплекс гексапептидной ксенобиотической ацетилтрансферазы с хлорамфениколом и коэнзимом А. Проблема с альфа-спиралями, похоже, та же, что и в случае 1ZXQ, но в этом случае, вероятно, часть альфаспиралей была "расчленена" и интерпретирована как бета-тяжи. (D) 3CRD - домен рекрутирования каспаз. Абсолютно верное определение для всех методов.

pic3.png Рисунок 3. (A) 5PTP - структура гидролазы. Проблема с бета-тяжами не ясна, а проблема с недостающей альфа-спиралью та же, что и в 1CEX. (B) 8ABP - арабиноза-связывающий белок. Верное число альфа-спиралей, в случае бета-тяжей опять разброс

Заключение.

Детектор вторичной структуры 3D модели белка действительно нужен - человеческий глаз, возможно, и является хорошим инструментом, но он может быть излишне субъективным. Когда есть нормы, правила или же, что еще лучше, четкий алгоритм, то данные будут заметно точнее. Существует множество алгоритмов. В статье Чжаня были продемонстрированы работа шести: DSSP, STRIDE, SECSTR, P-SEA, SEGNO, KAKSI, а также лучший из совмещенных методов - SKSP (STRIDE, KAKSI, SECSTR, P-SEA), я же, заменив SEGNO и KAKSI как труднодоступный и сложный в установке методы соответственно, воспользовался дополнительно методом SheeP. Поскольку было затруднительно сделать статистически значимую выборку, я могу лишь использовать данные исследований Чжаня и результаты, показывающие, что методы STRIDE и KAKSI работают чуть лучше других, а SKSP - лучше любого отдельно взятого метода. Сравнение таких методов легко: по успеху определения вторичной структуры. Еще их можно сравнить по уровню разнообразия типов вторичной структуры, а также по участкам, в которых чаще всего есть ошибки.

Безусловно, проблема детекции элементов вторичной структуры после изобретения SKSP никуда не исчезла: точность достигла ~87.5%, что все-таки не 100% и даже не хотя бы 95%. Этим методом можно пользоваться, он надежен, но нет гарантий, что данные, выданные им, не будут ошибочными. Поскольку известны обычные места ошибок, то алгоритмы можно продолжать совершенствовать для получения большей точности.

Если подытожить результат собственного эксперимента со статистически незначимой выборкой, то можно сказать, что многие методы пренебрегают альфа-спиралями, если они слишком мелки (едва больше одного оборота спирали). Метод SheeP, изначальная цель которого - это постройка карт бета-листов, находит слишком мелкие бета-тяжи. Склонность к разделению бета-тяжей имеют многие методы. В целом точность обнаружения альфа-спиралей несколько выше, чем бета-тяжей, что и говорилось в статье Чжаня и коллег. Также это исследование показывает, что еще не существует идеального точного алгоритма, который будет способен обнаружить малые альфа-спирали и не вызывать лишнего дробления бета-тяжей. Однако оценивая белки различными методами, можно действительно приблизиться к истине и созданию идеального алгоритма по определению вторичной структуры без субъективного участия человека.

Список литературы и ссылки

  1. Wikipedia, ru.wikipeda.org/wiki/Вторичная структура

  2. Assessing secondary structure assignment of protein structures by using pairwise sequence-alignment benchmarks. Wei Zhang, A. Keith Dunker, Yaoqi Zhou, Proteins. 2008 Apr;71(10:61-7

  3. SHEEP: A tool for description of beta-sheets in protein 3D structures. Evgeniy Aksianov, Andrei Alexeevsi, Journal of Bioinformatics and Computational Biology, Vol. 10, No. 2 (2012) 1241003 (16 pages)

  4. ftp://ftp.cmbi.ru.nl/pub/software/dssp/

  5. http://mouse.belozersky.msu.ru/~evgeniy/cgi-bin/proton/proton.php?subproj=sheep

  6. http://athina.biol.uoa.gr/SecStr/

  7. http://bioserv.cbs.cnrs.fr/HTML_BIO/frame_sea.html

  8. http://mouse.belozersky.msu.ru/~evgeniy/cgi-bin/proton/proton.php?subproj=sheep

  9. http://migale.jouy.inra.fr/?q=kaksi

Добавить документ в свой блог или на сайт

Похожие:

Решена ли проблема корректного определения элементов вторичной структуры? iconПланы семинарских занятий тема проблема коррупции: понятие и виды
Проблема определения коррупции. Уровни восприятия коррупции: бытовой, научный, практический
Решена ли проблема корректного определения элементов вторичной структуры? iconТема: Тема, проблема текста
Познавательный аспект: дать понятие «проблема», речевые клише для определения проблемы, установить связь проблемы, обсуждаемой автором...
Решена ли проблема корректного определения элементов вторичной структуры? iconНаучная полемика по вопросу происхождения казачества
Нет общего мнения по поводу возникновения казаков, их национальной принадлежности, социального статуса. Не решена также проблема...
Решена ли проблема корректного определения элементов вторичной структуры? iconГенетическая и культурная информация: нерешенные вопросы
Проблема определения предметной области культурологии в постмодернистских концепциях
Решена ли проблема корректного определения элементов вторичной структуры? iconОтчеты по самообразованию
Проблема: «Внедрение элементов новых технологий в обучении естественно-математических предметов»
Решена ли проблема корректного определения элементов вторичной структуры? iconУниверситетские исследования, 2011
Описанна программная реализация алгоритма определения структуры множества подмножеств множества с самопринадлежностью
Решена ли проблема корректного определения элементов вторичной структуры? iconРефератов по дисциплине «Социальная политика»
Проблема определения приоритетов в социальной политике на современном этапе развития российского общества
Решена ли проблема корректного определения элементов вторичной структуры? iconПрограмма по формированию навыков безопасного поведения на дорогах...
Электронное строение атомов, изоэлектронные структуры. Соединения и частицы, образующиеся из изоэлектронных элементов
Решена ли проблема корректного определения элементов вторичной структуры? iconТема: «Проблема определения философии. Философия и жизненный мир человека»
Автономная некоммерческая организация среднего профессионального образования «Ставропольский колледж экономики и дизайна»
Решена ли проблема корректного определения элементов вторичной структуры? iconПроблема одаренности в современной школе
«Как нанять «спеца»?: Тесты для приема на работу и определения уровня iq / Слепцова А. С.»: Аст, Астрель; Москва; 2006
Решена ли проблема корректного определения элементов вторичной структуры? iconПринципы доступа к данным через ado. Net. Вопросы по темам рефератов
Основные понятия и определения корпоративных информационных систем. Классификация кис по характеру использования. Стратегии развития...
Решена ли проблема корректного определения элементов вторичной структуры? iconСамостоятельная работа 2 Работа с литературой составить опорный конспект...
Содержание учебного материала, лабораторные работы и практические занятия, самостоятельная работа обучающихся
Решена ли проблема корректного определения элементов вторичной структуры? iconХорошавин Лев Борисович Докт техн наук реферат
Периодической системе элементов, но и дополнительно по кластерам химических элементов, определять прогнозные свойства новых элементов...
Решена ли проблема корректного определения элементов вторичной структуры? iconРабочая программа по внеурочной деятельности в начальной школе «Занимательная физика»
Кружок «Занимательная физика» является одним из важных элементов структуры средней общеобразовательной школы наряду с другими школьными...
Решена ли проблема корректного определения элементов вторичной структуры? iconДиагностическая работа проводилась с целью определения уровня усвоения...
Содержание и основные характеристики проверочных материалов определялись на основе следующих документов
Решена ли проблема корректного определения элементов вторичной структуры? iconУрок по-новому: обрисовываем ситуацию, «чтобы проблема зацепила»
То есть на выходе ученик должен воспроизвести воспринятую ранее информацию, решить по усвоенным алгоритмам различного уровня сложности...


Школьные материалы


При копировании материала укажите ссылку © 2013
контакты
100-bal.ru
Поиск