Фгбу «пияф» удк 001. 89: 004. 31





НазваниеФгбу «пияф» удк 001. 89: 004. 31
страница5/14
Дата публикации01.04.2015
Размер1.44 Mb.
ТипОтчет
100-bal.ru > Информатика > Отчет
1   2   3   4   5   6   7   8   9   ...   14

1.4Анализ выполнения требований технического задания на НИР


В разделе 5 технического задания на НИР были сформулированы следующие основные требования к выполняемым работам:

Должна быть разработана информационно-коммуникационная модель интегральной системы, предназначенной для off-line обработки, хранения и распределенного анализа данных экспериментов на нейтронных установках реактора ПИК с планируемым объемом данных не менее одного петабайта в год (п.5.1.1 ТЗ). Важной особенностью разработанной системы хранения данных является ее легкая масштабируемость, т.е. возможность расширения объема внешней памяти до требуемого размера. Действительно, файловый сервер с установленным сервисом хранения файлов может иметь одну или несколько файловых систем, выделенных для хранения файлов данных. Файловые системы подключаются к точкам монтирования виртуальной файловой системы Unix и таких файловых систем может быть произвольное число, что позволяет расширение внешней памяти до требуемого размера. Для хранения метаданных требуется объем значительно меньшего размера, который обеспечивается реляционной базой данных Mysql. Таким образом, данный пункт технического задания можно считать выполненным.

Должен быть выполнен аналитический обзор современной научно-технической, нормативной, методической литературы, затрагивающей научно-техническую проблему, исследуемую в рамках НИР, в том числе обзор научных информационных источников: статьи в ведущих зарубежных и (или) российских научных журналах, монографии и (или) патенты - не менее 40 научно-информационных источников за период 2006 – 2011 гг. (п.5.1.2 ТЗ). На 1 этапе НИР был выполнен аналитический обзор, основанный . Были проанализированы следующие базовые подходы к построению систем, основанных на современных информационных технологиях:

а) использование сетевых технологий

б) методы построения систем хранения данных

в) кластеры, как ресурсные центры для off-line обработки данных

г) распределенная обработка данных на базе Грид-технологии

д) обеспечение безопасности данных

е) модели метаданных

ж) современные форматы экспериментальных данных

Кроме того, были проанализированы подходы к управлению данными в таких крупных международных научных центрах, как CERN- европейский центр ядерных исследований, ISIS- Резерфордовская лаборатория, ILL - Институт Лауэ Ланжевена (Франция), PSI, Paul Scherrer Institute, институт Пауля Шерера (Швейцария), SOLEIL- Франция, Laboratoire Léon Brillouin (LLB)- Сакле (Франция). Выводы, сделанные в результате анализа, легли в основу выбранных методов и средств, направлений исследований и способов решения поставленных задач. Таким образом, данный пункт технического задания можно считать выполненным.

Должны быть исследованы, обоснованы и выбраны методы и средства, направления исследований и способы решения поставленных задач, в том числе:

Должен быть определен перечень функциональных задач, решаемых в рамках предложенной модели для экспериментов на нейтронных установках реактора ПИК (п.5.1.3.1 ТЗ). На 1 этапе НИР был определен следующий набор функциональных задач, основанный на результатах аналитического обзора и анализа экспериментальной базы исследований на реакторе ПИК и описанный в разделе 3.1 отчета за первый этап НИР:

а) Хранение данных. Необходимость решения задачи централизованного хранения экспериментальных данных и результатов их обработки обуславливается многими факторами. В первую очередь это необходимость обеспечения удаленного доступа к этим данным со стороны участников научных коллабораций, которые планируются быть достаточно большими. Функция хранения данных должна обеспечивать такие возможности, как прием и сохранение данных с рабочих станций и вычислительного кластера, обеспечение передачи данных из хранилища, обеспечение возможности поиска данных по различным критериям, что требует использования и поддержки концепции метаданных, обеспечение безопасного доступа к данным.

б) Передача данных от рабочих станций в систему хранения данных. Для решения этой задачи необходимы, во-первых, средства реализации выбранного протокола передачи данных на удаленную систему хранения данных, а во-вторых, средства для объединения гетерогенной информации, составляющей поток выходных данных.

в) Распределённая off-line обработка данных. Актуальность решения этой задачи обуславливается прежде всего таким фактом, что для удовлетворения все возрастающих требований к вычислительной мощности со стороны программ обработки данных и симуляции необходимо обеспечить возможность параллельного выполнения таких программ на множестве процессоров. Кроме того, в условиях крупного международного ядерного центра необходимо обеспечить возможность одновременной работы множества пользователей по запуску программ обработки данных. Таким образом, функция off-line обработки данных должна быть реализована на локальном ресурсном центре, обеспечивающим запуск программ в режиме мультидоступа со стороны группы пользователей, выполняющих работы по обработке экспериментальных данных, полученных с различных нейтронных установок реактора ПИК.

г) Взаимодействие пользователей с системой. Взаимодействие пользователей с системой является одной из важных задач, которые необходимо решать в рамках разрабатываемой модели. Особенно следует обратить внимание на интерфейс взаимодействия физика-экспериментатора с системой, т.к. функциональность, дружественность этого интерфейса, в конечном счёте, играют большую роль в оценке работы системы. Кроме того, важной особенностью такого интерфейса должна быть возможность удаленного Веб-доступа к ресурсам системы.

д) Безопасность системы. Обеспечение безопасности системы является важнейшей функцией, отражающей качество работы создаваемой системы. Модель безопасности состоит из таких категорий, как конфиденциальность- доступ к системным ресурсам разрешён только авторизованным пользователям, целостность- запрет на несанкционированную модификацию информации, аутентичность- гарантия того, что субъект или ресурс идентичны заявленным. Все эти категории в этой или иной мере должны быть реализованы в разрабатываемой модели.

Все перечисленные выше задачи потребовали своего решения на этапе разработки и экспериментальной реализации информационно-коммуникационной модели интегральной системы, предназначенной для off-line обработки, хранения и распределенного анализа данных экспериментов на нейтронных установках реактора ПИК. Таким образом, данный пункт технического задания можно считать выполненным.

Должен быть сформирован перечень базовых методов и алгоритмов обработки, хранения и распределенного анализа данных экспериментов на нейтронных установках реактора ПИК (п.5.1.3.2 ТЗ). Для решения поставленных задач был сформирован следующий перечень базовых методов и алгоритмов, описанных в разделе 3.2 отчета за первый этап НИР:

а) Методы обеспечения безопасности системы. В основе обеспечения безопасности системы лежат методы аутентификации пользователей и взаимодействующих сервисов, т.е. обеспечение гарантии того, что взаимодействующие субъекты идентичны заявленным. Одним из таких методов, предлагаемом к использованию, является подход, используемый в Грид технологиях. Аутентификация и авторизация пользователей и сервисов в системе здесь выполняется с использованием инфраструктуры цифровых сертификатов стандарта X.509 и технологии GSI (Grid Security Infrastructure), основанных на технологии открытых криптографических ключей (Public Key Infrastructure, PKI). В данной инфраструктуре каждому пользователю и сервису выдаётся однозначно идентифицирующий его уникальный цифровой сертификат. Выдачей сертификатов занимается Удостоверяющий Центр (УЦ). При установлении защищённого сеанса связи, оба участника обмениваются цифровыми сертификатами и проверяют их достоверность по электронной подписи УЦ. Если проверка прошла успешно, участник сеанса может быть уверен, что информация, содержащаяся в сертификате другой стороны, достоверна.

б) Методы формирования выходных данных. Анализ экспериментальной базы исследований на реакторе ПИК показал, что с рабочих станций экспериментальных установок необходимо передать на хранение как собственно данные, полученные в результате накопления, так и дополнительную информацию, включающую в себя калибровочные данные, технологические параметры реактора, данные предварительной симуляции. Эта информация впоследствии будет использоваться при обработке данных. Кроме того, необходима информация, которая поможет впоследствии искать эти данные в системе хранения, т.е. необходимы метаданные. Анализ современных подходов к объединению такой гетерогенной информации показал, что в области нейтронных исследований стандартом на выходные данные фактически становится формат NeXus. Формат NeXus позволяет обеспечить передачу всего требуемого набора данных (сырые данные, данные калибровки, результаты предварительной обработки и т.п., а также метаданные, описывающие соответствующие объекты) в виде одного файла.

в) Методы организации взаимодействия компонент системы. Для организации взаимодействия распределенных процессов к настоящему времени был разработан и принят ряд стандартов, наиболее широко используемым из которых является протокол взаимодействия Web-сервисов, основанный на протоколе HTTPS. Для реализации и использования этих протоколов существуют соответствующие программные средства, апробированные в различных распределенных системах.

г) Методы организации хранения данных. Как показывает анализ, характерной тенденцией при реализации систем хранения данных для информационных систем является разделение такой системы на две основные подсистемы - хранения метаданных и хранение собственно экспериментальных данных и результатов их обработки. Система хранения метаданных (СХМ) должна состоять из реляционной базы данных, типа Mysql или Oracle, а также соответствующих программных компонент, обеспечивающих прием метаданных, запись их в базу данных, а также поиск информации на основе некоторого набора метаданных. Примером такого поиска может служить определение имени или местоположения конкретного файла по совокупности ряда метаданных. Важной компонентой СХМ является сервис по обеспечению безопасного доступа к метаданным. Реализация такого доступа предполагается на базе цифровых сертификатов стандарта Х509 в рамках общей концепции безопасности в рассматриваемой системе. Для организации файлового хранилища предлагается использовать методы, используемые для этой цели в технологии Грид при реализации файлового хранилища как SE (Storage Element).

д) Методы формирования метаданных. Метаданные являются совокупностью параметров, описывающих характеристики конкретных наборов данных, а также связи между ними, и служат для обеспечения идентификации, поиска требуемых данных, а также их обработки и анализа. Для структуризации метаданные предлагается разделить на 3 основные группы: метаданные, связанные с экспериментальными данными, метаданные, связанные с результатами обработки и анализа и метаданные, связанные с внутренней организацией связей между различными наборами метаданных. Для каждой из таких групп предлагается свой собственный набор метаданных.

е) Методы организации распределенного анализа данных. Основным видом анализа результатов экспериментов на реакторе ПИК будет являться распределённый анализ на вычислительном кластере, что обуславливается необходимостью обеспечения как одновременного выполнения различных программ, запущенных по запросам разных пользователей, так и запуском программ в MPI режиме. Для управления таким кластером требуется выделенный управляющий вычислительный ресурс, занимающийся приемом запросов на запуск программ, ведением очередей таких запросов и т.п. Для организации такого управляющего ресурса предлагается использовать методы, используемые для этой цели в технологии Грид, а именно реализацию менеджера кластера как CE (Computer Element). В разделе 3.2.7 отчета за первый этап НИР перечислены основные функции и методы реализации СЕ.

ж) Методы взаимодействия пользователей с системой. Основным методом взаимодействия пользователей с системой должно являться взаимодействие через веб-интерфейс, позволяющий интерактивную работу как с базой данных и метаданных, так и при запуске и управлением выполнением заданиями на кластере.

Рассмотренные методы в полном объеме были использованы на этапе разработки и экспериментальной реализации информационно-коммуникационной модели интегральной системы, предназначенной для off-line обработки, хранения и распределенного анализа данных экспериментов на нейтронных установках реактора ПИК. Таким образом, данный пункт технического задания можно считать выполненным.

Должны быть сформулированы общие критерии эффективности функционирования системы интегральной системы обработки, хранения и распределенного анализа данных экспериментов на нейтронных установках реактора ПИК, а также выработан список наиболее важных количественных параметров оценки (метрики) работы такой системы (п.5.1.3.3 ТЗ). Общие критерии эффективности и метрики системы были сформулированы в разделе 3.3. отчета за первый этап НИР. Общие критерии эффективности определяют качественные характеристики систем. Основным качественным критерием является полученный эффект от использования системы, заключающийся в ускорении проведения исследований за счёт широкого спектра возможностей предоставляемых системой исследователю по доступу к данным, использованию широкого спектра программ обработки, удобству взаимодействия его с системой. Важнейшую роль в выполнении этого основного критерия играют надёжность системы, ее масштабируемость, уровень используемых пользовательских интерфейсов и т.п. Метрики определяют параметры коммуникационного оборудования, требуемую производительность и мощность локального вычислительного центра, характеристики системы хранения данных. Таким образом, данный пункт ТЗ можно считать выполненным.

Д

Рисунок 2. Логическая структура модели

олжна быть разработана общая структура информационно-коммуникационной модели интегральной системы off-line обработки, хранения и распределенного анализа данных экспериментов на нейтронных установках реактора ПИК, включая перечень ее компонентов с указанием их взаимосвязей (п.5.1.4 ТЗ).
Ниже на рисунке 2 представлена структура разработанной информационно-коммуникационной модели интегральной системы, детально описанная в разделе 1.1 отчета за второй этап НИР. Здесь определены все основные сервисы системы и внешние компоненты, а также связи между ними.

Таким образом, данный пункт ТЗ можно считать выполненным.

Должно быть разработано программное обеспечение экспериментальной реализации разработанной модели (п.5.1.5 ТЗ). В разделе 1.1 отчета за второй этап НИР описано разработанное программное обеспечение экспериментальной реализации модели, реализованное в виде сервисов интерфейса пользователя, хранения метаданных, хранения файлов, а также библиотеки взаимодействия клиента с системой хранения данных. Данное программное обеспечение было установлено и отлажено на испытательном стенде, что позволяет сделать вывод о выполнении настоящего пункта технического задания НИР.

Для экспериментальных исследований разработанной модели должен быть разработан испытательный стенд. Состав и технические характеристики испытательного стенда должны быть определены при выборе направлений исследований и способов решения поставленных задач (п.5.1.6 ТЗ). На втором этапе НИР был разработан испытательный стенд (ИС) и представлена документация в составе:

а) Испытательный стенд. Структурная схема.

б) Испытательный стенд. Пояснительная записка.

Реализация испытательного стенда, подтвержденная актом изготовления, позволяет сделать вывод о выполнении настоящего пункта технического задания НИР.

Должна быть разработана Программа и методика исследовательских испытаний разработанной модели (п.5.1.7 ТЗ). Программа и методика исследовательских испытаний разработанной модели была разработана и представлена в отчете за второй этап НИР. Таким образом, данный пункт технического задания можно считать выполненным.

Должны быть проведены экспериментальные исследования экспериментальной реализации модели по разработанной Программе и методике (п.5.1.8 ТЗ). Экспериментальные исследования экспериментальной реализации модели по разработанной Программе и методике были проведены и их результаты были зафиксированы в Протоколах и Акте проведения экспериментальных исследований, которые были представлены в составе отчётной документации по 2 этапу. Таким образом, данный пункт технического задания можно считать выполненным.

Должны быть выработаны предложения и рекомендации по использованию результатов проведенных НИР при проектировании будущих экспериментов на нейтронных установках реактора ПИК (п.5.1.9 ТЗ).

В п. 2.2 настоящего отчёта приведён перечень рекомендаций и предложений по использованию результатов НИР при проектировании экспериментов на нейтронных установках реактора ПИК, в том числе рекомендации по системе учета заявок на эксперимент, по организации потоков данных, по использованию метаданных для описания сбора и обработки данных конкретных экспериментов, по организации обработки данных, по инфраструктуре системы безопасности и сформулированы требования по сетевой совместимости и использования стандартных протоколов и форматов данных. Таким образом, данный пункт технического задания можно считать выполненным.

Должны быть выработаны предложения и рекомендации по использованию разработанной модели для практической реализации интегральной системы off-line обработки, хранения и распределенного анализа данных для экспериментов на нейтронных установках реактора ПИК (п.5.1.10 ТЗ).

Разработанная информационно-коммуникационная модель интегральной системы off-line обработки, хранения и распределенного анализа данных, включающая в себя программное обеспечение экспериментальной реализации в виде программного комплекса «МОДУС» с программной документацией, а также испытательный стенд с эскизной конструкторской документацией являются базой для создания реальной системы off-line хранения, обработки и распределённого анализа информации для экспериментов, планируемых к проведению на высокоточном реакторе ПИК. Проект технического задания на ОКР представлен в приложении А. Таким образом, данный пункт технического задания можно считать выполненным.
В разделе 6 технического задания на НИР были сформулированы следующие основные требования к выполняемым работам:

Созданная в результате НИР экспериментальная реализация модели информационно-коммуникационной интегральной системы off-line обработки, хранения и распределённого анализа экспериментальных данных должна быть разработана с учётом необходимости обеспечения возможности обработки, хранения и распределённого анализа данных объёмом порядка одного петабайта в год (п.6.1.1 ТЗ). Важной особенностью разработанной системы хранения данных является ее легкая масштабируемость, т.е. возможность расширения объема внешней памяти до требуемого размера. Действительно, файловый сервер с установленным сервисом хранения файлов может иметь одну или несколько файловых систем, выделенных для хранения файлов данных. Файловые системы подключаются к точкам монтирования виртуальной файловой системы Unix и таких файловых систем может быть произвольное число, что позволяет расширение внешней памяти до требуемого сколь угодно большого размера. Доступ к централизованному файловому хранилищу по записи и чтению со стороны программ обработки, выполняющихся на вычислительном кластере, реализуется по протоколу HTTPS с использованием библиотеки пользовательского интерфейса и не зависит от общего размера файлового хранилища. Таким образом, данный пункт технического задания можно считать выполненным.

Экспериментальные данные, полученные в результате работы экспериментальных установок на нейтронных источниках реактора ПИК и прошедшие первоначальную обработку, должны поставляться в систему off-line обработки системой сбора и первичной обработки данных экспериментов через сопряжение с унифицированным форматом представления данных NeXus, принятым в качестве международного стандарта для мюонных, рентгеновских и нейтронных исследований (п.6.1.2 ТЗ). В разделе 4.2.1 отчета за второй этап НИР было описано исследование динамики испытательного стенда при передаче данных на сохранение с симулятора установки Sans2. В этом примере данные, сгенерированные симулятором, были конвертированы в формат NeXus с использованием соответствующей библиотеки на языке Python. При конвертировании экспериментальные данные были помещены в выходной файл совместно с рядом метаданных. Аналогичные библиотеки существуют для языков С++ и Java, что позволяет использовать формат NeXus при написании программ на рабочих станциях. Эти же библиотеки легко могут быть использованы на вычислительных узлах кластера для распаковки файлов в формате NeXus. Рассмотренные библиотеки являются свободно распространяемыми и легко устанавливаются на различных платформах. Таким образом, данный пункт технического задания можно считать выполненным.

Должна быть предусмотрена возможность получения данных одновременно от нескольких систем по числу планируемых экспериментальных установок, но не менее 50 (п.6.1.3 ТЗ). Разработанная система не содержит функциональных ограничений на количество источников или потребителей данных, то есть теоретически может обеспечивать одновременную работу неограниченного количества установок.

Реальным ограничением на количество подключенных источников данных является интенсивность потоков входных и выходных данных, а также производительность аппаратных частей сервисов хранения метаданных и файлов.

Возможность одновременной работы не менее 50 экспериментальных установок показана экспериментальными исследованиями экспериментальной реализации модели, в которых производилось тестирование записи в системы хранения метаданных и файлов и была достигнута скорость записи 10 Мб/с на один сервис хранения файлов с одной файловой системой.

Типичная сессия работы экспериментальной установки реактора ПИК составляет от 1 до 3 дней и порождает до 1 Гб данных, что соответствует максимальной скорости записи 1 Гб/сутки = 42 Мб/ч = 12 Кб/с. Для одновременно работающих 50 установок требуемая скорость записи будет составлять 600 Кб/с. Даже учитывая тот факт, что пиковая скорость записи может в определённые моменты времени в несколько раз превышать требуемую, полученная скорость записи в 10 Мб/с более чем достаточна для одновременного функционирования 50 экспериментальных установок.

Таким образом данный пункт технического задания можно считать выполненным.

Данные, полученные в результате работы системы off-line обработки и анализа, сохраняются в ней и должны предоставляться большим научным коллективам, включающих десятки географически и организационно распределенных исследовательских групп и индивидуальных исследователей, в том числе международным коллаборациям, которые будут участвовать в проведении экспериментов на реакторе ПИК, например, Европейский центр нейтронных исследований - Институт им. М.Лауэ и П.Ланжевена (Гренобль), Исследовательский центр GKSS (Гамбург), Институт им. Пауля Шеррера (Цюрих)

Для достижения этой цели разрабатываемая интегральная система должна обеспечивать выдачу данных в стандартных форматах (XML, JSON, NeXus) и обеспечивать возможность удалённого доступа к данным по публичным каналам связи (сеть Интернет) со следующими характеристиками:

а) скорость передачи данных не менее 100 Мегабит/с;

б) коэффициент потери пакетов не более 0,1%;

в) транспортный протокол передачи данных с гарантированной доставкой: TCP/IP;

г) протокол защиты данных: SSL/TLS (п.6.1.4 ТЗ).

Прежде всего, реализованная система аутентификации и авторизации основана на механизме виртуальных организаций и позволяет работать с группами пользователей, как с одним. Это является ключевым фактором, обеспечивающим возможность работы с рассматриваемой системой большим научным коллаборациям. Данные, полученные в результате работы системы off-line обработки и анализа, а также экспериментальные данные, сохраняются в централизованном файловом хранилище. Данные, сохраненные в любом формате, в том числе и в формате NeXus, выдаются по протоколу HTTPS через веб-интерфейс, который обеспечивает возможность удалённого доступа к данным по публичным каналам связи (сеть Интернет). Что касается характеристик публичных каналов, то именно такие характеристики имеет внешний канал ПИЯФ. Таким образом, данный пункт технического задания можно считать выполненным.

Разработанная в ходе исследований модель должна учитывать структуру данных, получаемых на выходе систем сбора и первичной обработки данных экспериментальных установок реактора ПИК, в том числе:

а) логическую организацию данных (постоянный поток, событийная, фиксированный или варьируемый размер события).

б) объём данных (интенсивность потока данных, средний размер события, количество событий в единицу времени).

в) условия доступа к данным (тип и пропускная способность каналов связи с системой сбора и первичной обработки данных).

Разработанная в ходе исследований модель должна учитывать структуру данных, получаемых в результате распределённого анализа, в том числе:

а) объём данных (количество данных, к которым необходимо иметь непосредственный доступ научным коллективам)

б) структуру данных, получаемых на выходе программного обеспечения для анализа (файлы, базы данных)

в) требования к удалённому доступу к данным со стороны научных коллективов (наличие веб-интерфейсов и поддержка стандартных протоколов передачи данных – HTTP, FTP) (п.6.1.3 ТЗ). Минимальным логическим блоком, который можно передать с экспериментальных установок в систему хранения данных, является файл. Однако на уровне системы хранения данных эти файлы могут быть объединены в более сложную структуру “Набор данных”. Набор данных может содержать от одного до нескольких файлов и адресоваться уникальным именем. Для передачи файлов в систему хранения был разработан прикладной программный интерфейс (ППИ), включающий в себя программную библиотеку и клиента командной строки. Клиент командной строки поддерживает два протокола передачи данных: https и gridftp. Для упаковки как собственно накопленный данных, так и дополнительной информации в один файл формата NeXus, можно использовать соответствующую библиотеку для языков программирования С++, Java и Python. На этапе 1 НИР был проведен анализ экспериментальной базы исследований на реакторе ПИК и, в том числе, проведена оценка информационных характеристик планируемых экспериментов. Было показано, что объем накапливаемых данных за цикл измерения достигает 2-4 Гбайт с учетом калибровочных данных и данных предварительной симуляции и цикл измерения варьируется от 1 дня до двух недель. Таким образом, передача и сохранение файлов такого размера не представляет проблемы. Пропускная способность каналов связи определяет скорость передачи данных и не оказывает влияния на выбор методов построения системы. Что касается данных, получаемых в результате распределённого анализа, то их возможный объем ограничивается только размером файлового хранилища, который легко масштабируется. Для передачи и приема файлов с рабочих узлов кластера используется те же программные средства, что и для экспериментальных установок. Для доступа к данным со стороны научных коллективов предоставляется интерактивный веб-интерфейс, а так же ППИ, используя который, можно разработать собственный программный интерфейс. Таким образом, данный пункт технического задания можно считать выполненным.

Экспериментальная реализация модели должна иметь модульную структуру для облегчения адаптации при появлении новых экспериментальных установок (в экспериментальных залах комплекса реактора ПИК запланировано до пятидесяти позиций на пучках, на которых одновременно могут вести эксперименты различные исследовательские группы) и программного обеспечения для анализа экспериментальных данных. Должна быть обеспечена возможность масштабирования (поэтапного наращивания) системы, работа на стандартной открытой программной платформе GNU/Linux, а также интероперабельность с программными системами (поставщиками и потребителями данных), работающими на других программных платформах с помощью стандартных сетевых протоколов (TCP/IP, HTTP) и форматов данных (XML, JSON) (п.6.1.4 ТЗ). Экспериментальная реализация модели построена в виде распределенных сервисов, взаимодействующих по протоколу HTTPS. Взаимодействие с внешними источниками данных происходит на клиент-серверной основе также по протоколу HTTPS. При появлении новой экспериментальной установки на соответствующем компьютере достаточно установить клиентское программное обеспечение. При появлении новых программ обработки их легко установить на вычислительном кластере. Масштабируемость системы легко осуществляется в следующих наиболее важных направлениях: размер файлового хранилища, количество узлов вычислительного кластера, количество рабочих экспериментальных станций. Интероперабельность с другими платформами обеспечивается тем фактором, что клиентская библиотека написана на языке Perl, интерпретатор с которого и стандартные модули легко устанавливается на других платформах. Управляющие пакеты, используемые при связи клиентского обеспечения с системой хранения данных, передаются в формате JSON по протоколу HTTPS. Таким образом, данный пункт технического задания можно считать выполненным.

Созданная в результате НИР экспериментальная реализация модели должна обеспечивать работу системы на технических средствах, отвечающих следующим минимальным требованиям (п. 6.1.5 ТЗ):

а) аппаратная платформа Intel x86 с 64-битными расширениями;

б) объём оперативной памяти не менее 2 Гб;

в) объём дискового пространства не менее 100 Гб;

г) сетевой интерфейс Ethernet с пропускной способностью не менее 1 Гбит/с;

д) программная платформа GNU/Linux (Scientific Linux).

Испытательный стенд, на котором установлена экспериментальная реализация модели, обладает именно такими техническими характеристиками. Таким образом, данный пункт технического задания можно считать выполненным.

Ввиду отсутствия реальных экспериментальных установок на нейтронных источниках реактора ПИК, созданная в результате НИР экспериментальная реализация модели должна поддерживать возможность взаимодействия с существующими или разрабатываемыми виртуальными моделями экспериментальных установок в части моделирования получения экспериментальных и других типов данных (п. 6.1.6 ТЗ). В разделе 4.2.1 отчета за второй этап НИР было описано исследование динамики испытательного стенда при передаче данных на сохранение с симулятора установки Sans2. В этом примере данные, сгенерированные симулятором были конвертированы в формат NeXus с использованием соответствующей библиотеки на языке Python. При конвертировании экспериментальные данные были помещены в выходной файл совместно с рядом метаданных и переданы в систему хранения данных. Таким образом, данный пункт технического задания можно считать выполненным.

Для обеспечения требования конфиденциальности работы научных и инженерных коллективов должна быть разработана система, обеспечивающая разделение прав доступа к данным (п. 6.1.7 ТЗ). Реализованный механизм авторизации основан на ролевой модели, где с каждым пользователем или группой пользователей ассоциируется роль, определяющая их права доступа к объектам данных и метаданных, т.е. набор действий, которые пользователь или группа пользователей могут совершать над тем или иным объектом, в том числе и файлами данных. Таким образом, данный пункт технического задания можно считать выполненным.

Разрабатываемая модель должна отвечать следующим требованиям:

а) универсальность: должна быть предусмотрена работа со стандартными форматами входных и выходных данных, а также программным обеспечением для анализа экспериментальных данных. Модель должна быть применима для off-line обработки данных со всех экспериментальных установок реактора ПИК;

б) точность: модель должна обеспечивать полное сохранение передаваемых данных и исключать их искажение, в том числе в виде потери точности;

в) экономичность: модель должна обеспечивать эффективную передачу и обработку данных, избегать необоснованного использования вычислительных и дисковых ресурсов, а также дублирования данных, кроме случаев резервного копирования и обеспечения отказоустойчивости (п. 6.1.8 ТЗ). Что касается форматов данных, то для экспериментальных данных предполагается стандарт NeXus. Для работы с этим форматом существует свободно распространяемая программная библиотека на языках С++, Java, Python. В то же время система не накладывает ограничения на формат хранимых данных, тем более что формат NeXus находится в стадии становления. Если некоторая программа обработки не рассчитана на этот формат, то перед запуском такой программы необходимо распаковать NeXus файл и перевести его в требуемый формат. Эта процедура легко выполняется в запускающем скрипте на вычислительном узле. Что касается точности, то при передаче и сохранении файлов подсчитывается контрольная сумма, что минимизирует возможность просмотра факта искажения данных. В реализации экспериментальной модели не предусмотрено необоснованного использования вычислительных и дисковых ресурсов, а также дублирования данных, за исключением случаев, связанных с обеспечением отказоустойчивости (RAID массив). Таким образом, данный пункт технического задания можно считать выполненным.

Разрабатываемая в ходе исследований модель должна соответствовать современным международным стандартам по интероперабельности и открытости вычислительных систем, в том числе:

а) технологическим стандартам группы W3C (World Wide Web Consortium) (в т.ч. XML (и смежные стандарты), OWL, RDF, URI/URL, XPath, MTOM, SOAP и пр.)

б) технологическим стандартам серии RFC (Request for Comments) (в т.ч. URL (RFC 1738), ATOM (RFC 4287, RFC 5023), SSL и TSL (RFC 2246), NFS (RFC 3010) и пр.)

в) технологическим стандартам группы OASIS (Organization for the Advancement of Structured Information Standards) (в т.ч. группа стандартов WS-*, UDDI, и пр.) (п. 6.2.1 ТЗ).

Все сетевые взаимодействия разработанной модели, как внутренние, так и внешние, реализуются с использованием стандартных протоколов и программных библиотек.

Стандарты группы W3C, в частности XML и SOAP, используются для взаимодействия с сервисом управления виртуальными организациями.

Стандарты группы RFC, в частности SSL, TLS и URI/URL, используются для сетевого взаимодействия всеми сервисами разработанной модели.

Стандарты группы OASIS, в частности WSRF, используются сервисами управления виртуальными организациями и запуска заданий, построенными по данной технологии.

Таким образом, данный пункт технического задания можно считать выполненным.

6.2.2 Должны использоваться стандартные, унифицированные методы реализации функций (задач):

а) поддержка современных транспортных протоколов: TCP/IР;

б) поддержка наиболее распространенных форматов документов: HTML, XML и т.д.;

в) поддержка в области повышения отказоустойчивости и надежности системы;

г) поддержка кластерных решений;

д) поддержка распределенного доступа к информации (п. 6.2.2 ТЗ)

Протокол TCP/IР используется при всех сетевых взаимодействиях и реализуется на уровне базовых операционных систем. При интерактивном взаимодействии пользователей через веб-интерфейс веб-страницы выдаются в формате HTML. Испытательный стенд был реализован, как аппаратный кластер со средствами поддержки отказоустойчивости и надёжности. Распределенный доступ к данным обеспечивается через веб-интерфейс, доступный в Интернет. Таким образом, данный пункт технического задания можно считать выполненным.

Стандартизация и унификация используемых аппаратных средств должна обеспечиваться посредством использования серийно выпускаемых средств вычислительной техники и коммуникационного оборудования. Используемое оборудование должно соответствовать стандартам Российской Федерации и международным стандартам (п. 6.2.3 ТЗ). В разделе 3 отчета за второй этап НИР описывается испытательный стенд для проведения экспериментальных исследований. Состав испытательного стенда полностью соответствует требованию данного пункта ТЗ.

При разработке программного обеспечения с использованием веб-технологий разработанные веб-решения должны обеспечивать совместимость с распространенными браузерами: MS Internet Explorer (версии 7.0 и выше), Firefox (версии 3.0 и выше), Chrome (версии 5.0 и выше), Opera (версии 10.0 и выше) (п. 6.2.4 ТЗ). Веб-интерфейс был протестирован на этих версиях браузеров. Таким образом, данный пункт технического задания можно считать выполненным.

Разработанная программная документация должна удовлетворять требованиям Единой системы программной документации (ЕСПД) (ГОСТ 19.ХХХ) (п. 6.2.5 ТЗ). Разработанная программная документация соответствует требованиям Единой системы программной документации.

Меры обеспечения безопасности для жизни и здоровья людей и охраны окружающей среды должны включать выявление опасных и вредных объектов, факторов воздействия и разработку соответствующих мероприятий по их исключению (п. 6.3.1 ТЗ). В разработанной Программе и методике экспериментальных исследований указаны требования безопасности, в соответствии с которыми происходила подготовка и проведение экспериментальных исследований.

Используемые в ходе экспериментальных исследований технические средства должны соответствовать общим требованиям электробезопасности (ГОСТ 12.1.019-79), общим требованиям по пожарной безопасности (ГОСТ 12.1.004-91) (п. 6.3.2 ТЗ). В соответствии с Пояснительной запиской к испытательному стенду технические средства соответствуют общим требованиям электробезопасности (ГОСТ 12.1.019-79), общим требованиям по пожарной безопасности (ГОСТ 12.1.004-91).

В процессе изготовления экспериментального образца и проведения исследовательских испытаний должны быть соблюдены следующие меры безопасности:

а) общие требования к помещениям для размещения компьютерной техники, микроклимату, составу воздуха и освещению производственных помещений, уровням шума на рабочем месте и оборудованию рабочих мест согласно СанПин 2.2.2/2.4.1340-03;

б) общие эргономические требования и требования безопасности средств отображения информации индивидуального пользования (ГОСТ Р 50948-2001) (п. 6.3.3 ТЗ).

В разработанной Программе и методике экспериментальных исследований в разделе 2 приведены общие требования к условиям, обеспечению и проведению экспериментальных исследований, которые соответствуют указанным мерам безопасности. Специальных требований безопасности при выполнении работ по завершению эксперимента не предъявлялось.

Состав, структура и способы организации данных должны быть определены на этапе теоретических и экспериментальных исследований поставленных перед НИР задач (п. 6.4.1.1 ТЗ). На втором этапе работ (“Теоретические и экспериментальные исследования поставленных перед НИР задач”) было разработано программное обеспечение экспериментальной реализации разработанной модели в виде программного комплекса “МОДУС”, в состав которого входят программные компоненты, определяющие основные структуры данных модели:

а) Сервис хранения метаданных, включающий в себя базу метаданных, структура которой разработана в соответствии с опытом современных требований к метаданным для систем по нейтронным и фотонным исследованиям;

б) Сервис хранения файлов, предоставляющий доступ к подключенным к нему файловым системам по стандартным протоколам передачи данных (HTTPS, GridFTP), составляющих файловое хранилище для файлов экспериментальных данных и результатов обработки и анализа данных;

Подробное описание состава, структуры и способов организации данных представлено в программной документации программного комплекса “МОДУС”.

Уровень хранения данных должен быть построен на основе современных реляционных или объектно-реляционных систем управления базой данных (СУБД). Средства СУБД, а также средства используемых операционных систем должны обеспечивать документирование и протоколирование обрабатываемой в системе информации. (п. 6.4.1.2 ТЗ). При реализации модели была использована реляционная база данных MySQL. Используемая операционная система Linux, а также сам MySQL, обеспечивают достаточно широкий набор журнальных файлов и файлов с ошибками выполнения, протоколируя происходящие события. Таким образом, данный пункт технического задания можно считать выполненным.

Доступ к данным должен быть предоставлен только авторизованным пользователям (п. 6.4.1.3 ТЗ). Проблеме аутентификации и авторизации в модели было уделено особое внимание. Для того чтобы пользователь мог войти в систему, он должен иметь сертификат и быть зарегистрированным в виртуальной организации. Кроме того, ему должна быть назначена конкретная роль, определяющая возможность выполнения тех или иных действий с объектами базы данных. Эти механизмы подробно описаны в разделах 1.2 и 1.5.2 отчета за второй этап НИР. Таким образом, данный пункт технического задания можно считать выполненным.

Технические средства, обеспечивающие хранение информации, должны использовать современные технологии, позволяющие обеспечить повышенную надежность хранения данных и оперативную замену оборудования (распределенная избыточная запись/считывание данных; зеркалирование; независимые дисковые массивы; кластеризация) (п. 6.4.1.4 ТЗ). Для повышения надёжности хранения данных для испытательного стенда было предусмотрено следующее:

а) использование в составе испытательного стенда оборудования, поддерживающего режим HotSwap – (Hot Replacement of Disks - Горячая Замена Дисководов) - это возможность замены вышедших из строя дисководов без прерывания работы системы.

б) использование в системе хранения данных RAID контроллера, управляющего избыточной дисковой системой (RAID массивом) и позволяющего при отказе одного дисковода избежать прерывания функционирования системы.

в) использование системы бесперебойного питания и климат-контроля, что обеспечивает оптимальный режим работы технических средств испытательного стенда.

Таким образом, данный пункт технического задания можно считать выполненным.

Требования к программному обеспечению. Используемое при разработке программное обеспечение и библиотеки программных кодов должны быть общедоступными. Базовой программной платформой должна являться операционная система GNU/Linux (п. 6.4.2 ТЗ). Базовой программной платформой модели является операционная система Linux Centos, которая является общедоступной.

Требования к лингвистическому обеспечению. Для организации взаимодействия с пользователем должен использовать русский язык. Допускается вывод сообщений операционной системы на английском языке (п. 6.4.3 ТЗ). Веб-интерфейс обеспечивает возможность переключения с русского языка на английский.

В качестве технических средств для экспериментальной реализации модели должны использоваться современные серийно выпускаемые средства вычислительной техники и коммуникационного оборудования (п. 6.4.4.1 ТЗ). В разделе 3 отчета за второй этап НИР описывается испытательный стенд для проведения экспериментальных исследований. Состав испытательного стенда полностью соответствует требованию данного пункта ТЗ.

Для повышения надёжности работы испытательного стенда вычислительное и коммуникационное оборудование должно быть объединено в отказоустойчивый аппаратный кластер (п. 6.4.4.2 ТЗ). В разделе 3 отчета за второй этап НИР описывается испытательный стенд для проведения экспериментальных исследований. Этот стенд создан на базе кластерных технологий.
1   2   3   4   5   6   7   8   9   ...   14

Похожие:

Фгбу «пияф» удк 001. 89: 004. 31 iconУчебное пособие Санкт-Петербург 2013 удк 1: 001; 001. 8 Ббк 87. 3
Пашута В. Л., Заслуженный работник высшей школы рф, доктор педагогических наук, профессор
Фгбу «пияф» удк 001. 89: 004. 31 iconНаучно-исследовательский институт ядерной физики имени Д. В. Скобельцына удк 004. 75+004. 722
Разработка технологий высокопроизводительных вычислений с использованием неоднородных территориально-распределённых вычислительных...
Фгбу «пияф» удк 001. 89: 004. 31 iconНаучно-исследовательский институт ядерной физики имени Д. В. Скобельцына...
«Развитие, исследование и внедрение средств высокопроизводительных вычислений на основе технологий Грид с поддержкой гетерогенных,...
Фгбу «пияф» удк 001. 89: 004. 31 iconНаучно-исследовательский институт ядерной физики имени Д. В. Скобельцына...
«Разработка архитектуры и программных средств для обеспечения взаимодействия грид-инфраструктуры рдиг/egee и создаваемой системы...
Фгбу «пияф» удк 001. 89: 004. 31 iconФеноменология иммунного ответа на т-независимые антигены 2-го типа
Защита состоится 17 мая 2012г в 12 часов на заседании диссертационного совета д 001. 035. 01 при фгбу «ниивс им. И. И. Мечникова»...
Фгбу «пияф» удк 001. 89: 004. 31 iconУдк 004. 9 Коржик И. А
Методические рекомендации в помощь преподавателю: издание гаоу спо «Уфимский топливно – энергетический колледж». – Уфа, 2012г
Фгбу «пияф» удк 001. 89: 004. 31 iconУдк 628 03 ресурсы подземных вод красноярского края
Правила подготовки к печати оригиналов, предназначенных для изданий пияф в форме препринтов, сообщений и авторефератов
Фгбу «пияф» удк 001. 89: 004. 31 iconЭлектронных ресурсов «наука и образование» №3 (46) март 2013 удк 51, 002, 004 № офэрниО: 18981
Интерактивный учебный комплекс по математике / фгбоу впо санкт-Петербургский государственный морской технический университет
Фгбу «пияф» удк 001. 89: 004. 31 iconУдк 004. 942 : 57. 026 Эволюционно стабильная информационная структура...
Федеральный закон от 31. 05. 2001 №73-фз «О государственной судебно-экспертной деятельности» (выдержки)
Фгбу «пияф» удк 001. 89: 004. 31 iconНаучно-исследовательский институт ядерной физики имени Д. В. Скобельцына...
«Создание программного обеспечения для калибровки измерительной аппаратуры и анализа доступных наблюдению физических процессов в...
Фгбу «пияф» удк 001. 89: 004. 31 iconУдк 004. 81 Разработка принципов поддержки экономических интересов...
В мешке Старика-Годовика собраны признаки самого прекрасного времени года. Ваша задача: найти причину явления, названного в столбике...
Фгбу «пияф» удк 001. 89: 004. 31 iconУдк 004. 738. 5 Ббк 32. 973. 202 Главный редактор
Используя их, учителя могут получить доступ к содержанию специализированных мультимедиа библиотек, энциклопедий, справочников, учебников,...
Фгбу «пияф» удк 001. 89: 004. 31 iconУдк 32. 001 К вопросу об определении понятия политической культуры
Санитарного состояния определяют порядок уборки и содержания, озеленения территории Кадряковского сельского поселения, в том числе...
Фгбу «пияф» удк 001. 89: 004. 31 iconУчебно-методическое пособие Красноярск сфу 2012 удк 504. 004. 4 (07) ббк 28. 0я73
Экологическая информатика: учебно-методическое пособие [Текст] / сост. М. А. Субботин. – Красноярск: Сиб федер ун-т, 2012. – 9 с
Фгбу «пияф» удк 001. 89: 004. 31 iconСрок приёма документов для участия в конкурсе на обучение по программам...
Вступительные испытания в аспирантуру фгбу «нииэм» зо рамн проводятся с 07. 07. 2014 г по 11. 07. 2014 г
Фгбу «пияф» удк 001. 89: 004. 31 iconУдк 004. 42: 336. 761. 6 Аллигатор и фрактал для анализа фондового рынка
Совете по вопросам регламентации доступа к информации в Интернете, целью создания Совета является обеспечение разработки и принятия...


Школьные материалы


При копировании материала укажите ссылку © 2013
контакты
100-bal.ru
Поиск