МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
имени М.В.ЛОМОНОСОВА НАУЧНО-ИССЛЕДОВАТЕЛЬСКИЙ ИНСТИТУТ ЯДЕРНОЙ ФИЗИКИ
имени Д.В.СКОБЕЛЬЦЫНА УДК 004.75+004.722
Инв. № 105846/09
УТВЕРЖДАЮ
Зам. директора НИИЯФ МГУ ______________ В.И. Оседло
«___» _________ 2009 г.
ОТЧЕТ № 1 ПО КОМПЛЕКСНОМУ ПРОЕКТУ
"Исследование и разработка технологий распределенных вычислительных сред с эффективной поддержкой массового доступа к распределённым информационным и вычислительным ресурсам. Разработка технологий высокопроизводительных вычислений с использованием неоднородных территориально-распределённых вычислительных ресурсов"
(промежуточный) Этап 1. Выбор направления исследований
Руководитель работы
д.ф.-м.н. ________________________________ В.А. Ильин
«____» _____ 2009 г.
Москва, 2009
СПИСОК ИСПОЛНИТЕЛЕЙ
Руководитель работ, зам. директора,
д.ф.-м.н.
|
_________________
| В.А.Ильин (заключение)
| Исполнители в.н.с., к.ф.-м.н.
|
_________________
| А.П.Крюков (введение, реферат)
| вед. программист
|
_________________
| Е.Г. Боос (основная часть)
| с.н.с., к.ф.-м.н.
|
_________________
| В.Ф. Еднерал (введение, основная часть)
| с.н.с., к.ф.-м.н.
|
_________________
| Г.Б. Шпиз(основная часть, заключение)
|
Реферат Ключевые слова: распределенные вычисления, грид, грид-сервис, суперкомпьютеры, СКИФ.
Объектом исследования являются методы разработки технологий распределительных вычислительных сред с эффективной поддержкой массового доступа к распределённым информационным и вычислительным ресурсам, а также разработка технологий высокопроизводительных вычислений с использованием неоднородных территориально-распределённых вычислительных ресурсов в части развития экспериментальных сервисов высокопроизводительных вычислений и хранения данных на основе суперкомпьютеров<СКИФ>.
Цель данного заключительного этапа НИР – выбор направления исследований. Проведенные работы соответствуют мировому уровню разработок в данной области исследований. СОДЕРЖАНИЕ
1 ВВЕДЕНИЕ 5
2 ИССЛЕДОВАНИЯ, ВЫПОЛНЕННЫЕ НА 1 ЭТАПЕ 7
2.1 Разработка технологии запуска заданий, подготовленных в среде ППО «СКИФ-ГРИД», для запуска на вычислительных ресурсах Грид - Национальной Нанотехнологической Сети (ГридННС) 7
2.2 Доработка и усовершенствование Системы SKIF@Home, предназначенной для развертывания высокопроизводительной ГРИД-сети на основе простаивающих компьютеров. 9
2.3 Разработка сервисов квотированного управления научными данными и вычислениями по технологии cloud-computing на основе инфраструктуры СКИФ-Грид 11
2.4 Разработка эффективных высокопроизводительных решений для создания систем динамической обработки спутниковых данных и результатов их анализа 12
2.5 Разработка экспериментальных сервисов высокопроизводительных вычислений 13
3 ЗАКЛЮЧЕНИЕ 14
1 ВВЕДЕНИЕ Основными задачами 1 этапа научно-исследовательских работ по договору от 29 мая 2009 г. № 2009-СГ-06 являлись выбор направления исследования и создание задела для выполнения следующих этапов комплексного проекта.
На первом этапе в соответствии с ТЗ выполнялись следующие работы.
В рамках проекта
"Разработка технологии запуска заданий, подготовленных в среде ППО «СКИФ-ГРИД», для запуска на вычислительных ресурсах Грид - Национальной Нанотехнологической Сети (ГридННС)" (исполнитель НИИЯФ МГУ) проводился анализ научно-технической литературы и нормативно-технической документации. Были сформулированы возможные направления решения задачи разработки технологии запуска многошаговых заданий, подготовленных в рамках модели управления потоком задач СКИФ-ГРИД и разработки единого интерфейса пользователя для реализации соответствующей технологии. Были сформулированы требования к ППО транзитного узла, используемого для связи заданий СКИФ-ГРИД с ресурсами ГридННС, описана архитектура макета «транзитного узла», предназначенного для тестирования разрабатываемого ПО.
В рамках проекта
"Доработка и усовершенствование Системы SKIF@Home, предназначенной для развертывания высокопроизводительной ГРИД-сети на основе простаивающих компьютеров" (исполнитель ЗАО "Каледин и Партнеры") проводилась доработка и усовершенствование Системы SKIF@Home с целью упростить использование клиентской части системы «SKIF@Home» для пользователей-доноров (разработка дополнительных возможностей системы) и обеспечить стабильное функционирование портала системы «SKIF@Home». При этом решались следующие задачи.
Разработка механизмов автоматического обновления образа виртуальной машины вычисляемой задачи на машинах-донорах,
Обеспечение контроля работоспособности сервера и веб-сайта проекта Skif@Home контроля и поддержки безопасности и целостности списков авторизации пользователей Системы; консультации специалистов Заказчика по общим вопросам, связанным с работой Системы; внесение необходимых изменений в системное программное обеспечение (серверное и клиентское), включая оперативное исправление вновь обнаруженных дефектов в Системе.
В рамках проекта "Разработка сервисов квотированного управления научными данными и вычислениями по технологии cloud-computing на основе инфраструктуры СКИФ-Грид" (исполнитель ГЦ РАН) проводилась работа по организации сервисов проведения высокопроизводительных расчетов и обработки данных по технологии cloud-computing на суперкомпьютерах семейства СКИФ. На данном этапе основной задачей являлась разработка архитектуры распределенной системы сервисов управления данными. В рамках проекта "Разработка эффективных высокопроизводительных решений для создания систем динамической обработки спутниковых данных и результатов их анализа" (исполнитель ИКИ РАН) проводилась разработка программных компонент, необходимых для функционирования динамических сервисов предоставления данных.
В рамках проекта Разработка экспериментальных сервисов высокопроизводительных вычислений" (исполнитель ИСА РАН) разрабатывались и реализовывались сервисы для решения задач глобальной оптимизации в Грид-инфраструктуре на базе ППО «СКИФ-ГРИД».
Проводились тестовые испытания для задачи поиска конформации атомного кластера для потенциалов Леннарда-Джонса и Морзе в диапазоне 50-100 атомов.
Проведенные работы соответствуют мировому уровню разработок в данной области исследований.
Ниже приведен перечень аннотационных отчетов соисполнителей, принимавших участие в выполнении работ по комплексному проекту. Тексты полных отчетов по каждой части Технического задания к договору от 28 мая 2009 г. № 2009-СГ-06 представлены в соответствующих приложениях.
2 ИССЛЕДОВАНИЯ, ВЫПОЛНЕННЫЕ НА 1 ЭТАПЕ
2.1 Разработка технологии запуска заданий, подготовленных в среде ППО «СКИФ-ГРИД», для запуска на вычислительных ресурсах Грид - Национальной Нанотехнологической Сети (ГридННС)
Исполнитель - НИИЯФ МГУ, Москва. См. приложение – отчет по части 1 Технического задания к договору от 28.05.2009 № 2009-СГ-06. Содержание работ Цель и задачи проекта (для данного этапа)
Обеспечить выполнение заданий, подготовленных в среде «СКИФ-ГРИД», с использованием вычислительных ресурсов Грид - Национальной Нанотехнологической Сети (ГридННС)
На данном этапе проводился анализ научно-технической литературы и нормативно-технической документации. Были сформулированы возможные направления решения задачи разработки технологии запуска многошаговых заданий, подготовленных в рамках модели управления потоком задач СКИФ-ГРИД и разработки единого интерфейса пользователя для реализации соответствующей технологии. Разработана архитектура «тразитного узла» системы СКИФ-ГРИД , обеспечивающего использование ресурсов ГридННС пользователями СКИФ-ГРИД. Создан проект макета «тразитного узла», предназначенного для тестирования разрабатываемого ППО. Выполненные работы.
1. Проведен анализ научно-технической литературы и нормативно-технической документации. Сформулированы возможные направления решения задачи разрабатываемой технологии запуска многошаговых заданий, подготовленных в рамках модели управления потоком задач СКИФ-ГРИД и разработки единого интерфейса пользователя для реализации соответствующей технологии, которые базируются на следующих принципах.
1) Минимальное вмешательство в работу вычислительных ресурсов ГридННС; отказ от установки на них какого-либо серверного ПО на вычислительных ресурсах ГридННС.
2) Запуск вычислительных заданий через ресурс-менеджера ГридННС.
3) Контроль за распределением ресурсов ГридННС между заданиями пользователей ГридННС и СКИФ-ГРИД осуществляется ресурс-менеджером ГридННС.
4) Доступ пользователей СКИФ-ГРИД к информационной системе ГридННС, в рамках прав доступа, устанавливаемых системным администратором ГридННС.
5) Использование механизма контроля над многошаговыми заданиями, используемого в СКИФ-ГРИД.
В результате анализа состояния проблемы предложен подход к технологии запуска заданий СКИФ-ГРИД с использованием вычислительных ресурсов ГридННС, основанный на использовании специальных «транзитных» узлов, создаваемых в системе СКИФ-ГРИД. Эти узлы представляют собой специализированные вычислительные ресурсы грид-системы (компьютерные элементы и/или рабочие ноды) на которых устанавливается «транзитный сервис» - ПО, обеспечивающее передачу заданий ресурс-менеджеру ГридННС, а также мониторинг заданий и доступ к информации о конфигурации ресурса ГридННС.
Разработана архитектура «тразитного узла» системы СКИФ-ГРИД , обеспечивающего использование ресурсов ГридННС пользователями СКИФ-ГРИД. Установлен предварительный состав необходимого ППО.
Создан проект макета «тразитного узла», предназначенного для тестирования разрабатываемого ППО. Описан состав ПО относящегося к ГридННС и СКИФ-ГРИД, которое должно быть установлено на макете.
2.2 Доработка и усовершенствование Системы SKIF@Home, предназначенной для развертывания высокопроизводительной ГРИД-сети на основе простаивающих компьютеров.
Исполнитель - ЗАО "Каледин и Партнеры". См. приложение – отчет по части 2 Технического задания к договору от 28.05.2009 № 2009-СГ-06. Содержание работ Цель и задачи проекта (для данного этапа)
Общей целью создания Системы SKIF@Home – является предоставление изолированной среды выполнения приложений и учета аппаратных ресурсов для нужд систем параллельных вычислений. Подобный подход позволяет успешно работать с ресурсоемкими приложениями без использования дорогостоящих высокопроизводительных серверов (кластеров серверов).
Целями доработки и усовершенствования Системы в рамках текущего этапа являются:
Упростить использование клиентской части системы «SKIF@Home» для пользователей-доноров (разработка дополнительных возможностей системы).
Обеспечить стабильное функционирование портала системы «SKIF@Home».
На данном этапе работ решаются следующие задачи:
Разработка механизмов автоматического обновления образа виртуальной машины вычисляемой задачи на машинах-донорах,
Обеспечение контроля работоспособности сервера и веб-сайта проекта Skif@Home контроля и поддержки безопасности и целостности списков авторизации пользователей Системы; консультации специалистов Заказчика по общим вопросам, связанным с работой Системы; внесение необходимых изменений в системное программное обеспечение (серверное и клиентское), включая оперативное исправление вновь обнаруженных дефектов в Системе.
Выполненные работы
Оценена эффективность существующих общедоступных методов сжатия образов виртуальной машины с целью снижения времени передачи и интернет-трафика обновленных образов с сервера на машины «доноров» Системы.
Разработаны командные скрипты для операционной системы AltLinux, предназначенные для добавления или замены обновленного образа виртуальной машины.
Осуществлен регулярный контроля работоспособности веб-сервера Skif@Home, настроен механизм регулярного сохранения текущего состояния базы данных Системы (создание бекапов БД).
2.3 Разработка сервисов квотированного управления научными данными и вычислениями по технологии cloud-computing на основе инфраструктуры СКИФ-Грид
Исполнитель - ГЦ РАН. См. приложение – отчет по части 3 Технического задания к договору от 28.05.2009 № 2009-СГ-06. Содержание работ Цель и задачи проекта (для данного этапа) Целью проекта является организация сервисов проведения высокопроизводительных расчетов и обработки данных по технологии cloud-computing на суперкомпьютерах семейства СКИФ. На данном этапе основной задачей является разработка архитектуры распределенной системы сервисов управления данными. Выполненные работы.
На начальном этапе работ по проекту проводились исследования существующих технологий cloud-computing и системной архитектуры промежуточного программного обеспечения, в частности сервисов управления данными. Для сравнительного анализа были отобраны облака данных основных коммерческих поставщиков сервисов cloud-computing, включая Amazon Elastic Cloud, Microsoft Azure, и Google App Engine. Проведен анализ функциональности сервисов данных и клиентских библиотек и приложений и возможности реализации аналогичных сервисов на инфраструктуре СКИФ-Грид. С учетом этого анализа и требований интероперабильности для приложений была разработана предварительная спецификация для сервисов данных по для инфраструктуры СКИФ-Грид. .
2.4 Разработка эффективных высокопроизводительных решений для создания систем динамической обработки спутниковых данных и результатов их анализа
Исполнитель – ИКИ РАН. См. приложение – отчет по части 4 Технического задания к договору от 28.05.2009 № 2009-СГ-06. Содержание работ Цель и задачи проекта (для данного этапа)
Разработка программных компонент, необходимых для функционирования динамических сервисов предоставления данных. Выполненные работы.
Был проведен тщательный анализ технологий и программного обеспечения, уже разработанных в ИКИ РАН, на предмет их использования для создания требуемых программных компонент. Для получения географически привязанных спутниковых изображений было решено использовать программное обеспечение Mapserver с использованием графического пакета gdal.
Для хранения спутниковых изображений было решено использовать разбиение их на гранулы различного масштаба, формирующие пирамиду разрешений. Реализованы прототипы программных компонент, отвечающих за операции со спутниковыми данными, такие как перепроецирование, сшивка изображений и др. Было решено, что разрабатываемые программные компоненты будут реализованы на языках программирования С++ и perl и будут функционировать под операционной системой UNIX. В качестве HTTPD сервера будет использовано ПО Apache, а в качестве СУБД – Mysql. .
2.5 Разработка экспериментальных сервисов высокопроизводительных вычислений
Исполнитель – ИСА РАН. См. приложение – отчет по части 5 Технического задания к договору от 28.05.2009 № 2009-СГ-06. Содержание работ Цель и задачи проекта (для данного этапа)
1 Разработать и реализовать сервисы для решения задач глобальной оптимизации в Грид-инфрструктуре на базе ППО «СКИФ-ГРИД».
1 Провести тестовые испытания для задачи поиска конформации атомного кластера для потенциалов Леннарда-Джонса и Морзе в диапазоне 50-100 атомов. Полученные результаты на данном этапе проекта Разработаны и реализованы сервисы глобальной оптимизации, обеспечивающие организацию вычислений в распределенной среде, состоящей из разнородных вычислительных ресурсов. Разработаны программы и методики экспериментальных исследований.
Проведение численных экспериментов для задачи поиска энергетически-оптимальной конформации атомного кластера для потенциалов Леннарда-Джонса и Морзе в диапазоне 50-100 атомов. Проведен анализ полученных результатов и их сопоставление с известными зарубежными аналогами, в результате которых подтверждена эффективность разрабатываемых методов и программного обеспечения. Разработаны:
1. Сервис CEManager для управление процессом решения задачи глобальной оптимизации на вычислительном узле;
2. Cервис CSManager, управляющих процессом решения задач глобальной оптимизации совокупностью приложений, выполняющихся на узлах распределенной системы.
Проведены испытания, предоставлены программа и протоколы испытаний
3 ЗАКЛЮЧЕНИЕ В ходе работ по первому этапу получены следующие результаты.
Выделены возможные направления решения задачи разработки технологии запуска многошаговых заданий, подготовленных в рамках модели управления потоком задач СКИФ-ГРИД и разработки единого интерфейса пользователя для реализации соответствующей технологии. Сформулированы требования к ППО транзитного узла, используемого для связи заданий СКИФ-ГРИД с ресурсами ГридННС, описана архитектура макета «транзитного узла», предназначенного для тестирования разрабатываемого ПО.
Оценена эффективность существующих общедоступных методов сжатия образов виртуальной машины с целью снижения времени передачи и интернет-трафика обновленных образов с сервера на машины «доноров» Системы. Разработаны командные скрипты для операционной системы AltLinux, предназначенные для добавления или замены обновленного образа виртуальной машины. Осуществлен регулярный контроля работоспособности веб-сервера Skif@Home, настроен механизм регулярного сохранения текущего состояния базы данных Системы (создание бекапов БД).
Проведены исследования существующих технологий cloud-computing и системной архитектуры промежуточного программного обеспечения, в частности сервисов управления данными. Для сравнительного анализа были отобраны облака данных основных коммерческих поставщиков сервисов cloud-computing, включая Amazon Elastic Cloud, Microsoft Azure, и Google App Engine. Проведен анализ функциональности сервисов данных и клиентских библиотек и приложений и возможности реализации аналогичных сервисов на инфраструктуре СКИФ-Грид. С учетом этого анализа и требований интероперабильности для приложений была разработана предварительная спецификация для сервисов данных по для инфраструктуры СКИФ-Грид.
Был проведен тщательный анализ технологий и программного обеспечения, уже разработанных в ИКИ РАН, на предмет их использования для создания требуемых программных компонент. Для получения географически привязанных спутниковых изображений было решено использовать программное обеспечение Mapserver с использованием графического пакета gdal. Для хранения спутниковых изображений было решено использовать разбиение их на гранулы различного масштаба, формирующие пирамиду разрешений. Реализованы прототипы программных компонент, отвечающих за операции со спутниковыми данными, такие как перепроецирование, сшивка изображений и др. Было решено, что разрабатываемые программные компоненты будут реализованы на языках программирования С++ и perl и будут функционировать под операционной системой UNIX. В качестве HTTPD сервера будет использовано ПО Apache, а в качестве СУБД – Mysql.
Разработаны: сервис CEManager для управления процессом решения задачи глобальной оптимизации на вычислительном узле и сервис CSManager, управляющий процессом решения задач глобальной оптимизации совокупностью приложений, выполняющихся на узлах распределенной системы. Проведены испытания, предоставлены программа и протоколы испытаний.
Таким образом задачи первого этапа решены и его цели достигнуты.
|