Разработка тематического рубрикатора в системе СКИИР Система коллективного использования информационных ресурсов (далее просто СКИИР) разрабатывается и поддерживается Центром Разработки компании «ФОРС» по заказу Департамента исследований и информации (ДИИ) Банка России. Основная цель работы данного департамента – предоставление качественно структурированной и рубрицированной информации сотрудникам Банка России. Система СКИИР предназначена, прежде всего, для автоматизации процессов деятельности ДИИ, в частности, обработки, загрузки и публикации поступающего объема информации. Следующие черты характеризуют данные процессы:
значительные поступления документов из внешних организаций, таких как Федеральная служба государственной статистики, Министерство экономического развития и торговли, Министерство по налогам и сборам, Министерство финансов, Международная межбанковская валютная биржа, информационные агентства и т.д.;
проверка целостности входной информации;
распределение материалов по рубрикам в процессе публикации;
регламентированный доступ пользователей к значительному объему востребованной информации.
Большую часть поступающей информации составляют пакеты документов, наделенные некоторыми метаданными и имеющие внутреннюю структуру. Большая часть значений метаданных документов не выделена из документов – она хранится в содержимом самого документа. Структуры тематических иерархий пакетов документов содержатся внутри дополнительных Word или HTML документов и не пригодны для дальнейшего эффективного использования.
1.11.Причины создания новой системы В подразделениях Департамента исследования и информации на тот момент было накоплено и использовалось достаточно большое количество информационных ресурсов, как первичных, полученных от разных поставщиков информации, так и собственных, являющихся результатом работы подразделений ДИИ. В ДИИ выполняются сложные аналитические работы, связанные с обработкой больших объемов информации. ДИИ осуществляет информационное обслуживание сотрудников Банка России, предоставляя регламентированный доступ к своему информационному фонду. Используемые данные можно условно разделить на следующие группы:
Статистические – в основном это динамические ряды числовых данных по различным показателям;
Полнотекстовые – представляют собой электронные документы различных форматов;
Метаданные – описывают свойства информационных ресурсов.
Значительные объемы накопленной в ДИИ информации, её разнообразие и сложность, наличие в ДИИ аналитической обработки данных с применением различных информационных систем, выполнение Департаментом функции информационного обслуживания большого числа сотрудников Банка России с разграничением доступа − эти и другие факторы делают информационные ресурсы ДИИ сложной структурой, требующей системного подхода для реализации функции администрирования информационных ресурсов. Один из примеров рабочих процессов ДИИ изображен на рисунке 4.
В Департаменте исследований и информации долгое время не существовало средств автоматизации процессов обработки входных пакетов документов, которые смогли бы облегчить процедуры формирования их метаданных и сделать возможной генерацию подходящих структурных описаний. Появлению подобных средств автоматизации препятствовали эксплуатируемые Web-технологии, не пригодные для эффективной работы с метаданными и тематическими рубрикаторами.
Рисунок 4. Рабочий процесс обеспечения доступа к информационному ресурсу
Эффективное использование информационных ресурсов было затруднено ввиду множества недостатков существующего на тот момент Web-сайта ДИИ, в том числе проблем, затрудняющих процессы обработки и публикации информации. Основными из этих проблем являлись:
Отсутствие общей поисковой системы: полнотекстовый поиск по документам, опубликованным в имеющемся портале, был невозможен, ссылающаяся информация не была проиндексирована;
Ручная публикация: документы публиковались путем размещения файлов на Web-сервере, что осложняло администрирование информационных ресурсов и управление доступом;
Разрозненные рубрикаторы: рубрикаторы создавались вручную в виде HTML-файлов и не были представлены в виде декларативного описания, что осложняло рубрицирование документов и редактирование самих рубрикаторов;
Децентрализованное управление доступом – было необходимо знать, кто поддерживает конкретный информационный ресурс;
Слабая масштабируемость и гибкость – отсутствовала возможность быстрого редактирования структуры отображения информации;
Неоднозначный интерфейс доступа к информации, что запутывало пользователей при попытках найти нужный ресурс.
Система СКИИР была призвана заменить существующий Web-сайт ДИИ и решить указанные выше проблемы. В качестве базовой технологии для разрабатываемой системы по соображениям, не связанным с данной работой, было выбрано решение Microsoft SharePoint Portal Server 2003. В рамках данной работы не предполагается детального рассмотрения структуры и состава модулей системы. Общая архитектура системы и ее окружения приведена в виде диаграммы в Приложении 1. В следующем разделе приводится краткое описание архитектуры и функций, выполняемых СКИИР.
|