МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ МОСКОВСКИЙ ФИЗИКО-ТЕХНИЧЕСКИЙ ИНСТИТУТ
(Государственный Университет) ФАКУЛЬТЕТ ОБЩЕЙ И ПРИКЛАДНОЙ ФИЗИКИ
Кафедра Системной Интеграции и Менеджмента
Реализация семантического подхода к построению тематического рубрикатора информационных ресурсов
Магистерская диссертация студента 125 группы
Сергеева Евгения Владимировича Научный руководитель:
кандидат филологических наук, доцент
Рыков В.В. Рецензент:
доктор технических наук, профессор
Беляев И.П.
Москва 2007
Содержание Содержание 2
Используемые сокращения 2
Введение 4
1.1. Цель работы 5
1.2. Актуальность темы 5
1.3. Научная новизна и практическая значимость 6
Обзор технологий Semantic Web 7
1.4. Принципы построения модели RDF 8
1.5. Использование словарей: RDF Schema 10
1.6. Онтология и язык OWL 11
1.7. Topic Maps как альтернатива RDF 12
Порталы знаний и семантические порталы 15
1.8. Возможности применения онтологий 16
1.9. Примеры семантических порталов 18
1.10. Технологии построения семантических порталов SEAL 20
Разработка тематического рубрикатора в системе СКИИР 22
1.11. Причины создания новой системы 23
1.12. Архитектура и функции СКИИР 25
1.13. Методика построения тематического рубрикатора СКИИР 31
Заключение 43
1.14. Направления дальнейшей работы 44
Литература 45
Приложение 1. Архитектура СКИИР и ее окружение 47
Приложение 2. Диаграммы таблиц базы данных рубрикатора СКИИР 48
Приложение 3. Пример тематических рубрик для классификации информационных ресурсов ДИИ. 51
Используемые сокращения XML – Extensible Markup Language (Расширяемый язык разметки)
RDF – Resource Description Framework (Схема описания ресурсов)
OWL – Web Ontology Language (Язык онтологий для Интернета)
URI – Uniform Resource Identifier (Универсальный идентификатор ресурса)
URL – Uniform Resource Locator (Универсальный указатель ресурса)
СУБД – Система управления базой данных
СУЗ – Система управления знаниями
ПЗ – Портал знаний
КИП – Корпоративный информационный портал
КПЗ – Корпоративный портал знаний
SVM – Support Vector Machine (Метод опорных векторов)
Введение Важнейшим ресурсом современного предприятия, способным значительно повлиять на повышение его конкурентоспособности и инвестиционной привлекательности, являются корпоративные знания. Сегодня с этим никто не спорит, вопрос только в том, как воспользоваться этими корпоративными знаниями, так как большинство из них скрыто в головах сотрудников. Люи План, экс-президент Hewlette-Packard, считает: «Если бы только корпорация Hewlett-Packard осознавала то, что она знает, она была бы в три раза более продуктивной».
Поиск того, что уже известно становится реальной проблемой для организаций, которые хранят большую часть своей информации в изолированных «ad-hoc» системах, при этом теряя возможность единого доступа к ней. Возрастающая популярность различных корпоративных Intranet-систем привела к тому, что большая часть организаций стала размещать свои данные в многочисленных хранилищах, где информация накапливалась как в структурированном, так и в неструктурированном виде. Подобная информация доступна опытным пользователям, которые точно знают, где и каким образом ее нужно искать. Но для непросвещенных пользователей, являющихся ее потребителями, задача поиска необходимой информации становится достаточно трудоемкой, так как они могут даже не подозревать, доступна ли им в действительности эта информация.
В данной работе рассматриваются различные подходы к построению корпоративных порталов знаний – информационных систем, направленных на обеспечение средств эффективного управления знаниями. В начале работы проводится анализ технологий Semantic Web, а так же существующих решений, построенных на их основе. Показывается каким именно образом рассматриваемые технологии помогают решать проблемы эффективного управления знаниями, в частности обеспечения систематизации и персонализации представления знаний.
Заключительная часть работы посвящена апробации выработанного семантического подхода при разработке Системы коллективного использования информационных ресурсов (СКИИР) Департамента исследований и информации Банка России. В этой части проводится анализ информационных потоков, технологий и видов деятельности, поддерживающих аналитическую работу специалистов Департамента исследований и информации. На основе проделанного анализа делается вывод о необходимости в применении семантического подхода для реализации портала ДИИ и строится модель рубрикатора информационных ресурсов на основе технологии Topic Maps. Показывается каким образом построенная модель была успешно применена при проектировании и разработке системы СКИИР.
|