Московский физико-технический институт





НазваниеМосковский физико-технический институт
страница6/11
Дата публикации17.12.2014
Размер0.54 Mb.
ТипЛитература
100-bal.ru > География > Литература
1   2   3   4   5   6   7   8   9   10   11

1.9.Примеры семантических порталов


На текущий момент существует очень небольшое количество технологий построения семантических порталов и, в основном, они имеют применение лишь в какой-либо специфичной предметной области. Из отечественных работ хотелось бы выделить опыт проектирования корпоративного портала группы компаний «ИТЕРА» [2]. В данной работе применяется методология проектирования корпоративных систем на основе положений теорий последовательностей, категорий, вычислений и семантических сетей. Однако, как таковые семантические технологии в ней применяются не в чистом виде, в частности, все модели данной системы описываются на основе XML, а не RDF или XTM.

Другим более интересным примером является Университетская информационная система РОССИЯ (www.cir.ru), разработанная Научно исследовательским вычислительным центром МГУ. Данная система поддерживается как коллективная информационная база электронных ресурсов для исследований и образования в области общественных наук. На базе результатов лингвистического анализа в УИС РОССИЯ реализованы развитые поисковые и сервисные возможности:

  • поиск по нескольким рубрикаторам и Сводному оглавлению;

  • тематический поиск и уточнение запроса по Тезаурусу с использованием тезаурусных связей;

  • интегрированный поиск по нескольким источникам;

  • ранжирование документов при выдаче на запрос пользователя;

  • просмотр аннотаций к полнотекстовым документам;

  • гиперссылки к соответствующим разделам Методологических пояснений и Глоссарию при работе со статистическими данными.

Система поддерживается как интегрированный ресурс на базе технологии автоматизированной лингвистической обработки текстов (АЛОТ). Разработка технологии АЛОТ была первым этапом проекта и заняла около 7 лет, в составе АЛОТ – комплекс конверторов, преобразующих входящие потоки данных и документов в единообразный формат хранения – HTML с автоматическим выделением формальных атрибутов документа и автоматизированная лингвистическая обработка документов (АЛОТ). АЛОТ последовательно выполняет несколько этапов – графематический, морфологический и терминологический анализ.

Терминологический анализ в данной системе реализован на базе Информационно-поискового тезауруса по общественно-политической тематике, специально созданного для автоматического индексирования документов в рамках УИС РОССИЯ. Тезаурус включает порядка 70 000 дескрипторов с синонимами. Результатом терминологического анализа является тематическое представление содержания документа – в виде основных тем документа. Тематическое представление используется для рубрицирования и аннотирования документов. Аннотации представляют собой предложения или фрагменты документа, в которых раскрывается тематика. Строится также т.н. "структурная тематическая аннотация", где содержание текста представлено в виде совокупностей концептуально связанных терминов. Структурная тематическая аннотация позволяет получить наглядное представление тематики и оценить содержание текста с первого взгляда.

Как видно из описания системы, в ней применяются не только технологии построения онтологий (в данном случае тезаурусов), но также делаются успешные попытки реализовать автоматический анализ и семантическую обработку документов – определение их метаданных и аннотирование на основе лингвистического анализа содержимого документов. Автоматическая рубрикация и семантический поиск в последнее время становятся более актуальными ввиду того, что по мере накопления информации ручное семантическое описание требует большей трудоемкости.

1.10.Технологии построения семантических порталов SEAL


В качестве одного из наиболее удачных примеров апробации семантических технологий при построении порталов можно рассмотреть подход SEAL (SEmantic portAL). Основная идея SEAL состоит в построении Intranet приложений, способных предоставить информацию для пользователей и агентов с учетом их семантической структуры [6]. Примером реализации подхода SEAL является Intranet портал института AIFB (University of Karlsruhe). Общая архитектура и окружение этой системы изображены на рисунке 3.

Данные системы хранятся в специализированном хранилище знаний (Knowledge warehouse), в котором реляционная база знаний строится с учетом онтологии. Основной механизм взаимодействия с хранилищем осуществляет система Ontobroker, которая также обеспечивает возможность описывать онтологии, правила и факты компиляторам различных языков. Внешняя часть системы доступна трем типам агентов, которые общаются с системой через Web-сервер и соответствуют трем основным типам взаимодействий.

Программные агенты (software agents) могут обрабатывать информацию через Интернет, для этого модуль RDF Generator предоставляет факты из базы знаний в формате RDF.

Обычные пользователи (general users) и члены сообщества (community users) имеют возможность производить доступ к порталу двумя способами: делая переходы по гиперссылкам, хранящимся в документах и производя поиск по запросу. Структура гиперссылок предоставляется построителем страниц портала, но также может дополняться при помощи модуля навигации (navigation module).

М

Рисунок 3. Архитектура системы AIFB Intranet и ее окружение

одуль навигации использует специализированную машину логического вывода ссылок, которая способна генерировать структуру семантических (связанных по смыслу) ссылок. Кроме того, пользователь может лично настроить интерфейс поиска, используя модуль семантической персонализации (semantic personalization) а также средства ранжирования результатов поиска на основе семантического соответствия (semantic ranking).

Члены сообщества помимо доступа к данным системы могут предоставлять системе новые данные, например, информацию об интересующих их областях знаний, персональные данные, публикации и другие исследовательские работы. Каждому типу поставляемых данных соответствует хотя бы одно понятие онтологии. При запросе соответствующих частей онтологии, модуль шаблонов (template module) автоматически генерирует подходящие HTML-формы для ввода данных. Члены сообщества заполняют эти формы, а модуль шаблонов сохраняет новые данные в хранилище знаний.

Существуют и другие, более известные примеры использования семантических технологий, такие как Web-порталы Yahoo (www.yahoo.com) или Google (www.google.com), но они не настолько показательны, чтобы приводить их в рамках данной работы. К сожалению, области применения технологий Semantic Web остаются достаточно узкими, в основном ограничиваясь специализированными порталами знаний научных сообществ и институтов. В следующей главе будет рассказано о применении семантических технологий при построении промышленного решения – системы СКИИР.
1   2   3   4   5   6   7   8   9   10   11

Похожие:

Московский физико-технический институт iconМосковский энергетический институт (технический университет) институт...
Дисциплина относится к вариативной части профессионального цикла М. 2 основной образовательной программы подготовки магистров «Физико-технические...
Московский физико-технический институт iconМосковский физико-технический институт ( государственный университет) утверждаю
Одномерные решетчатые системы. Теорема об отсутствии фазовых переходов при в системах малой размерности (одномерных и двумерных)...
Московский физико-технический институт iconПрограмма по формированию навыков безопасного поведения на дорогах...
Программы развития государственного образовательного учреждения высшего профессионального образования «Московский физико-технический...
Московский физико-технический институт iconПрограмма по формированию навыков безопасного поведения на дорогах...
Положением о закупке товаров, работ, услуг для нужд федерального государственного автономного образовательного учреждения высшего...
Московский физико-технический институт iconПрограмма по формированию навыков безопасного поведения на дорогах...
Положением о закупке товаров, работ, услуг для нужд федерального государственного автономного образовательного учреждения высшего...
Московский физико-технический институт iconМосковский энергетический институт
Московский государственный технический университет радиотехники, электроники и автоматики (мгту мирэа)
Московский физико-технический институт iconМосковский энергетический институт (технический университет) институт электроэнергетики (иээ)

Московский физико-технический институт iconМосковский энергетический институт (технический университет) институт электротехники (иэт)

Московский физико-технический институт iconМосковский энергетический институт (технический университет) институт...

Московский физико-технический институт iconМосковский энергетический институт (технический университет) институт...

Московский физико-технический институт iconМосковский энергетический институт (технический университет) институт...

Московский физико-технический институт iconМосковский энергетический институт (технический университет) институт электротехники

Московский физико-технический институт iconМосковский энергетический институт (технический университет) институт электротехники (иэт)
Профиль(и) подготовки: Техногенная безопасность в электроэнергетике и электротехнике
Московский физико-технический институт iconМосковский энергетический институт (технический университет) институт электротехники (иэт)
Профиль(и) подготовки: Техногенная безопасность в электроэнергетике и электротехнике
Московский физико-технический институт iconМосковский энергетический институт (технический университет) институт электротехники (иэт)
Профиль(и) подготовки: Техногенная безопасность в электроэнергетике и электротехнике
Московский физико-технический институт iconМосковский энергетический институт (технический университет) институт электротехники (иэт)
Профиль(и) подготовки: Электрооборудование и электрохозяйство предприятий, организаций и учреждений


Школьные материалы


При копировании материала укажите ссылку © 2013
контакты
100-bal.ru
Поиск