Курсовая. На тему «Автоматизированные информационно поисковые системы»





НазваниеКурсовая. На тему «Автоматизированные информационно поисковые системы»
страница1/2
Дата публикации23.02.2015
Размер269 Kb.
ТипКурсовая
100-bal.ru > Информатика > Курсовая
  1   2


Министерство образования Российской Федерации.

Адыгейский Государственный университет

Курсовая.

На тему «Автоматизированные информационно – поисковые системы».


Выполнил

студент группы
Проверил


2004г.

СОДЕРЖАНИЕ
Введение ……………………………………………………………………3

  1. Информационные системы…………………………………….4

Понятие информационных систем………………………………………4

Структура информационных систем……………………………………4

Классификация информационных систем……………………………..6

  1. Информационно поисковые системы…………………………7

Исторические предпосылки развития поисковых систем……………7

Понятие поисковых систем…………………………………………….....9

Особенности поисковых систем…………………………………………10

  • структура сети…………………………………………………....11

  • структура работы поисковых систем……………………….....13

  1. Характеристика поисковых систем……………………………17

  2. проблемы и возможности поисковых систем…………………24

Заключение………………………………………………………………….25

Список литературы………………………………………………………...26


ВВЕДЕНИЕ.

Современный этап развития цивилизации характеризуется переходом наиболее развитой части человечества от индустриального общества к информационному. Одним из наиболее ярких явлений этого процесса является возникновение и развития глобальной информационной компьютерной сети.

В данной курсовой работе рассматриваются теоретические основы информационного поиска, классификация и разновидности информационно поисковых систем. Представлен материал по применяемым в настоящее время информационно – поисковым каталогом полнотекстовыми и гипертекстовым поисковым системам.

При появлении сети Интернет проблема поиска становилась более актуальной. Интернет – всемирная компьютерная сеть, представляющая собой единую информационную среду и позволяющая получить информацию в любое время. Но с другой стороны в Интернете храниться очень много полезной информации, но для поиска её требуется затрачивать много времени. Эта проблема послужила поводом к появлению поисковых машин. В данной курсовой работе будут рассмотрены поисковые машины в Интернете.

ИНФОРМАЦИОННЫЕ СИСТЕМЫ
Понятие информационных систем

Под Информационная системой понимается организованная совокупность программно – технических и других вспомогательных средств, технологических процессов и функционально – определенных групп работников, обеспечивающих сбор, представление и накопление информационных ресурсов в определённой предметной области, поиск и выдачу сведений необходимых для удовлетворения информационных потребностей пользователей. Информационных системы являются основным средством, инструментарием решения задач информационного обеспечения различных видов деятельности и наиболее бурно развивающейся отраслью индустрии информационных технологий.
Структура информационной системы

В составе информационной системы можно выделить три подсистемы:

1.Организационно – технологическая подсистема сбора информации обеспечивает информационную систему и включает совокупность источников информации, организационно – технологической цепочки отбора информации для накопления в системе. Без правильного организованной подсистемы сбора информации невозможна эффективная организация функционирования все информационной системы в целом.

2. Подсистема предоставления и обработки информации составляет ядро информационной системы и является отражением представления разработчиками и абонентами системы структуры и картины предметной области, сведения о которой должна отражать информационная система. Подсистема представления и обработки информации является одним из наиболее сложных компонентов при разработке информационной системы.

3. Нормативно – функциональная подсистема выдачи информации определяет пользователей, или иначе абонентов системы, реализует целевой аспект назначения и выполнения задач информационной системы.

Основой всех поисковых систем составляют базы данных – совокупность данных организованных по предельным правилам, предусматривающим общие принципы описания, хранения и манипулирования данными, независимо от прикладных программ.

Можно выделить следующие элементы функционирования информационных систем:

*Сбор информации – организованный в специальном порядке процесс сбора и отображения информации:

получение информации

оценка относимости информации

порядок отбора и фиксации информации.

*Комплектование – процесс сложения информации из множества частей в единое целое и доведения её до пользователя.

*Поиск и выдача информации – установление специального технологического порядка удовлетворения информационных потребностей абонентов информационной системы в управленческой деятельности и технологических процессах.

*Поддержание целостности и сохранения информации – пересмотр, ревизия и отсеивание утратившей актуальность информации являются неотъемлемой функцией информационных подразделений. Сохранность информации осуществляется с помощью нормативно – инструктивных документов.

Классификация информационных систем

По характеру предоставления логической организации хранимой информации разделяются на фактографические, документальные и геоинформационные.

Фактографические накапливают и хранят данные в виде множества экземпляров одного или нескольких типов структурных элементов. Каждый из таких экземпляров структурных элементов или некоторая их совокупность отражают сведения, по какому – либо факту, событию. Структура каждого типа информационного объекта состоит из конечного набора реквизитов, отражающих основные аспекты и характеристики сведений для объектов данной предметной области.

В документальных единичным элементом информации является нерасчлененный на более мелкие элементы документ и информация при вводе, как правило, не структурируются, или структурируются в ограниченном виде. Для вводимого документа могут устанавливаться некоторые формализованные позиции – дата изготовления, исполнитель, тематика. Некоторые виды документальных информационных систем обеспечивают установление логической взаимосвязи вводимых документов – соподчиненность по смысловому содержанию.

В геоинформационных данные организованы в виде отдельных информационных объектов привязанных к общей электронной топографической основе. Геоинформационные системы применяются для информационного обеспечения в тех предметных областях, структура информационных объектов и процессов в которых имеется географический компонент.

Другим критерием классификации поисковых систем являются функции или решаемые задачи.

Справочные являются наиболее распространенным типом функций информационных систем, и заключается в предоставлении абонентам системы возможностей получения установочных данных на определённые классы объектов.

Поисковые являются наиболее распространённым классом информационных систем. В общем, виде можно рассматривать как некое информационное пространство, задаваемое в терминах информационно – логического описания предметной области.

Расчетные заключается в обработке информации , находящейся в системе , по определённым расчётным алгоритмам для различных целей.

Технологические функции информационных систем заключаются в автоматизации всего технологического цикла или отдельных его компонентов, производственной или организационной структуры.

ИНФОРМАЦИОННЫЕ ПОИСКОВЫЕ СИСТЕМЫ
Исторические предпосылки развития поисковых систем.

Обратимся к истории возникновения сети Internet, которая была создана в связи с возникшей необходимостью совместного использования информационных ресурсов, распределенных между различными компьютерными системами. Большинство первых приложений, включая FTP и электронную почту, были разработаны исключительно для обмена данными между хост-компьютерами Internet.

Другие приложения, такие как Telnet, создавались для того, чтобы пользователь получил возможность доступа не только к информации, но и к рабочим ресурсам удаленной системы. По мере развития Internet (увеличения пользователей и хост-компьютеров) прежние методы обмена данными перестали отвечать возросшим потребностям пользователей. Возникла необходимость разработки новых способов поиска сетевых ресурсов и доступа к ним, которые позволяли бы использовать информацию независимо от ее формата и расположения.

Для удовлетворения таких потребностей сначала были созданы поисковая система Archie, решающая задачу локализации ресурсов на FTP-сервере, и система Gopher, упрощающая доступ к различным сетевым ресурсам. Затем были разработаны сетевые информационные системы WWW и WAIS, предлагающие абсолютно новые методы получения информации. Принципы работы этих систем позволяют легко ориентироваться в огромном количестве информационных ресурсов без необходимости предоставления механизмов работы самой сети Internet. Такой подход позволяет говорить уже не просто о ресурсах взаимосвязанных компьютерных систем, а об особых информационных пространствах сети.

Система Archie представляет собой комплекс программных средств, работающих со специальными базами данных. В этих базах данных содержится постоянно пополняющаяся информация о файлах, к которым можно получить доступ через сервис FTP. Пользуясь услугами системы Archie, можно осуществить поиск файла по шаблону его имени. При этом пользователь получит список файлов с точным указанием места их хранения в сети, а также с информацией о типе, времени создания и размере файлов. Доступ к информационно-поисковой системе Archie может осуществляться различными путями, начиная от запросов по электронной почте и с помощью сервиса Telnet и заканчивая использованием графических Archie-клиентов.

Система Gopher была разработана для упрощения процесса локализации FTP-ресурсов Internet и для более удобного представления сведений о содержании хранящихся на FTP-серверах файлов. Система Gopher дает возможность в удобной форме (в виде меню) представлять пользователям об имеющихся файлах и их содержании. Меню Gopher-серверов могут содержать ссылки на другие Gopher- и FTP-серверы. Таким образом, пользователь получает возможность “путешествовать” по Internet, не обращая внимания на местонахождение интересующих его ресурсов, и получать доступ к этим ресурсам.

Система Veronica используется для поиска информации в Gopher-пространстве по заголовкам пунктов меню. После ввода ключевого слова, система Veronica выясняет, встречается ли оно в меню на каком-либо Gopher-сервере, и в качестве результатов поиска выдает список заголовков пунктов меню, содержащих ключевое слово. Поскольку система Veronica не является автономной поисковой программой, а тесно связана с системой Gopher, она обладает тем же, что и система Gopher, недостатком: далеко не всегда по заголовку можно сказать, что собой представляет тот или иной информационный ресурс. Достоинства системы заключается в том, что нет необходимости узнавать, где расположена найденная информация, достаточно выбрать требуемую запись из списка.
Понятие информационных поисковых систем.

Автоматизированная поисковая система – система, состоящая из персонала и комплекса средств автоматизации его деятельности, реализующая информационную технологию выполнения установленных функций.

Опыт и практика создания систем в различных сферах деятельности позволяет дать более широкое и универсальное определение, которое полнее отражает все аспекты их сущности.

Под информационной системой в дальнейшем понимается – организованная совокупность программно – технических и других вспомогательных средств, технологических процессов и функционально – определённых групп работников, обеспечивающих сбор, представление и накопление информационных ресурсов в определённой предметной области, поиск и выдачу сведений, необходимых для удовлетворения информационных потребностей установленного контингента пользователей – абонентов системы.


Особенности поисковых систем.

В работе поисковый процесс представлен четырьмя стадиями: формулировка (происходит до начала поиска); действие (начинающийся поиск); обзор результатов (результат, который пользователь видит после поиска); и усовершенствование (после обзора результатов и перед возвращением к поиску с иной формулировкой той же потребности). Более удобная нелинейная схема поиска информации состоит из следующих этапов:

  1. Фиксация информационной потребности на естественном языке;

  2. Выбор поисковых сервисов сети и формализация записи информационной потребности на конкретных информационно-поисковых языках (ИПЯ);

  3. Выполнение созданных запросов;

  4. Предварительная обработка полученных списков ссылок на документы;

  5. Обращение по выбранным адресам за искомыми документами;

  6. Предварительный просмотр содержимого найденных документов;

7.Сохранение релевантных документов для последующего изучения;

8. Извлечение из релевантных документов ссылок для расширения запроса;

9. Изучение всего массива сохраненных документов;

10. Если информационная потребность не полностью удовлетворена, то возврат к первому этапу.

Процесс поиска имеет чрезвычайно глубокий дидактический аспект – так, установлено что применение диалоговых информационных систем приводит к формированию у рядовых пользователей такого стиля информационно-поисковой деятельности, который обычно свойственен наиболее выдающимся ученым.

В большинстве случаев информационная потребность возникает после изучения какой-либо новой информации, полученной пользователем. Часто возникает ситуация, когда пользователь уже обладает некоторым массивом документов по искомой тематике. Предлагается использовать эти документы для автоматизированного составления поискового запроса с помощью специализированной системы управления документами (СУД) [6] (система находится в стадии разработки).

Система должна осуществлять индексацию всех документов пользователя. В процессе индексации все слова, содержащиеся в документах, разбиваются по следующим семантическим классам: стоп-слова; наиболее частотные слова бытового (разговорного) языка; общекультурная терминология; общенаучная терминология; известные системе термины предметной области; неизвестные слова. Разбиение осуществляется на основе соответствующих словарей, которые должны быть составной частью системы. К неизвестным словам будут отнесены в первую очередь многие специальные слова предметной области. Туда же попадут новообразованные термины и слова, содержащие ошибки.

На основе индекса осуществляется построение векторного представления документов, после чего СУД производит иерархическую кластеризацию множества документов, в результате чего получается разбиение этого множества на тематические группы. В ходе диалога с пользователем происходит выбор одного или нескольких наиболее релевантных кластеров документов и задание характеристик поискового процесса.

Поисковый запрос следует строить на основе вектора центроида выбранного кластера. Оптимальный размер запроса составляет от 8-12 до 25-30 терминов [7]. Последняя подготовительная операция, осуществляемая СУД заключается в записи запроса на ИПЯ.

Структура сети.

Как известно, наиболее простой способ расширения информационного поиска в сети Интернет применен в метапоисковых системах и заключается в увеличении количества используемых первичных ИПС. Этот механизм должен быть реализован в любой разрабатываемой системе. Задача распределения ресурсов поисковой системы по различным ИПС глобальной сети должна решаться адаптивно, на основании учета доли ссылок признанных релевантными во время предыдущих сеансов поиска.

Второй блок автоматизированной поисковой системы отправляет созданный запрос и осуществляет сортировку и отбор полученных ссылок, после чего обращается по выбранным адресам и получает из сети некоторое множество документов, также содержащих гиперссылки.

В исследовании [8] показано, что распространенное мнение о хаотичности информационного наполнения глобальной сети и об отсутствии какой-либо структуры связей является заблуждением. Выявлено наличие так называемых “сообществ” – хорошо связанных групп сайтов, содержащих материалы близкой тематики. Выделяются “центральные” страницы – содержащие большие списки ссылок и страницы, на которые ведут многие ссылки, – “авторитетные” страницы. Таким образом, целью 8-го этапа поиска является обнаружение таких групп и выявление среди их членов наиболее “авторитетных”. Как показано в [9], алгоритм решения этой задачи достаточно прост.

Обработка результатов поиска.

После получения в результате поиска в сети некоторого множества документов, среди них необходимо выделить наиболее релевантные. Наличие “сообществ” не облегчает эту задачу. Можно выделить следующие несколько классов наиболее частых ситуаций.

  1. Отсутствие в исследуемом сегменте сети искомой информации. Подобная ситуация описана в [10]. В этом случае следует перейти к другому сегменту, т. е. обычно исследовать ресурсы, созданные на других языках.

  2. Найденные “сообщества” содержат информацию не по требуемой тематике, а главным образом по другим, близким к искомой.

  3. Обнаружено слишком большое количество информационных ресурсов.

В последних двух случаях необходимо осуществить автоматический перебор всех найденных документов и определить степень близости их к исходному запросу. Более 20 метрических мер близости, пригодных для сравнения документов в векторном представлении, рассмотрены в работе [11]. Оптимальное решение задачи ранжирования достигается путем применения системы, основанной на агентно-ориентированном подходе.

Во многих случаях поиска в новой области, когда общий уровень пользователя недостаточно высок, желательно осуществлять фильтрацию выдаваемой информации по стилю текста так, чтобы начальное ознакомление с материалом происходило с использованием популярных и научно-популярных текстов.

Для уменьшения объема рассматриваемых материалов следует также осуществить фильтрацию результатов поиска по типу источников. Так очевидно, что документы, расположенные на научных сайтах, на коммерческих, или на серверах СМИ будут существенно различаться по своему характеру.

  1   2

Добавить документ в свой блог или на сайт

Похожие:

Курсовая. На тему «Автоматизированные информационно поисковые системы» iconКонтрольная работа По информатике Тема: «Информационно поисковые языки»
Целью данной работы является исследование эффективности поиска в Интернете сведений на тему «Информационно поисковые языки», в качестве...
Курсовая. На тему «Автоматизированные информационно поисковые системы» iconРеферат на тему: «Информационно-поисковые системы»
Вас информации. Сейчас поисковые системы все больше стараются «видеть» сайт именно глазами рядового посетителя, чтобы результат устроил...
Курсовая. На тему «Автоматизированные информационно поисковые системы» iconУчебно-методический комплекс образовательной профессиональной программы...
Корабельные автоматизированные комплексы и информационно-управляющие системы» по дисциплине «Информационно-управляющие комплексы...
Курсовая. На тему «Автоматизированные информационно поисковые системы» iconКафедра информатики и тсо курсовая работа
Поисковые каталоги. Поисковые указатели (индексы). Сбор информации поисковыми роботами. Индексация ресурсов. Исполнение запроса клиента....
Курсовая. На тему «Автоматизированные информационно поисковые системы» iconКурсовая работа на тему: «Поисковые системы» по дисциплине "организация ЭВМ "
Учебно-методический комплекс «Таможенное право» составлен в соответствии с требованиями Государственного образовательного стандарта...
Курсовая. На тему «Автоматизированные информационно поисковые системы» icon1. Классификационные информационно-поисковые языки
Информационно-поисковые каталоги основаны на классификации сведений по определенной предметной области и исторически были первыми...
Курсовая. На тему «Автоматизированные информационно поисковые системы» iconЭлектронные информационно-справочные и документальные ресурсы Национального...
Ю перспективу, является обеспечение и расширение свободного доступа заинтересованных физических и юридических лиц к научно-справочному...
Курсовая. На тему «Автоматизированные информационно поисковые системы» iconК Положению о порядке получения
Автоматизированные информационно-измерительные системы коммерческого учета электрической энергии (мощности)
Курсовая. На тему «Автоматизированные информационно поисковые системы» iconЛабораторная работа №4 по дисциплине: «Информационно-поисковые системы»
Работа заключается в сравнительном изучении заданных глобальных ипс сети Интернет вербального типа
Курсовая. На тему «Автоматизированные информационно поисковые системы» iconПравительство Российской Федерации Федеральное государственное автономное...
Программа предназначена для преподавателей, ведущих данную дисциплину, и студентов направления 230100. 62 «Информатика и вычислительная...
Курсовая. На тему «Автоматизированные информационно поисковые системы» iconМетодические указания к контрольной работе по дисциплине «информационно-поисковые системы»
Методические указания одобрены на заседании кафедры правовой информатики ноу впо «Омский юридический институт», протокол №3 от 13....
Курсовая. На тему «Автоматизированные информационно поисковые системы» iconМетодические указания к контрольной работе по дисциплине «информационно-поисковые системы»
Методические указания одобрены на заседании кафедры правовой информатики ноу впо «Омский юридический институт», протокол №3 от 13....
Курсовая. На тему «Автоматизированные информационно поисковые системы» iconН. В. Максимов, И. В. Прохоров
Охватывает весь спектр знаний. Дескрипторные информационно-поисковые языки. Дескрипторные информаци­онно-поисковые языки основаны...
Курсовая. На тему «Автоматизированные информационно поисковые системы» iconПрограмма по формированию навыков безопасного поведения на дорогах...
Рабочая программа предназначена для преподавания дисциплины «Информационно-поисковые системы» студентам очной полной формы обучения...
Курсовая. На тему «Автоматизированные информационно поисковые системы» iconКультуры и искусств
Целью данной работы является оценка эффективности поисковых стратегий в информационно-поисковых системах (ипс), в качестве исследуемых...
Курсовая. На тему «Автоматизированные информационно поисковые системы» iconОпубликованных и приравненных к ним научных и учебно-методических работ
Охватывает весь спектр знаний. Дескрипторные информационно-поисковые языки. Дескрипторные информаци­онно-поисковые языки основаны...


Школьные материалы


При копировании материала укажите ссылку © 2013
контакты
100-bal.ru
Поиск