Скачать 1.11 Mb.
|
http://www.studfiles.ru/dir/cat32/subj385/file16459/view156596/page2.html Информационно-поисковые системы. Вопросы к экзамену
Информация (от лат. informatio — осведомление, разъяснение, изложение) — в широком смысле абстрактное понятие, имеющее множество значений, в зависимости от контекста. В узком смысле этого слова — сведения (сообщения, данные) независимо от формы их представления. В настоящее время не существует единого определения термина информация. С точки зрения различных областей знания, данное понятие описывается своим специфическим набором признаков. Информация — совокупность данных, зафиксированных на материальном носителе, сохранённых и распространённых во времени и пространстве. Информация — это осознанные сведения об окружающем мире, которые являются объектом хранения, преобразования, передачи и использования. Основные виды информации по ее форме представления, способам ее кодирования и хранения, что имеет наибольшее значение для информатики, это:
Существуют также виды информации, для которых до сих пор не изобретено способов их кодирования и хранения — это тактильная информация, передаваемая ощущениями, органолептическая, передаваемая запахами и вкусами и др. Свойства информации Как и всякий объект, информация обладает свойствами. Характерной отличительной особенностью информации от других объектов природы и общества, является дуализм: на свойства информации влияют как свойства исходных данных, составляющих ее содержательную часть, так и свойства методов, фиксирующих эту информацию. С точки зрения информатики наиболее важными представляются следующие общие качественные свойства: объективность, достоверность, полнота, точность, актуальность, полезность, ценность, своевременность, понятность, доступность, краткость и пр.
Самая ценная информация – объективная, достоверная, полная, и актуальная. При этом следует учитывать, что и необъективная, недостоверная информация (например, художественная литература), имеет большую значимость для человека. Социальная (общественная) информация обладает еще и дополнительными свойствами:
Докуме́нт (от лат. documentum — образец, свидетельство, доказательство) — материальный объект, содержащий информацию в зафиксированном виде и специально предназначенный для её передачи во времени и пространстве. Информационная потребность - потребность, возникающая, когда цель, стоящая перед пользователем в процессе его профессиональной деятельности либо в его социально-бытовой практике, не может быть достигнута без привлечения дополнительной информации.Релевантность Соответствие текста (документа, фактографической записи) фактической информационной потребности называется пертинентностью, а соответствие одного текста другому — релевантностью. При поиске различают смысловую и формальную релевантность. Документ, центральный предмет или тема которого в целом соответствует смысловому содержанию информационного запроса, называется релевантным, а свойство смысловой близости между двумя и более текстами (в данном случае — между документом и информационным запросом) — релевантностью. Релевантность — это фундаментальное понятие теории информационного поиска. Говорят о двух видах релевантности: смысловой и формальной. Соответствие документа содержанию информационного запроса называют смысловой релевантностью, а соответствие поискового образа этого документа формализованному поисковому предписанию, выражающему данный информационный запрос, — формальной релевантностью. Также формальную релевантность называют релевантностью документа, а смысловую релевантность — релевантностью информации (имеется в виду «информации, содержащейся в документе»).
Информационно-поисковая система (ИПС) — это упорядоченная совокупность документов (массивов документов) и информационных технологий, предназначенных для хранения и поиска информации — текстов (документов) или данных (фактов). Информационно-поиско-выми системами являются любые определенным образом организованные хранилища информации. Причем информационно-поисковые системы могут быть и неавтоматизированными. Главное — это целевая функция: хранение и поиск информации. В зависимости от объекта хранения и типа запроса различают два вида информационного поиска: документальный и фактографический — и, соответственно, два типа ИПС — документальные и фактографические. Последние также называют информационно-справочными ИПС. Документальными называются ИПС, в которых реализуется поиск по тематическим запросам в массиве документов или текстов с последующим предоставлением пользователю подмножества этих документов или их копий. Понятие документа может меняться от системы к системе. В общем случае это некий информационный объект, зафиксированный (обычно посредством некоторой знаковой системы) на каком-то материальном носителе (бумага, фото- и кинопленка, магнитная память и т.п.) и предназначенный для передачи в пространстве и времени в системе социальных коммуникаций. Фактографические ИПС реализуют хранение, поиск и выдачу непосредственно фактических данных (научных, технических, экономических характеристик и свойств объектов, процессов, явлений, адресов, наименований, количественных данных и т.п.). Главное, сущностное, различие между документальным и фактографическим поиском заключается в подходе к семантике документов. В документальных системах описывается смысл документов в целом с точки зрения их тематического, предметного содержания. В этом случае важно выявить и назвать (перечислить) основные темы и объекты, которым посвящен документ. В фактографических системах описываются объекты, фиксируются их признаки и значения этих признаков. Отсюда различия в языках описания и способах хранения описаний в системе. Соответственно, для каждого вида поиска существуют свои поисковые средства. Фактографические системы предполагают накопление и поиск в массиве документов со строго регламентированной структурой. Такая структура является или результатом предварительной интеллектуальной обработки документов при вводе информации в систему, или наличием таких документов в готовом виде в конкретных сферах человеческой деятельности, например, учетные формы, бланки, справочники, расписания и т.п. Существуют фактографические ИПС, которые обеспечивают накопление информации и поиск только по одному типу объектов и только по одному типу запросов. Существуют и более развитые фактографические системы, обеспечивающие хранение и поиск данных, разнообразных по содержанию и структуре, но это разнообразие всегда конечно. В то же время между документальными и фактографическими системами нет непреодолимой разницы. Нередко реальные ИПС представляют собой пример смешанных систем, в которых фактографическая информация используется как дополнительное средство документального поиска, и наоборот. В документальных системах тексты (документы) также могут быть структурированы, разбиты на фрагменты или поля, и обработка и выдача документальной информации может вестись на уровне отдельных полей. Выделяют еще и третий тип систем, которые называют информационно-логическими. Это системы, отвечающие на запросы, на которые в информационной базе в явном виде ответа нет. Получить ответ помогает экстралингвистическая база знаний и информация, порождаемая алгоритмически из уже имеющейся (документальной или фактографической). Эта новая информация или выдается как ответ на запрос, или дополнительно используется для поиска. Информационно-поисковая система документального типа представляет собой упорядоченную совокупность документов, а также совокупность средств и методов, предназначенных для хранения, поиска и выдачи по запросам документальной информации. Документальная ИПС выдает документы, соответствующие запросу по теме, по предмету. Документ, центральный предмет или тема которого в целом соответствует смысловому содержанию информационного запроса, называется релевантным, а свойство смысловой близости между двумя и более текстами (в данном случае — между документом и информационным запросом) — релевантностью. Релевантность — это фундаментальное понятие теории информационного поиска. Говорят о двух видах релевантности: смысловой и формальной. Соответствие документа содержанию информационного запроса называют смысловой релевантностью, а соответствие поискового образа этого документа формализованному поисковому предписанию, выражающему данный информационный запрос, — формальной релевантностью. Также формальную релевантность называют релевантностью документа, а смысловую релевантность — релевантностью информации (имеется в виду «информации, содержащейся в документе»). Составные части ИПС называют подсистемами. Разделение на подсистемы необходимо и полезно как в целях разработки, так и для описания технологии функционирования систем. Оно может иметь разную основу. Обычно рассматривают два типа разбиения ИПС на подсистемы: по функциональному принципу (функциональные подсистемы) и по типу средств (обеспечивающие подсистемы). Различные средства, реализующие функции ИПС, получили название обеспечивающих подсистем, или «обеспечений». Выделяют следующие подсистемы: лингвистическое обеспечение, информационное обеспечение, техническое обеспечение, программное обеспечение Понятие системы охватывает комплекс взаимосвязанных элементов, действующих как единое целое. Система включает в себя следующие компоненты: Структура — это множество элементов системы и взаимосвязи между ними. Входы и выходы — это материальные потоки или потоки сообщений, поступающие в систему или выводимые ею. Поступающую инф-цию мы будем рассматривать как набор символов {x(i)}, значение которого образует вектор X. Данные сообщения проходят обработку в системе и находятся в прямой зависимости от времени. Аналогично множество выходных — {y(i, t)} образует вектор Y. Цель и ограничения. Порядок функционирования системы описывается рядом переменных: U1, U2…, Un. Часть этих переменных должна всегда поддерживаться в экстремальном положении — max U1 и т. п. U1 = f (X, t, Y, …), тогда U1 наз-ся целевой функцией системы. Данная функция определяет соответствие целей системы результатам ее функционирования. Закон проведения системы. Это функция f(х), связывающая изменение входа и выхода системы. Среди известных свойств системы можно выделить следующие: относительность, делимость и целостность. ИС представляет собой систему, функционирование которой во времени заключается в сборе, хранении, обработке, распределении инф-и о деятельности какого-либо экономического объекта реального мира
Информационно-поисковая система - система, выполняющая функции: |
Константин А. Рыбаков Известно, что метаданные несут в себе справочную и управляющую информацию, которая используется разными агентами (клиентскими приложениями, поисковыми роботами) в различных целях. В данной статье будут рассмотрены мета тэги, включение которых в документ, как правило, преследует следующие основные цели: управление процессом индексации документа (или всего сайта в целом) поисковыми роботами, описание содержимого данного документа (опять же для поисковых роботов) и управление некоторыми функциями броузеров. Все мета тэги описывать будет лишним, так как многие из них являются довольно абстрактными, то есть не несут никакой полезной информации с точки зрения агентов и просто ими игнорируются. Мета тэги делятся две на группы: эквиваленты HTTP-заголовка и информационно-управляющую часть, не входящую в заголовок HTTP. Такое разделение связано, в основном, с синтаксисом ( и соответственно) и стандартом. Если же говорить о самих метаданных, то такое деление будет в какой-то степени условным, то есть речь идет не о том, что тэги NAME могут выступать в роли HTTP-заголовков, просто заголовок HTTP также является носителем справочно-управляющей информации. Вообще, эквиваленты HTTP имеют более низкий приоритет перед "истинным" заголовком, который генерируется WEB-сервером. Следует также отметить общий формат декларирования мета-тэгов в HTML-документе, как это показано ниже: эквиваленты //--> другие теги группы HTTP-EQUIV //--> группа NAME //--> ... |
Вопросы к экзамену Понятие информации. Виды информации. Свойства Охватывает комплекс взаимосвязанных элементов, действующих как единое целое. Система включает в себя следующие компоненты | Информационно-поисковые системы. Вопросы к экзамену Вопрос Понятие... С точки зрения различных областей знания, данное понятие описывается своим специфическим набором признаков. Информация совокупность... | ||
Тема урока Количество часов Понятие алгоритма, свойства алгоритмов, виды алгоритмов. Представление о программе. Устройства ввода информации, устройства вывода... | К государственной (итоговой) аттестации по информатике и икт в устной... Понятие информации. Виды информации. Роль информации в живой природе и в жизни людей. Язык как способ представления информации: естественные... | ||
1. Понятие информации. Виды информации. Роль информации в живой природе... Слово «информация» происходит от латинского слова informatio, что в переводе означает сведение, разъяснение, ознакомление | Материал для подготовки (ответы на билеты) к государственной (итоговой)... Понятие информации. Виды информации. Роль информации в живой природе и в жизни людей. Язык как способ представления информации: естественные... | ||
«Волшебный компьютер» (35 часов) Свойства информации. Язык представления информации. Кодирование информации. Основные понятия логики. Понятие графов. Устройство персонального... | Понятие информации. Виды информации. Роль информации и живой природе... Построение алгоритма (основные алгоритмические структуры) и его реализация и среде учебного исполнителя. Демонстрация полученного... | ||
Программа по формированию навыков безопасного поведения на дорогах... Тема урока: Виды и свойства информации. Кодирование информации. Игра «Информация и мы» | «защита информации от несанкционированного доступа» Фз о защите информации, который рассматривает проблемы защиты информации и задачи защиты информации, а также решает некоторые уникальные... | ||
Тема № Сообщения, данные, сигнал, атрибутивные свойства информации,... Практическое руководство по администрированию базы данных пользователей системы дистанционного обучения нп «телешкола» 1 | Урок на тему: Кодирование звуковой информации Учитель: Здравствуйте, мы с вами уже изучили представление текстовой, числовой и графической информации в компьютере. А какие еще... | ||
Календарно-тематическое планирование курса информатики для 10 класс Понятие информации. Представление информации, языки, кодирование. Представление информации, языки, кодирование. Измерение информации.... | Реферат по теоретическим основам информатики На тему: Проблема информации в современной науке Хотя автор в ряде других работ исследовал понятие информации, причем предполагалось, что может быть создана единая концепция информации.... | ||
Урок по теме «Носители информации» Дать понятие «носитель информации»; рассмотреть различные носители информации (древние и современные) | Программа по формированию навыков безопасного поведения на дорогах... Цель: сформировать понятие об информации и ее свойствах; выработать умения различать виды информации; научить выделять конкретные... |