Лабораторная работа №





Скачать 475.81 Kb.
НазваниеЛабораторная работа №
страница2/3
Дата публикации01.04.2015
Размер475.81 Kb.
ТипЛабораторная работа
100-bal.ru > Бухгалтерия > Лабораторная работа
1   2   3

2Лабораторная работа №1. Изучение основных возможностей программного продукта Яндекс.Сервер. Установка окружения, установка и настройка приложения.

2.1Цели и задачи работы


Цель работы: получение практических навыков установки и настройки программного продукта Яндекс.Сервер.

Задачи работы:

  1. Установка и настройка Яндекс.Сервер

  2. Добавление источников данных в коллекцию документов

  3. Выполнение поиска по коллекции по заданным ключевым словам

2.2Теоретические сведения


Начнем с определения понятия информационный поиск. Когда вы просматриваете свои лекции, вы уже выполняете информационный поиск, тем не менее, как научная дисциплина информационный поиск может быть определен следующим образом:

Информационный поиск – это процесс поиска в большой коллекции (хранящейся, как правило, в памяти компьютера) некоторого неструктурированного материала (обычно документа), удовлетворяющего информационные потребности.

Термин информационный поиск был введен Кульвином Муерсом в 1950 году. Он считал, что можно создать внешний носитель информации (memex), который может стать расширенной памятью человека.

Информационным поиском в таком понимании занимаются уже отдельные специалисты, например, библиографы, помощники юристов. Но сейчас мир изменился, и поиском люди пользуются уже ежедневно, например, выполняя поиск в интернете. В настоящее время информационный поиск становится основной формой доступа к информации, вытесняя традиционный поиск по ключу.

К информационному поиску относятся также и некоторые другие задачи, которые не попадают под указанное выше базовое определение. Под неструктурированными данными понимаются данные, которые не имеют ясной, семантически очевидной и легко реализуемой на компьютере структуры. В реальности полностью неструктурированных данных не существует, даже обычные текстовые документы имеют структуру, они разделены на разделы, которые оформлены заголовками, текст разбит на абзацы, абзацы на предложения. Все эти структуры очевидны для естественного языка, но не всегда пригодны для автоматизированного поиска.

Определим основные понятия:

  1. Коллекция (collection) – группа документов, по которой выполняется поиск. Также ее называют корпусом (corps) или массивом текстов (body of texts).

  2. Информационная потребность (information need) – это тема, о которой пользователь хочет знать больше. Ее следует отличать от запроса – того, что пользователь вводит в информационную систему, пытаясь удовлетворить свою информационную потребность.

  3. Документ называется релевантным (relevant), если с точки зрения пользователя он содержит ценную информацию, удовлетворяющую его информационную потребность.

  4. Термины (terms) – элементы индексирования, как правило, это обычные слова.

Для того чтобы оценить эффективность информационного поиска используют два основных статистических показателя:

  1. Точность (precise) определяет, какая часть возвращенных результатов является релевантной по отношению к информационной потребности пользователя.

  2. Полнота (recall) показывает, какая доля релевантных документов возвращена системой.

2.3Методика выполнения работы

2.3.1Подготовка окружения


Для установки Яндекс.Сервер необходима серверная версия Windows. В случае, если на Вашем компьютере установлена серверная версия ОС, то данный шаг можно пропустить.

  1. Устанавливаем vmWare Player



  1. Добавляем в список доступных виртуальных машин Window 2003 R2 Server

    1. Запускаем vmWare Player

    2. Выбираем пункт Open a virtual Machine

    3. Указываем путь к файлу с виртуальной машиной Windows 2003 R2 Server



  1. Виртуальная машина появилась в списке, запускаем ее

2.3.2Установка программного продукта Яндекс.Сервер


Для выполнения лабораторных работ первоначально необходимо установить программный продукт Яндекс.Сервер. Первоначальная инсталляция выполняется стандартным образом, как и любого приложения для Windows:

Запускаем установочный файл в соответствии с платформой, на которую производится установка.



Принимаем лицензионное соглашение



Указываем папку для установки. Лучше указывать папку без специальных символов (скобок, пробелов, символов кроме букв и цифр)



Все готово



Также для правильной работы Яндекс.Сервера необходимо установить ActivePerl. Выбираем версию в соответствии с разрядностью операционной системы



Принимаем лицензионное соглашение



Устанавливаем все компоненты



Все необходимые компоненты установлены, производим тестовый запуск при помощи файла yandex-server.exe из папки с установленным приложением. На экране появляется консоль приложения. В консоль будут выводиться системные сообщения, например, сообщения об ошибках.


2.3.3Получение доступа к веб-приложению


По умолчанию, чтобы получить доступ к приложению необходимо открыть браузер и ввести в адресной строке адрес http://localhost:17000/

В браузере будет показана ошибка, что в настройках не определена ни одна коллекция документов


2.3.4Проверка доступа к панели управления


Также проверим доступ к административной панели приложения. Для этого откроем в браузере страницу http://localhost:17000/admin/



По умолчанию, создана единственная коллекция, документы которой находятся в папке /data установленного приложения.

Для проверки запустим индексирование коллекции и поиск по ней. Для этого воспользуемся кнопками возле названия коллекции



После того, как индексирование завершено, можно запустить поиск и снова перейти по адресу http://localhost:17000/

Теперь мы видим здесь уже интерфейс пользователя для поиска


2.3.5Конфигурирование Яндекс.Сервер, параметры конфигурационного файла


Конфигурирование Яндекс.Сервер производится с помощью конфигурационного файла yandex.cfg, который находится в папке с установленным приложением, который представляет собой файл в формате XML.

Рассмотрим структуру конфигурационного файла. Комментарии к параметрам даны непосредственно в конфигурационном файле



# порт, на котором работает Яндекс.Сервер

# Port 17000

# Адрес, на котором работает Яндекс.Сервер

# IPAddress 127.0.0.1

# Имя хоста, на котором работает Яндекс.Сервер

# Host localhost
# путь к файлу, в который будут выводиться сообщения Яндекс.Сервера

ServerLog yandex.log
# настройка авторизованого доступа к административному режиму

# имя пользователя

UserName myname
# пароль пользователя

UserPassword mypassword




# коллекция документов



# autostart - позволяет определить порядок работы индексатора и поиска

# yes - автоматически загружается при старте Яндекс.Сервера

# no - не запускается автоматически, при старте

# must - завершает работу Яндекс.Сервера, если одна из коллекций не стартовала при запуске

# директория, в которой будут размещены вновь созданные индексные файлы

IndexDir workindex

# выдача тестовой информации



# Путь к файлу протокола индексирования.

FileName index.log
# Уровень выдачи тестовой информации.

Level verbose moreinfo info debug moredebug


# Конфигурационный файл может включать несколько секций DataSrc, каждая

# из которых описывает источник данных. Одна коллекция может содержать

# несколько источников данных



# id - уникальное имя источника данных



# ftds определяет, что текущий источник данных является источником

# в качестве хранилища выступает файловая система

# также возможны следующие источники данных:

# webds - индексирование веб-страниц

# ftds - индексирование файлов

# odbcdc - индексирование БД с подключением через ODBC

# mysqldc - индексирование данных в СУБД MySQL



# атрибут inherited определяет, нужно ли проводить индексирование

# подпапок с параметрами родительской папки

# абсолютный путь к папке с данными

Path C:\Program Files\Yandex\Server\data





# список типов файлов для индексирования

# поддерживаются следующие типы файлов:

# text/html .html, .htm, .shtml

# text/plain .txt

# audio/mpeg .mp3

# text/rtf .rtf

# application/pdf .pdf

# application/msword .doc

# application/vnd.ms-excel .xls

# application/vnd.ms-powerpoint .ppt

# application/x-shockwave-flash .swf

application/pdf .pdf







1   2   3

Похожие:

Лабораторная работа № iconБиология 7 класс
Отдел Настоящие Грибы. Лабораторная работа №1 «Строение плесневого гриба мукора». Лабораторная работа №2 «Строение дрожжей»
Лабораторная работа № iconЛабораторная работа «Устройство микроскопа, приёмы пользования им....
Строение растительной клетки. Лабораторная работа «Устройство микроскопа, приёмы пользования им. Клеточное строение растений»
Лабораторная работа № iconПеречень электронных образовательных ресурсов, разработанных учителем...
Увеличительные приборы. Строение светового микроскопа и правила работы с ним. Лабораторная работа «Приготовление препарата клеток...
Лабораторная работа № iconЛабораторная работа Введение в табличный процессор ms excel’2007...
Изменять число рабочих листов можно через опцию Office (в левом верхнем углу экрана), кнопку Параметры Excel, опцию Основные, опцию...
Лабораторная работа № iconЛабораторная работа №1 По теме ««Изучение Internet в целях использовании...
Лабораторная работа предназначена для: обоснования потребности, необходимости и удобства использования среды Internet для поиска...
Лабораторная работа № iconЛабораторная работа №4 по дисциплине: «Информационно-поисковые системы»
Работа заключается в сравнительном изучении заданных глобальных ипс сети Интернет вербального типа
Лабораторная работа № iconОтчет о лабораторной работе методы и средства анализа данных по теме:...
«Лабораторная работа с системой анализа данных Weka. Сравнение методов классификации»
Лабораторная работа № iconОтчет о лабораторной работе методы и средства анализа данных по теме:...
«Лабораторная работа с системой анализа данных Weka. Сравнение методов классификации»
Лабораторная работа № iconРабота №6 Изучение
Тема: лабораторная работа №6 «Изучение треков заряженных частиц по готовым фотографиям»
Лабораторная работа № iconЛабораторная работа. Работа в сети Интернет
Панели инструментов. Всегда должны быть отмечены опции Строка меню и Адресная Строка
Лабораторная работа № iconПрактикум по курсу Информатика (раздел Работа с пакетами прикладных...
Лабораторная работа №6. Обобщение данных. Создание таблицы подстановки. Подведение итогов 28
Лабораторная работа № iconЛабораторная работа №10: «Измерение кпд при подъеме тела по наклонной плоскости»
Кпд механизмов. Лабораторная работа №10: «Измерение кпд при подъеме тела по наклонной плоскости»
Лабораторная работа № iconЛабораторная работа №3
«Технологии обработки, автоматизированного реферирования и аннотирования текстов на естественном языке»
Лабораторная работа № iconСамостоятельная работа обучающегося: 36 часов
Аннотации программ учебных дисциплин по специальности 31. 02. 03 Лабораторная диагностика
Лабораторная работа № iconНазвание модуля
Лабораторная работа "Приготовление раствора с заданной массовой долей растворённого вещества"
Лабораторная работа № iconТема разработки
Лабораторная работа №1 «Сравнение количества теплоты при смешивании воды разной температуры»


Школьные материалы


При копировании материала укажите ссылку © 2013
контакты
100-bal.ru
Поиск