Пс google





Скачать 299.4 Kb.
НазваниеПс google
страница2/3
Дата публикации07.11.2014
Размер299.4 Kb.
ТипДокументы
100-bal.ru > Астрономия > Документы
1   2   3

ПС Яндекс


1990 г в компании CompTek начала создание поисковой технологии Яндекс.

Назначение – поиск по массивам русских текстов, т.е. с учетом морфологии русского языка. Слово «Яндекс» и первые программы с этим названием появились еще в 1993 г, а поисковая машина Яндекс (www.yandex.ru) была открыта 23 сентября 1997 года на выставке SofТool.

Возможности поисковой системы Яндекс

Поиск слова

Система позволяет находить:

  • все формы слова для русского, английского, польского и других языков; в том числе все формы неизвестных Яндексу слов (отсутствующих в базовом словаре языка) при помощи автоматического моделирования их словоизменения;

  • только заданную точную словоформу;

  • только формы, производные от заданной формы.

Расстояние между словами

Если же нужно еще больше расширить область поиска и выполнить поиск страниц, в которых введенные вами слова встречаются в пределах всей страницы, тогда следует поставить между словами искомой фразы символы &&.

Вместо оператора && можно воспользоваться оператором << Данный оператор также расширяет область поиска, и выполняет поиск страниц, в которых введенные вами слова встречаются в пределах всей страницы. Однако при этом слово, которое находится справа от оператора <<, не будет влиять на ранжирование страниц результатов запроса.

Можно точно определить максимальное количество предложений, которые могут отделять одно искомое слово от другого. Для этого между словами запроса нужно поставить структуру вида &&/максимальное_количество_слов.

Пример, по запросу культура &&/2 Россия отобразятся все страницы, в которых слово Россия отделяется от слова культура не более чем двумя предложениями.

Яндекс позволяет искать страницы, в которых введенные слова встречаются в одном предложении. Для этого достаточно поставить между словами искомой фразы символы &.

Пример, по запросу культура & Россия отобразятся все страницы, содержащие в одном предложении и слово культура и слово Россия.

Более того, вы можете точно определить максимальное количество слов, которые могут отделять одно искомое слово от другого. Для этого между словами вашего запроса нужно поставить оператор /максимальное_количество_слов.

Пример, по запросу культура /2 Россия отобразятся все страницы, в которых слово Россия отделяется от слова культура не более чем одним словом.

Усложняя задачу можно прийти к еще одному виду операторов поисковой системы Яндекс: /(минимальное_количество_слов максимальное_количество_слов). С помощью такого оператора выполняется поиск фраз, в которых между словами может находиться не более определенного количество слов и не менее другого такого же определенного количества слов.

Пример, запрос космическая /(2 3) станция найдет страницы, на которых могут присутствовать фразы вида космическая орбитальная станция, космическая российская орбитальная станция, но при этом не будут найдены страницы, на которых находятся фразы вида космическая станция.

Если же вы хотите выполнить поиск по жесткой фразе (то есть, найти страницы, содержащие точную фразу, которая совпадает с введенной вами), тогда следует взять искомую фразу в кавычки. Пример, «красная шапочка».
Порядок слов

Если для запроса важен порядок расположения слов искомой фразы, тогда при его создании следует воспользоваться несколькими дополнительными возможностями поисковой системы Яндекс.

Чтобы найти слова, которые идут в определенном порядке, достаточно поставить между ними знак + (в прямом порядке) или (в обратном порядке).

Пример, при запросе Иван + Тургенев будут найдены все страницы, содержащие в себе фразы вида Иван Тургенев и ни одной страницы, содержащей в себе фразы вида Тургенев Иван.

Особенность Яндекса – возможность объединения операторов изменения расстояния между словами и операторов изменения порядка слов. Для этого достаточно поставить оператор порядка слов после знака / операторов изменения расстояния между словами.

Пример, усложним предыдущий запрос: Иван /+2 Тургенев. С его помощью будут найдены все страницы, в которых между словом Иван и словом Тургенев находится одно слово. Причем, слово Иван всегда должно стоять перед словом Тургенев.

Еще один запрос: Васисуалий /(-1 +2) Лоханкин. Данный запрос отобразит только те страницы, которые содержат в себе одну из фраз следующего вида:

Лоханкин Васисуалий;

Васисуалий Лоханкин;

Васисуалий слово Лоханкин.
Логические операторы

Яндекс способна обрабатывать логические операторы типа ИЛИ и НЕ.

Так, для того, что выполнить поиск ИЛИ слова1 ИЛИ слова2, нужно поставить между искомыми словами знак |.

Пример, по поисковому запросу отпуск Лондон | Париж будут отображены все страницы, в которых встречаются слова отпуск Лондон или отпуск Париж.

Если же нужно найти все страницы, на которых нет определенного слова, тогда следует перед этим словом поставить оператор ~~.

Пример, запрос компьютерный журнал ~~CHIP отобразит все страницы, на которых встречаются слова компьютерный и журнал, но нет слова CHIP.

Кроме того, поисковая система Яндекс поддерживает еще одну разновидность логического оператора НЕ. Вы можете выполнить поиск страниц, в которых определенного слова нет в том же предложении, что и других слов запроса, однако оно может встречаться в других предложениях страницы. Для этого предназначен оператор ~.
Настройка морфологии

По умолчанию поиск всех слов, которые вы указываете, выполняется с учетом морфологии. Если же необходимо выполнить поиск без использования морфологии, тогда следует поставить перед искомым словом символ !

Пример, поиск по фразе !день отобразит все страницы, на которых присутствует слово день. Такие же страницы, на которых встречаются слова дня, дней, дни (а также деть, денешь и т.д., ведь слово день является и одной из форм слова деть) в результаты поиска не попадут.

Одной из проблем поиска с учетом морфологии является то, что формы некоторых слов могут совпадать.

Пример, форма день слова день и форма день слова деть. Чтобы решить эту проблему, достаточно указать поиск по слову в нормальной форме. Для этого достаточно поставить перед словом, расположенным в нормальной форме, оператор !!.

Пример, запрос !!день найдет все формы данного слова (дня, дню, днем и т.д.), и не найдет форм слова деть.
Зависимости между фразами

Можно устанавливать зависимости между целыми фразами либо даже между зависимостями слов (зависимости зависимостей, в общем, это что-то страшное) — взять отдельную фразу в круглые скобки.

Пример запрос:

мумие && (лечение | лечебный | болезни)~~(цена | прайс | рубли | доллар | фирма | магазин).

По данному запросу будут найдены все страницы, на которых присутствует слово мумие, а также одно из слов, символизирующих его лечебные качества. При этом, на страницах не должно быть слов, связанных с покупкой этого предмета.

Изменение правил релевантности

Чтобы изменить вес отдельного слова, нужно поставить после него оператор: вес.

Пример,

Запрос поисковые механизмы:5 говорит о том, что на результирующих страницах более важно слово механизмы, а не слово поисковые.

Яндекс позволяет определить уровень нестрогого поиска (коэффициент «мягкости»).

То есть, можно определить, будут ли в результаты поиска включаться страницы, которые содержат не все из тех слов, которые вы указали в запросе (пассажи).

Для этого предназначены запросы вида (слова через пробел)//число_от_1_до_100.

По умолчанию поиск ведется с коэффициентом мягкости, равным 6.

При коэффициенте мягкости, равном 50, число найденных документов должно быть примерно средним геометрическим чисел найденных документов при поиске всех возможных неполных пассажей.
Команды поиска

Как и Google, помимо обычных запросов Яндекс может обрабатывать и специальные — сформированные при помощи специальных команд.

$title (искомые слова) Искать указанные слова только в заголовке страниц.

Пример, взгляните на такой сложный запрос: Максвелл << $title (биография).

$anchor (искомые слова) Искать указанные слова только в именах страниц.

Пример, запрос $anchor (one style) отобразит только те страницы, в имени которых встречаются слова one и style.

#keywords=(искомые слова) Искать указанные слова только в ключевых словах страниц (то есть, внутри тега страницы).

#abstract=(искомые слова) Искать указанные слова только в описании страниц (то есть, внутри тега страницы).

#image="название" Искать только изображения, имеющие указанное название.

#hint=(искомые слова) Искать только изображения, в подписях к которым встречаются указанные слова.

#url="имя сайта" Выполнить поиск только на данном сайте.

Пример, запрос поисковые системы #url="www.onestyle.com.ua" отобразит все страницы сайта WWW.ONESTYLE.COM.UA, на которых встречается фраза поисковые системы.

host="имя сайта" Выполнить поиск только на данном сайте, а также на всех его зеркалах.

Помимо оператора host можно использовать оператор rhost. Данный оператор аналогичен оператору host во всем, кроме записи имени сайта — имя сайта при его использовании записывается в обратном порядке (то есть, в порядке ru.url.www).

Пример, rhost="ru.yandex.*".

#link="имя сайта" Выполнить поиск ссылок на указанный сайт.

#mime="тип файла" В качестве результатов поиска отображать только файлы с заданным расширением.

Пример, команда Vista #mime="doc"отобразит список всех файлов с расширением DOC, содержащих в себе слово Vista. При поиске страниц с несколькими расширениями правильнее было бы использовать запрос следующего вида: (инструкция && микроволновая печь) << (mime="pdf" | mime="rtf"). То есть, запретить ранжирование страниц результата запроса по расширениям.

Поисковая система Яндекс индексирует содержимое файлов со следующими расширениями: HTML, PDF (Adobe Portable Document Format), DOC (Microsoft Word), PPT (Microsoft PowerPoint), XLS (Microsoft Excel), RTF (Rich Text Format), SWF (Macromedia Flash).

lang="язык" Выполнить поиск только среди страниц, написанных на указанном языке.

Пример, вы можете искать на страницах со следующими языками: ru (русском), uk (украинском), be (белорусском), en (английском), fr (французском), de (немецком).

like="имя страницы" Выполнить поиск на страницах, похожих на указанную страницу.

domain="домен" Выполнить поиск на страницах, которые принадлежат данному домену.

Пример, Vista domain="ru".

date="ГГГГММДД" Выполнить поиск на страницах, дата изменения которых удовлетворяет заданной вами дате. Помимо конкретного дня, года или месяца можно указывать знак *. В этом случае день, год или месяц учитываться не будут.

Вместо знака = в данной команде можно использовать следующие знаки: >, <, >=, <=.

cat=(ID региона или темы) Выполнить поиск только среди страниц, зарегистрированных в Яндекс.Каталоге, тематическая рубрика или регион которых совпадают с указанными вами.

Идентификатор региона можно получить, прибавив к коду региона смещение 11000000. Идентификатор тематической рубрики получается прибавлением к коду темы смещения 9000000.

Пример, зяблик << cat=(11000051).
Настройка поиска

Вместо использования специальных команд поиска, можно воспользоваться специальными формами для настройки и формирования запроса поиска:

страница РАСШИРЕННЫЙ ПОИСК (http://www.yandex.ru/advanced.html)

НАСТРОЙКА РЕЗУЛЬТАТОВ ПОИСКА (http://www.yandex.ru/cgi-bin/customize.pl)
Расширенный поиск

С помощью данной страницы можно определить следующие параметры поиска:

  • область поиска (везде либо только в заголовке страницы);

  • будет ли использоваться механизм проверки морфологии (или будет выполнен поиск слова/фразы только в той форме, которую вы ввели);

  • как будет интерпретироваться расположение искомых слов друг от друга (слова идут подряд; должны встречаться в одном предложении; должны находиться недалеко друг от друга; должны находиться на одной странице);

  • на каких языках должны быть написаны страницы, отображаемые в результатах поиска;

  • какая дата изменения страниц, отображаемых в результатах поиска;

  • определить страницу, на которую должны быть похожи файлы, отображаемые в результатах поиска;

  • определить страну, в которой должны находиться сайты, страницы которых будут отображаться в результатах поиска;

  • определить сайт, страницы которого будут отображаться в результатах поиска;

  • файлы каких типов должны отображаться в качестве результатов поиска;

  • максимальное количество результатов, отображаемых на одной странице (но не больше 50).


Поиск нескольких слов

Поиск нескольких слов может происходить при:

  • задании произвольных «контекстных ограничений» — нужно искать документы, в которых заданные слова находятся на определенном расстоянии друг от друга либо на расстоянии, не большем или не меньшем данного. Расстояние может быть задано в словах или в предложениях. Интервал расстояний может быть отрицательным, точным, асимметричным (например, 5 слов вперед, 3 слова назад). Контекстные ограничения могут быть либо заданы пользователем явно (что крайне редко встречается на практике), либо могут быть автоматически назначены Яндексом на основе синтаксического разбора;

  • гарантированном ранжировании устойчивых словосочетаний (точных цитат). При наличии в базе точной цитаты документы, содержащие ее, будут гарантированно выданы в начале списка;

  • ранжировании, основанном на принципе «поиска неточной цитаты». Точно найденным документом считается документ с полным набором слов в заданных контекстных границах. Он гарантированно ранжируется выше документов с неполным набором таких слов. При отсутствии в базе индекса точного соответствия запросу с учетом заданных контекстных ограничений предпринимаются попытки найти максимально похожее словосочетание с возможным пропуском одного самого незначащего слова, затем, если это не удается, допускается пропуск двух слов или одного, но более значимого и т.д.;

  • автоматическом синтаксическом разборе «естественных» фрагментов поискового запроса с целью переформулирования и смены (смягчения или расширения) неявно заданных контекстных ограничений. Это значит, что если задан запрос из трех и более слов, то он будет проанализирован и при удачном построении синтаксического дерева переформулирован в такой же, но с контекстными ограничениями, назначенными Яндексом на основе синтаксических связей. Иными словами, Яндекс вместо того, чтобы рассматривать слова запроса (не образующего в текстах точной цитаты и не встречающегося в пределах одного предложения) как независимые и искать в документе их где угодно, пытается одни слова искать рядом, а другие «не очень рядом».

Пример.

Для Яндекса запрос «продажа автомобилей Россия» отличается от запроса «продажа автомобили России».

В первом запросе точно найденным документом будет считаться тот, в котором слова «продажа» и «автомобиль» находятся рядом (скажем, в одном предложении), а слово «Россия» — далеко (где угодно в документе).

Во втором запросе точно найденным документом будет считаться только такой, в котором слова «автомобиль» и «Россия» находятся достаточно близко. Яндекс решает так потому, что фраза «автомобили России» синтаксически согласована.

Таким образом, с точки зрения Яндекса первый запрос нацелен на поиск российсских автомобильных дилеров, а второй — на поиск любых продавцов «Лады»;

  • эвристических переформулировках естественных запросов. Запросы, использующие вопросительные слова и ряд других типичных конструкций, переформулируются. Например, запрос <что такое кванзаа> превратится в запрос <кванзаа это> ИЛИ <кванзаа означает> ИЛИ ...;

Все вышеперечисленные особенности позволяют Яндексу с приемлемым качеством выполнять разнообразные запросы на естественном русском языке, даже с учетом «рваного», телеграфного стиля общения пользователей с поисковой системой.

Поиск в социальной сети

Под поиском в социальной сети понимается учет внетекстовых критериев в поиске, ранжировании и индексировании:

  • взвешенный, тематический и иные виды индекса цитирования;

  • поиск по лексике ссылок на документ, в том числе по альтернативной лексике (словам, не употребляющимся в самом документе). Например, по слову «яндех» будет найден www.yandex.ru, хотя на сайте Яндекс слово «яндех» не употребляется. Этот метод применялся в Яндексе еще в 1990-1991 годах для патентных поисковых систем;

  • выявление и удаление из базы точных и неточных дубликатов;

  • выявление и удаление зеркал сайтов;

  • учет в ранжировании выбора пользователей после проведенного поиска;

  • многоязыковая поддержка (возможность автоматически распознавать язык и кодировку индексируемого документа).

Дополнительные поисковые возможности

К таким возможностям относятся следующие:

  • поиск похожего документа;

  • сортировка найденных документов по степени релевантности, а также по дате или по размеру, возможность влиять на порядок сортировки, используя операторы веса и уточнения запроса;

  • сортировка по любому внешнему целочисленному атрибуту (например, цена товара в Яндекс.Маркете и т.п.);

  • подсветка найденных слов в документе (возможность просмотреть найденный документ с выделенными ключевыми словами; пролистать документ к следующему или предыдущему найденному слову. Статистика найденных слов для каждого документа);

  • подсветка контекстов (возможность выделять слова, найденные в заголовках, на странице с результатами поиска; показывать отдельные предложения документа, содержащие найденные слова, на странице с результатами поиска);

  • поиск в любых поименованных частях текста документа (зонах). Например, можно искать в заголовках, текстах ссылок и т.д.;

  • поиск по «скрытым» свойствам документа (атрибутам). Возможность учитывать при поиске как атрибуты целого документа, заданные при индексировании, так и атрибуты отдельных частей документа. Например, можно искать документы с заданными ключевыми словами, в заданном каталоге или содержащие заданную картинку;

поиск в найденных документах (возможность искать документы, удовлетворяющие новому запросу, среди документов, полученных в результате предыдущего запроса).

Настройка результатов поиска

С помощью данной страницы можно настроить формат отображения результатов поиска (количество результатов на странице, будут ли отображаться пиктограммы сайтов и картинки, будет ли поисковая форма отображаться внизу страницы и т.д.), а также определить язык, на котором будет выполняться поиск страниц.

Также с помощью данной страницы можно включить использование семейного фильтра (из результатов поиска будут исключаться все страницы, содержащие порнографию и материалы явно выраженного сексуального характера).
Проекты Яндекса

Помимо поиска в Интернет портал Яндекс поддерживает работу ряда других проектов.

ЯНДЕКС.WIFI. Список бесплатных точек беспроводного доступа, поддерживаемых Яндекс.

РЕФЕРАТЫ (http://referats.yandex.ru/). - занимательный проект, который позволяет самостоятельно создать реферат по одной из предопределенных дисциплин путем нажатия всего нескольких кнопок.

КУБКИ. Турниры по поиску в Интернете, изобретенные Яндексом.

ЯНДЕКС.ДИРЕКТ (http://direct.yandex.ru/). Размещение рекламы в результатах поиска.

ЯНДЕКС.ПОЧТА (http://mail.yandex.ru/).

ЯНДЕКС.ДЕНЬГИ (http://money.yandex.ru/). Одна из лучших на Российской территории платежных систем

НАРОД.РУ (http://narod.yandex.ru/). Данный проект предоставляет бесплатный хостинг, объем дискового пространства, которое можно использовать, неограничен.

МОЙ КРУГ (http://www.moikrug.ru/). Данный проект предназначен для поиска одноклассников, коллег и знакомых.

ЗАКЛАДКИ (http://zakladki.yandex.ru/). Позволяет создавать закладки на любимые страницы Интернет. При этом созданные закладки будут автоматически периодически проверяться на работоспособность. Еще одной особенностью данного проекта является его интеграция с программой Яндекс.Бар, благодаря чему доступ к закладкам будет возможен из данной панели инструментов.

ЯНДЕКС.ЛЕНТА (http://lenta.yandex.ru/). Позволяет объединять RSS-потоки в одну ленту и читать их в виде одной единственной страницы (вместо того, чтобы постоянно заходить на разные сайты).

ФОТКИ (http://fotki.yandex.ru/). Позволяет публиковать свои фотографии, участвовать в конкурсах, а также смотреть, комментировать и выбирать лучшие среди фотографий других пользователей.

НАХОДКИ (http://nahodki.yandex.ru/). Позволяет быстро сохранять поисковые запросы и просмотренные результаты.

ГОРОДА (http://goroda.yandex.ru/). Формирует Интернет-индексы городов (на основе сотрудничества этих городов с команией Яндекс).

НОВОСТИ (http://news.yandex.ru/podpiska/login.pl). Отображает местные новости (ваше местоположение определяется по IP-адресу), а также позволяет подписаться на свежие новости.

МАРКЕТ. Ряд магазинов для онлайн-покупок.

Программы Также поисковая система Яндекс предоставляет ряд созданных ею продуктов, которые непосредственно касаются темы, рассматриваемой нами в книге.

YANDEX.SERVER (http://company.yandex.ru/technology/products/yandex-server.xml) Приложение для поиска по веб-сайту или локальной сети с учетом морфологии русского языка.

ПЕРСОНАЛЬНЫЙ ПОИСК (http://desktop.yandex.ru/). Программа, предназначенная для полнотекстового поиска с учётом морфологии русского языка в файлах локального компьютера (по файлам, письмам и кешам браузеров).

ЯНДЕКС.БАР. Панель инструментов для различных браузеров, с помощью которой можно быстро получить доступ к основным сервисам поисковой системы Яндекс.

ЯНДЕКС.CПАМООБОРОНА (http://so.yandex.ru/). Серверное приложение для фильтрации спама, предназначенное для корпоративных пользователей. Загрузить пробную версию данного приложения можно по адресу http://so.yandex.ru/companies/download.xml#new.
1   2   3

Похожие:

Пс google iconКонкурс профессионального мастерства "Мастер it 2013"
Задание Сервисы Google (32 балла + дополнительно до 10 баллов за использование сервисов Google)
Пс google iconПрограмма по формированию навыков безопасного поведения на дорогах...
Задача: создать образовательный блог, используя сервис, предоставляемый google com (google ru)
Пс google iconТайны мирозданья. Строение воды
Яндекс. ДиректВсе объявленияДобавьте сайт в поиск Google! Помощь при запуске. Получи премию в 1000 рублей! Адрес и телефон services...
Пс google iconПрограмма по формированию навыков безопасного поведения на дорогах...
Повторить и закрепить навык работы с документами Google, электронной почтой Google, образовательным совместным блогом
Пс google iconВопросы для теста
При помощи Google формы Вы быстро и легко можете создать, разместить в блоге и опубликовать опрос, тест или анкету. Количество, содержание...
Пс google iconВыбор в пользу служб Google
Описана схема ее реализации, основанная на возможности интеграции распределенных ресурсов и технологий их совместного использования...
Пс google iconНазвание / ссылка
Доклады будут опубликованы Applied Mechanics and Materials Journal (issn: 1660-9336): scopus, Ei Compendex (cpx), Cambridge Scientific...
Пс google iconНазвание / ссылка
Доклады будут опубликованы Applied Mechanics and Materials Journal (issn: 1660-9336): scopus, Ei Compendex (cpx), Cambridge Scientific...
Пс google iconГруппа: гсб-22 Проверил: Нардюжев В. А
По популярности с Google может сравниться разве что Яндекс. Стоит отметить, что, во-первых, Google в России появился позже Яндекса,...
Пс google iconАнкета для родителей, Тест по теме «…», Заявка на участие в …, и...
При помощи Google формы Вы быстро и легко можете создать, разместить в блоге и опубликовать опрос, тест или анкету. Количество, содержание...
Пс google iconИнструкция : Учитель объявляет детям: "Я прочитаю вам пять незаконченных...
При помощи Google формы Вы быстро и легко можете создать, разместить в блоге и опубликовать опрос, тест или анкету. Количество, содержание...
Пс google iconКонкурсе «Дудл для Google» для школьников по теме «Мое путешествие в космос»
Сош №13 2-7 классов приняли участие во Всероссийском конкурсе «Дудл для Google» для школьников по теме «Мое путешествие в космос»....
Пс google iconПрограмма по формированию навыков безопасного поведения на дорогах...
Внимание: используйте браузеры Google Chrome, Internet Explorer 7, Mozilla FireFox 5 (и версии выше)
Пс google iconПрограмма по формированию навыков безопасного поведения на дорогах...
Для работы с уроком зайдите на сайт https://sites google com/site/distancionnyjurok7/home
Пс google iconПрограмма по формированию навыков безопасного поведения на дорогах...
Внимание: используйте браузеры Google Chrome, Internet Explorer 7, Mozilla FireFox 5 (и версии выше)
Пс google icon1. Электронные инструменты в обучении английскому языку: Blog, Google Reader
...


Школьные материалы


При копировании материала укажите ссылку © 2013
контакты
100-bal.ru
Поиск