Грициненко А. В. Мбоу «Центр образования с. Лаврентия» поиск информации в сети интернет поиск информации в Интернете является крайне неопределенным понятием: в





Скачать 132.71 Kb.
НазваниеГрициненко А. В. Мбоу «Центр образования с. Лаврентия» поиск информации в сети интернет поиск информации в Интернете является крайне неопределенным понятием: в
Дата публикации14.10.2014
Размер132.71 Kb.
ТипДокументы
100-bal.ru > Информатика > Документы


Грициненко А.В. МБОУ «Центр образования с. Лаврентия»


ПОИСК ИНФОРМАЦИИ В СЕТИ ИНТЕРНЕТ

Поиск информации в Интернете является крайне неопределенным понятием: в силу бесконечного разнообразия материалов Сети, — как по содержанию, как по форме представления, так и по структуре (мы встречаем в сети и линейные, и реляционные, и иерархические, и сетевые структуры данных).

Поэтому цели, методы и формы поиска информации (данных) могут быть самыми разными. Чтобы не занимать ваше внимание общими словами, приведем пару конкретных примеров.

  1. Допустим, вы хотите найти в Интернете все материалы о конкретном человеке по его фамилии. Эту фамилию можно просто набрать как запрос в поле ввода какой-либо поисковой системы, — например, "Рамблер" Результаты поиска целиком будут зависеть и от того, насколько эта фамилия распространена в обществе, и от популярности этой личности (именно популярности, а не масштаба!). Например, если набрать Фердыщенко, можно надеяться на успех: либо вы что-то найдете, либо о таком человеке вообще ничего не слышали в Интернете. Другой пример: пусть искомая личность имеет фамилию Кулик. Если набрать ее в поле поиска, вы получите "тысячи документов с Игорем, Андреем и т.д. Куликами, с Куликовыми, Куликовскими и т.п. Если, на ваше счастье, вашего Кулика зовут, допустим, Никифор (редкое имя), то запрос Никифор&Кулик резко повысит ваши шансы на успех.

Поэтому формулируемый запрос должен определять как можно болеё узкую область поиска, с особой осторожностью следует относиться к омонимам. Например, вы хотите получить сведения о химическом элементе бор. Набирать это слово в поле поиска бесполезно, так как бор — это сверло, хвойный лес, элемент, физик Бор. Если набрать запрос Элемент&бор, область поиска резко сузится.

Рис. 1

Предположим, вас интересует какая-либо тематика (рубрика). В этом случае язык запросов и поиск по ключевым словам вам могут и не понадобиться. Если вы располагаете элементарным опытом, интуицией, то, начав с более или менее общей темы (например, "Наука и образование" на рис. 1 ) и пользуясь гиперссылками, сможете добраться до нужных вам документов (например, сначала "Рефераты", затем "Сборники рефератов, курсовых работ, дипломов" и т.д.)

С известной долей уверенности можно утверждать, что в общем случае поиск в Интернете — это скорее искусство, опыт, кругозор и интуиция клиента, чем использование инструментальных средств обозревателя и поисковых систем.

Следует четко различать разные механизмы поиска в Интернете:

1) поиск документов по ключевым словам средствами универсальных поисковых систем;

2) специализированный поиск (например, людей);

3) поиск на текущей (отображаемой) странице. Последний механизм, в свою очередь, делится на два типа — контекстный поиск фрагментов текста на странице и поиск в структурированных базах данных сайта, представленного этой страницей (товаров, вакансий, услуг, фирм и т.п.).

"Всемирная паутина" в Интернете — это миллионы документов с неструктурированной текстовой информацией (а также с графикой, аудио, видео). Чтобы найти нужную информацию, клиенту Сети зачастую приходится перебирать сотни страниц web (иногда без особого успеха), тратить много сил и нервов (а также денежных средств).

С начала 90-х годов интенсивно развиваются справочные службы Интернета, помогающие пользователям найти нужную информацию, и эти службы можно разделить на две категории: универсальные и специализированные.

В универсальных службах используется обычный принцип поиска в неструктурированных документах — по ключевым словам.

Ключевым словом документа называется отдельное слово или словосочетание, которое каким-то образом отражает содержание данною документа.

Например, для литературы по программированию характерны ключевые слова "Условный переход'', "Макрокоманда", "Обработка прерываний" и т.д.

Универсальная служба поиска (поисковая система) — это комплекс программ и мощных компьютеров, выполняющий следующие функции:

  1. Специальная программа — поисковый poбoт - непрерывно просматривает страницы "Всемирной паутины", выбирает ключевые слова и составляет базу данных индексов. В эту базу включаются ключевые слова и адреса документов, в которых эти слова обнаружены. По ссылкам на другие документы робот "скачивает" и эти страницы, находит в них ссылки, и так далее, пока не обойдет весь интересующий его участок Сети. Когда робот-индексатор поисковой машины приходит на web-сайт (например, на www.rambler.ru/), он прежде всего проверяет, нет ли в корневом каталоге сайта Служебного файла robots.txt (в нашем примере www.rambler.ru/ robots.txt — имя робота записывается строчными буквами!). Если робот обнаруживает этот документ, все дальнейшие действия по индексированию сайта осуществляются в соответствии с указаниями robots.txt.

  2. Web-cepвep принимает от пользователя запрос на поиск, преобразует его и передает специальной программе— поисковой машине.

  3. Поисковая машина просматривает базу данных индексов, составляет список страниц, удовлетворяющих условиям запроса (точнее, список ссылок на эти страницы), и возвращает его web-серверу.

  4. Web-cepвep оформляет результаты выполнения запроса в удобном для пользователя виде и передает их на машину клиента.

Специализированные справочные службы — это тематические каталоги (subject catalogs), в которых собраны более или менее структурированные сведения об адресах серверов по той или иной тематике. В отличие от универсальных баз индексов тематические каталоги составляются специалистами и обеспечивают клиента более строгой, достоверной и систематизированной информацией о документах Сети. Уровень "мусора" в этих каталогах гораздо ниже, чем в составленных автоматически индексах, но и обновляются они значительно медленнее.

Ранее поисковые системы подразделяли на универсальные (с индексными базами данных) и "гибридные" (индексные базы и тематический поиск). Такая классификация в известной мере устарела: ныне большинство поисковых систем может считаться "гибридными" — они ведут поиск и в индексных базах данных, и по тематическим рубрикаторам.

Заметим, что среди российских пользователей наибольшей популярностью в 2013 ныне пользуются системы Yandex, Google, Rambler и Mail.

Практически на всех страницах, которые допускают поиск, имеется кнопка Помощь. Нажмите ее и распечатайте руководство по использованию системы. На рис. 1 показан один из вариантов домашней страницы популярной поисковой системы Yandex.

Как видите, на одной странице предусмотрено несколько механизмов поиска:

  • строгий поиск с помощью языка запросов (желтое поле);

  • тематический поиск (например, "Общество и политика");

  • поиск каких-то занятий или операций ("Почитать", "Скачать") и др.

Примечание. Поисковые системы часто меняют свои домашние страницы, и, набрав тот же адрес www.yandex.ru, вы можете получить другую картинку.



Общие механизмы поиска в Интернете

Итак, при поиске по ключевым словам (в индексных базах данных) вы набираете в поле ввода запрос, представляющий собой логическое выражение, которое формулируется по правилам синтаксиса данной поисковой системы.

Методы поиска нужных данных в безбрежном океане ресурсов Интернета можно разделить на три группы:

  • "интуитивно-эвристические" приемы, основанные на эрудиции, опыте, кругозоре и интуиции пользователя;

  • использование поисковых серверов, которые обеспечивают в известной мере формальные (инструментальные) механизмы поиска по ключевым словам,

  • поиск в тематических (рубрицированных) каталогах.

  1. Эвристика. Роль запроса в частном случае может играть одно-единственное слово (например, Аджика). И это слово может сыграть роль отправной точки, начиная с которой вы не.только выйдете на конкретную информацию, но и получите массу полезных данных об объектах, прямо или косвенно связанных с вашей задачей. Такая тактика обеспечивает весьма эффективный косвенный поиск, если "в лоб" трудно чего-либо добиться. Приведем несколько примеров.

Допустим, в качестве запроса вы набрали какую- либо редкую, но знаменитую фамилию, например, Кторов (А.П. Кторов (1898-1980) великий актер МХАТа). В этом случае вы наверняка получите не только информацию о Кторове, но и много интереснейших документов, имеющих прямое отношение к театру, к исполнительскому и драматическому искусству. Отправляясь от выданного реестра, вы можете, например, отыскать актеров с распространенной фамилией (например, Б.А. Смирнова) или библиографию редких книг о театре.

Наберите слово "Холодильник", и вы попадете во вполне обозримый круг данных, связанных с бытовой техникой: в интернет-магазины, торгующие не только холодильниками, но и другими бытовыми товарами, получите сведения об устройстве агрегатов, их потребительских свойствах, ценах, о фирмах-производителях и т.п.

Наберите "Аджика" (продукт питания), и вы сможете исследовать массу материалов с рецептами, узнать о книгах по кулинарному искусству и даже, возможно, о знаменитостях, увлеченных кулинарией.

Слово "Ависан" (лекарство) почти наверняка приведет вас к искомому препарату; попутно оно обеспечит вам возможность выйти на болезни, их симптомы, рекомендации по лечению. Вероятно, еще более ценным для вас окажется выход на многие очень полезные медицинские сайты, — например, на универсальный аптечный сайт Москвы http:// apteka.mos.ru, где можно исследовать цены и заменители лекарства, подыскать другие медикаменты, о которых вы уже думали, но для поиска которых потребовались бы дополнительные усилия.

Как уже говорилось, при таком подходе эффективность поиска в Сети в значительной мере зависит от опыта и кругозора пользователя. Когда вы ищете материалы по определенной тематике, ни в коем случае не следует полагаться на "интеллект" машины: вы сами должны учитывать особенности лексикона специалистов по данной теме, возможные сочетания терминов и т.п.

  1. Языки запросов. В основе запросов на поиск и выборку информации лежит аппарат алгебры логики. В качестве примера рассмотрим элементы языка запросов поисковой системы Yandex, применяемые для строгого поиска в индексных базах данных. По сути дела, это синтаксис логических выражений, и он мало отличается от синтаксиса других русскоязычных систем (например, Rambler и Aport).

Точное совпадение

Слова идут подряд в точной форме.

Такой порядок слов можно указать с помощью запроса в кавычках.

Например, по запросу ["остров детства"] будут найдены страницы, где есть подряд два слова: вначале «остров», затем «детства» именно в такой форме.

Джокер

При поиске точного выражения в кавычках вы можете разрешить одно или несколько пропущенных слов. Для этого используйте одну или несколько звездочек через пробел.

Например, по запросу ["ползет змея, как * дьявола"] можно найти страницы с недостающим словом цитаты.

Совместная встречаемость

В одном предложении

Ограничить поиск страницами, где слова запроса находятся в пределах предложения, вы можете, соединив слова оператором &через пробел.

Например, запрос [культура & Китая] найдет страницы, где есть сочетания слов «культура Древнего Китая» или «Китай и его культура».

В одном документе

Если вам нужны документы, где присутствуют заданные слова — неважно, на каком расстоянии друг от друга и в каком порядке — соедините их оператором && через пробел.

Например, по запросу [продажа & сканеров && Новосибирск] найдутся страницы, где в одном предложении должны встретиться слова «продажа» и «сканеры», и где угодно на странице должно быть слово «Новосибирск».

Слова также могут быть соединены оператором «неранжирующее И»: запрос << уточняющий запрос. Этот оператор очень похож на &&, с той лишь разницей, что выражение из правой части влияет на возможность документов попасть в результаты поиска, но не влияет на их ранжирование.

Сравните результаты поиска по запросам: [Москва && США] и запросу [Москва << США]. В первом случае ранжирование происходит по обоим словам — «Москва» и «США», а во втором — только по слову «Москва», а «США» просто должно встречаться в тексте документа.

Исключить слова

В одном документе

Яндекс позволяет исключать из поисковой выдачи страницы, где есть определенные слова.

Для этого используются:

 Оператор ~~, слева от которого вы пишете через пробел «что искать», а справа — какие страницы исключать из поиска.

Если вы ищете информацию о немосковских кремлях, можете задать запрос [Кремль ~~ Москва]. Будут найдены все страницы, где есть слово «кремль» и нет слова «Москва».

Если вы хотите исключить несколько слов, напишите их в конце запроса, поставив оператор ~~ перед каждым из них.

Например, в запросе [Кремль ~~ Москва ~~ московский] из запроса будут удалены оба слова — «Москва» и «московский».

 

Оператор- следует поставить без пробела перед словом, которое вы не хотите видеть в ответах. Например, [схемы вязания спицами -купить].

Так можно исключить даже несколько слов. Например, [мумий тролль мультфильм -рок -лагутенко].

В одном предложении

Иногда требуется, чтобы слово встречалось на странице, но не в одном предложении с другим словом запроса. С этой целью используйте оператор ~.

Например, если вы ищете информацию о г-же Кузькиной, то более информативные результаты даст запрос [Кузькина ~ мать], который ищет страницы, включающие такие предложения со словом «Кузькина», в которых одновременно нет слова «мать». Можно так же уточнить запрос оператором расстояния: [Кузькина ~/+1 мать]. По такому запросу найдутся документы, где слово мать может встречаться в том же предложении, но не сразу после слова Кузькина.

Расстояние между словами

Вы можете регулировать расстояние между словами с точностью до слова.

Расстояние между словами «a» и «b» — это разница между номерами слов «b» и «a». Таким образом, расстояние между соседними словами равно 1 (а не 0), а расстояние между соседними словами, стоящими «не в том порядке», равно -1.

Слова на расстоянии в несколько слов

Вы можете указать максимально допустимое расстояние между двумя любыми словами запроса, поставив после первого слова символ /, сразу за которым идет число, означающее расстояние.

Например, запрос [великий /2 хурал] найдет страницы, где есть фразы «хурал великий», или «великий народный хурал», или «великий государственный хурал», но не найдет страницы, где есть «великий государственный народный хурал» (расстояние между словами равно 3).

Слова на расстоянии в несколько предложений

Аналогично записи, указывающей расстояния между словами, вы можете задавать расстояние в предложениях. Для этого перед оператором расстояния / нужно указать оператор &&.

Например, если вы хотите найти статью, где упоминается памятник Пушкину на площади Искусств, можете задать запрос [памятник Пушкину && /3 площадь Искусств].

Порядок слов

Кроме расстояния между словами, вы можете указывать и порядок их следования.

Слова следуют в определенном порядке на заданном расстоянии

Если вы точно знаете не только расстояние, но и порядок слов запроса, в котором они должны идти в тексте искомых страниц, укажите между символом / и числом-расстоянием символ + для прямого порядка слов или - для обратного.

Например, если вы хотите найти отчество Тургенева, то задайте запрос [Иван /+2 Тургенев]. Будут найдены страницы, где между словами «Иван» и «Тургенев» есть ровно одно третье слово.

Слова расположены в заданной окрестности

Вы можете потребовать, чтобы искомые слова шли не только в нужном порядке, но и чтобы между ними было от n (минимум) до m (максимум) слов. Добавив между словами запроса оператор /(n m), вы получите интересующие вас страницы. Оператор расстояния должен отделяться пробелами с обеих сторон.

Например, запрос [Алексей /(-1 +2) Толстой] найдет как страницы с текстом «Толстой Алексей Константинович», так и «Алексей Николаевич Толстой».

Найти любое из слов

Вы можете указать Яндексу найти любое из заданных слов. Это полезно, например, когда для нужного вам термина есть много синонимов. Достаточно поставить между словами символ |, окруженный пробелами, и вы получите страницы, где содержится хотя бы одно из слов запроса.

Например, по запросу [аэроплан | самолет | планер | дирижабль | аэростат | вертолет | пепелац] будут найдены страницы, где встречается хоть одно из этих слов.

Сложные запросы: выручат скобки

Вы можете строить сколь угодно сложные конструкции запроса, подставляя в каждом из операторов вместо отдельного слова целые выражения. Чтобы Яндекс при этом правильно понимал вас, заключайте выражения в круглые скобки.

Например, чтобы найти документы, ни в одном предложении которого слова не встречаются рядом (но при этом могут быть в соседних предложениях), задайте запрос вида: [кривой ~~ (кривой & рог)].

А по запросу [машина -(магазин купить)] будут найдены документы, в которых есть слово «машина», но нет одного из слов «магазин» или «купить», либо же нет обоих слов.

  1. Тематический поиск. На рис. 1 показан тематический рубрикатор системы Yandex, пользуясь которым вы можете многое найти и без помощи алгебры логики. Такие же рубрикаторы (но с иным содержанием) имеют и другие поисковые (и не только поисковые) системы, — например, Rambler.

  2. Живой поиск – это новая функция поисковых систем, которая позволяет просматривать результаты непосредственно при вводе запроса. Чтобы поисковая система работала еще лучше и быстрее, используются все доступные технологии и ресурсы. Это означает, что можно одновременно вводить запрос и просматривать получаемые результаты без потери времени.

Главное отличие Живого поиска от обычного заключается в том, что теперь вы получаете нужную информацию гораздо быстрее, так как необязательно вводить весь запрос и даже нажимать Enter. Кроме того, в Живом поиске вы видите результаты прямо при вводе текста. Таким образом, вы можете тут же изменять запрос, пока не найдете именно то, что вам нужно. Со временем, наверное, даже сложно будет представить себе, что когда-то поиск мог быть другим.

Преимущества

Более быстрый поиск. В Живом поиске вы получаете результаты непосредственно при вводе текста, что позволяет экономить от 2 до 5 секунд при каждом запросе.

Более точные подсказки. Даже если вы не уверены, как сформулировать запрос, система подсказок поможет вам найти нужные слова. При этом лучшая подсказка появится прямо в строке поиска (выделяется серым цветом), и если она подойдет, вам даже не придется вводить весь запрос – результаты уже будут на экране.

Мгновенные результаты. Раньше приходилось сначала указывать ключевое слово, после этого нажимать Enter, а затем ждать результаты. Теперь вы видите результаты еще при вводе запроса и можете сразу менять направление поиска.

  1. Поиск данных на отображаемой странице

До сих пор мы рассматривали поиск неструктурированных документов Web по ключевым словам в индексных базах данных, а также тематический поиск.

1. Вместе с тем обозреватель обеспечивает контекстный поиск на всех отображаемых (текущих) страницах.

Для этого следует выбрать команду [Правка-Найти на этой странице...] и в появившемся окне набрать искомый текстовый фрагмент. Допускается установка флажков Слово целиком и С учетом регистра.

2. Многие сайты и порталы имеют собственные структурированные базы данных, в которых можно вести поиск какого-либо раздела БД (по тематике данного сайта). Например:

  • по алфавиту: вы щелкаете, скажем, на букве "П", и сайт выдает вам список всех лекарств на букву "П";

  • в стандартном поле поиска вы набираете название (например, Ависан) и щелкаете на кнопке Найти (или Искать). Система поиска сайта найдет вам все аптеки, в которых имеется набранный препарат, с указанием цен, адресов, телефонов и способов доставки. Механизмы поиска (а точнее, его детали) могут меняться на разных сайтах (в том числе и на одном и том же сайте), однако разобраться в них очень легко.

При поиске многих товаров, вакансий, услуг, фирм и т.п. (в иерархических структурах) область поиска можно постепенно (или сразу) сужать, указывая в нескольких полях ввода, например, модель потребительского изделия, желаемую цену, город, возраст и многое-многое другое.

Добавить документ в свой блог или на сайт

Похожие:

Грициненко А. В. Мбоу «Центр образования с. Лаврентия» поиск информации в сети интернет поиск информации в Интернете является крайне неопределенным понятием: в iconЭлективный курс по информатике и икт поиск информации в сети интернет 9 класс
Поиск нужной информации в Интернете иногда оказывается сложным. Почему так происходит? Интернет большой организм, живущий по своим...
Грициненко А. В. Мбоу «Центр образования с. Лаврентия» поиск информации в сети интернет поиск информации в Интернете является крайне неопределенным понятием: в iconМетодические рекомендации по изучению курса «поиск информации в сети...
«Поиск информации в сети Интернет для использования в процессе обучения». Учебно-методическое пособие для самостоятельной работы...
Грициненко А. В. Мбоу «Центр образования с. Лаврентия» поиск информации в сети интернет поиск информации в Интернете является крайне неопределенным понятием: в iconМетодическая разработка урока по теме «поиск информации в сети интернет»...
Ли-ю-кун Н. В. Методическая разработка урока по теме «Поиск информации в сети интернет» Улан-Удэ: Изд-во брктиП, 2010г стр. 35
Грициненко А. В. Мбоу «Центр образования с. Лаврентия» поиск информации в сети интернет поиск информации в Интернете является крайне неопределенным понятием: в iconКонспект урока «Глобальная сеть Интернет. Поиск информации в Интернете»
Интернет и Всемирная паутина, урок 5 в разделе «Передача информации в компьютерных сетях»
Грициненко А. В. Мбоу «Центр образования с. Лаврентия» поиск информации в сети интернет поиск информации в Интернете является крайне неопределенным понятием: в iconРеферат тема: Поиск информации в сети Интернет
Краевое государственное бюджетно образовательное учреждение среднего профессионального образования
Грициненко А. В. Мбоу «Центр образования с. Лаврентия» поиск информации в сети интернет поиск информации в Интернете является крайне неопределенным понятием: в icon«Волшебный компьютер» (35 часов)
Свойства информации. Язык представления информации. Кодирование информации. Основные понятия логики. Понятие графов. Устройство персонального...
Грициненко А. В. Мбоу «Центр образования с. Лаврентия» поиск информации в сети интернет поиск информации в Интернете является крайне неопределенным понятием: в iconПоиск информации в Интернете
...
Грициненко А. В. Мбоу «Центр образования с. Лаврентия» поиск информации в сети интернет поиск информации в Интернете является крайне неопределенным понятием: в iconКонспект урока. Класс: 10 Тема: Поиск информации в сети Интернет
Методы: Компьютерный практикум, наглядно-иллюстративный, эвристическая беседа, фронтальный опрос
Грициненко А. В. Мбоу «Центр образования с. Лаврентия» поиск информации в сети интернет поиск информации в Интернете является крайне неопределенным понятием: в iconРеферат по дисциплине «Поиск и обработка экономической информации...
«Поиск и обработка экономической информации средствами Интернет и офисных приложений»
Грициненко А. В. Мбоу «Центр образования с. Лаврентия» поиск информации в сети интернет поиск информации в Интернете является крайне неопределенным понятием: в iconПрограмма по формированию навыков безопасного поведения на дорогах...
Формирование информационной компетентности учащихся: развитие умения учащихся работать с различными источниками информации, умения...
Грициненко А. В. Мбоу «Центр образования с. Лаврентия» поиск информации в сети интернет поиск информации в Интернете является крайне неопределенным понятием: в iconМлекопитающие (звери)
Поиск нужной информации в Интернете иногда оказывается сложным. Почему так происходит? Интернет большой организм, живущий по своим...
Грициненко А. В. Мбоу «Центр образования с. Лаврентия» поиск информации в сети интернет поиск информации в Интернете является крайне неопределенным понятием: в iconИндексные поисковые сервера с русским интерфейсом
Поиск информации можно осуществлять, используя механизм информационных запросов. Он используется как для индексных поисковых машин...
Грициненко А. В. Мбоу «Центр образования с. Лаврентия» поиск информации в сети интернет поиск информации в Интернете является крайне неопределенным понятием: в iconАналитическая обработка разнородной текстовой информации
Технология обработки информации из различных источников, в том числе и из Интернет-сми, обеспечивает автоматизированный ввод (включающий...
Грициненко А. В. Мбоу «Центр образования с. Лаврентия» поиск информации в сети интернет поиск информации в Интернете является крайне неопределенным понятием: в iconКак происходит поиск информации в Интернете?
Для начала, давайте определимся кто для нас находит нужную нам информацию? Главные труженики — это поисковые системы и каталоги....
Грициненко А. В. Мбоу «Центр образования с. Лаврентия» поиск информации в сети интернет поиск информации в Интернете является крайне неопределенным понятием: в iconПояснительная записка Дисциплина «Образовательные ресурсы Интернет»
Данный курс призван использовать автоматизированный поиск нужной информации, применять сетевые технологии для хранения и передачи...
Грициненко А. В. Мбоу «Центр образования с. Лаврентия» поиск информации в сети интернет поиск информации в Интернете является крайне неопределенным понятием: в iconРеферат Поиск информации в сети Internet. Настройка и работа с электронной почтой
Краевое государственное бюджетное образовательное учреждение среднего профессионального образования


Школьные материалы


При копировании материала укажите ссылку © 2013
контакты
100-bal.ru
Поиск