1. Основы информационной культуры





Название1. Основы информационной культуры
страница6/12
Дата публикации29.11.2014
Размер1.47 Mb.
ТипДокументы
100-bal.ru > Информатика > Документы
1   2   3   4   5   6   7   8   9   ...   12

Рис. 3.1. Блок-схема информационно-поисковой системы

Функционирование простейшей документальной информационно-поисковой системы можно проследить по ее блок-схеме на рис. 3.1. В системе имеется два входа (для документов и запросов) и один выход (для выдачи документов по запросам). На входах имеются преобразователи для индексирования документов и запросов. Поисковые образы документов вместе с адресами их хранения (номерами) направляются в активное запоминающее устройство (ЗУакт), а сами документы - в пассивное (ЗУпас). Индексы каждого запроса сравниваются с индексами всех документов в решающем устройстве (РУ), которое в случае их соответствия (полного или предусмотренного критерием выдачи) дает в хранилище (ЗУпас) команду на выдачу документа. Это хранилище составляет как бы второй контур системы (сами документы), которого нет у библиографических (одноконтурных) систем.

Даже названия элементов на блок-схеме говорят о компьютерной реализации информационно-поисковой системы. Однако блок-схема верно обрисовывает работу любой системы, включая и наиболее традиционные. Это легко видеть на примере библиотеки. Преобразователи на входах соответствуют отделам обработки и справочно-библиографическому, ЗУакт - каталогам, ЗУпас - фондам. Нет в библиотеке только РУ - оно моделируется интеллектом читателя, который (хотя часто он и не осознает этого) вырабатывает собственный критерий выдачи и собственную стратегию поиска.

Не случайно именно эта интеллектуальная часть функционирования информационно-поисковой системы представила наибольшие трудности для автоматизации, именно она больше всего сдерживала развитие этих систем. Камнем преткновения явились, прежде всего, традиционные информационно-поисковые языки, ограничивающие возможности содержательного поиска информации. Расхожее мнение о том, что эти языки трудно поддаются автоматизации, неверно. Но они рассчитаны на ручную реализацию, и поэтому использование их в компьютерах удорожает поиск, ограничивает число пользователей и не дает никаких выигрышей, т. е. не снимает ограничений, присущих этим языкам.

А ограничения эти стали особенно ощутимыми на нынешнем этапе научно-технической революции. Прежде всего, традиционная технология поиска рассчитана на стабильный, медленно меняющийся состав запросов. В схемах классификации и перечнях предметных рубрик уже заранее как бы скоординированы все понятия, по которым можно извлекать информацию из документов и затем производить по ним поиск (такие языки поэтому и получили название предкоординатных). Это приводит к тому, что при возникновении новой проблемы или направления исследований, по которым имеется полученная прежде информация, система не обеспечивает ее поиска. Ведь эта тематика раньше не была сформулирована и не нашла места в схемах классификации и списках предметных рубрик, а значит, и индексирование по ней не производилось.

Другими словами, традиционная технология поиска не позволяет искать информацию по любому, заранее не предвиденному сочетанию признаков. При этом субъективизм индексатора при извлечении основного содержания документа увеличивает информационный шум и потери, предопределенные характером традиционных поисковых языков. Нельзя не отметить также, что основанные на них системы ручного поиска, даже фактографические, не предназначены для манипулирования полученными из них данными. Они не имеют логического аппарата для содержательной переработки этих данных. Подобная задача всегда решалась самими потребителями без помощи информационных систем.

  1. Координатное индексирование

Новая технология пришла в информационный поиск в виде метода координатного индексирования, разработанного в США в 50-е гг. прошлого века математическим логиком М. Таубе и работником службы химической информации К. Муэрсом. Этот метод основан на предположении, что основное смысловое содержание любого документа и информационного запроса можно выразить при помощи набора терминов, по большей части содержащихся в самом индексируемом документе. Эти термины получили название ключевых слов. Если, к примеру, нужно индексировать документ, в котором говорится о защите от коррозии лопаток газовых турбин, то совокупность терминов "турбина", "газ", "лопатки", "коррозия", "защита" и будет служить поисковым образом документа. Эти ключевые слова образуют для данного документа как бы координатную сетку, по которой в дальнейшем ведется информационный поиск по соответствующему запросу.

Преимущества данного метода очевидны. Прежде всего, информационные работники и потребители информации освобождаются от жестких рамок классификационных схем и перечней предметных рубрик. Индексирование новых документов ведется без оглядки на отраженные в них потенциальные и часто уже устаревшие запросы специалистов. С другой стороны, индексирование освобождается от субъективизма - ключевые слова выбираются формально. Эту работу, в принципе, можно поручить автомату. Во многих современных информационно-поисковых системах оператор вводит в машину библиографические данные документа, его реферат (аннотацию, резюме), а иногда и наиболее информативные части текста (например, первый и последний абзацы статьи, которые содержат наибольшее число терминов, относящихся к ее содержанию). Эти элементы текста можно просто отсканировать. При помощи "запретительного" списка служебных и общезначимых слов, введенных в компьютер, осуществляется автоматический отбор ключевых слов, которые программно приводятся к нормальному виду (единственное число имени-тельного падежа существительных и прилагательных, инфинитив глаголов). Это существенный шаг к автоматизации ввода информации в информационно-поисковую систему.

При поиске необходимой информации специалист может формулировать свой запрос в виде цепочки терминов, на пересечении которых и окажется большинство документов, содержащих необходимую информацию. При этом потребитель может произвольно менять стратегию поиска в зависимости от оценки его промежуточных результатов. Если документов по запросу мало или нет в системе, можно снять из запроса какие-либо ключевые слова (в приведенном выше примере "газ" и "защита"). Тогда система выдаст документы более широкого содержания о коррозии лопаток турбин, в которых все же может содержаться нужная информация. В случае если документов по запросу слишком много, можно добавить ключевые слова, ограничивающие поиск, например, определенным классом турбин или же конкретными методами защиты их лопаток от коррозии. В этом уже заключен важный элемент возможности диалога с системой при помощи слов естественного языка.

Основные достоинства этого принципиально нового подхода к раскрытию содержания документов и поиску информации заключаются в том, что он позволяет находить информацию по любому, заранее не предвиденному сочетанию признаков. Кроме того, при появлении совершенно новых направлений исследований можно вести поиск во всем массиве документов, ранее индексированных по этому методу. Традиционные методы таких возможностей не предоставляли.

Было бы несправедливо умолчать о том, что достоинства нового метода приходится оплачивать преодолением дополнительных трудностей. Прежде всего, поиск с использованием естественного языка ограничивает его рамками знакомых пользователю языков. Чтобы расширить этот круг, приходится прибегать к словарям. Затем, каждый естественный язык отличается богатством своего словарного состава - слова, одинаковые по написанию, могут иметь разный смысл (многозначность, омонимия), а одно и то же понятие может выражаться разными терминами (синонимия). Запросив информацию о косах, вы получите сведения не только о сельскохозяйственных орудиях, но и о географических объектах, а может быть, и о прическах. Желая получить документы о транзисторах, следует помнить, что они могут также называться полупроводниками.

Термины находятся в сложных взаимоотношениях между собой, выражают более узкие или более широкие понятия, могут быть связанными по сходству, по контрасту или по другим ассоциациям. Чтобы иметь возможность учитывать это при поиске, приходится составлять на каждом языке специальные понятийные справочники (тезаурусы). В них для каждого понятия (класса условной эквивалентности) выбирается один термин - дескриптор, а для остальных слов указывается их связь с дескриптором. Тезаурусы иногда называют дескрипторными словарями, а сам поиск с их использованием - дескрипторным. Кроме словарей, для поиска по ключевым словам и дескрипторам часто создают специальную грамматику. Необходимость в ней вызывается возникновением ложной координации терминов, ошибочным их сочетанием. В ответ на запрос



можно получить не только необходимую информацию о покрытии медных труб свинцом, но и о покрытии свинцовых труб медью.

Курьеза ради следует упомянуть, что метод координатного индексирования для поиска информации, явившийся принципиальным шагом к новой информационной технологии, на самом деле новшеством не был. В 1915 г. он был реализован на перфокартах американским орнитологом Т. Т ейлором при составлении определителя птиц, а у Б. Виккери возникло предположение, что шумерские врачи еще в III тысячелетии до н. э. пользовались диагностическими устройствами, работавшими по этому принципу. На глиняных клинописных плитках записывались симптомы болезней, а под каждым из них - названия болезней, при которых эти симптомы встречаются. Совокупность симптомов составляла координатную сетку, а совпадающие для всех симптомов названия болезней - наиболее вероятные недуги больного.

Из этого понятно, что информационно-поисковые системы, основанные на принципе координатного индексирования, могут быть реализованы простейшими средствами ручного обращения. Система "унитермкарт" самого М. Таубе представляла собой особым образом организованную картотеку, позволявшую легко сличать номера документов, чтобы выявить совпадающие номера для заданных терминов ("унитермов"). Первые информационно-поисковые системы такого типа часто создавались на просветных перфокартах. Однако подлинный размах создание координатных, по большей части дескрипторных систем получило, когда они стали использовать компьютеры второго поколения. В 60-е -70-е годы на базе крупнейших в мире реферативных служб были созданы мощные автоматизированные информационные системы, которые предназначались для ускорения выпуска информационных изданий и расширения спектра информационных услуг, а затем стали основными генераторами документальных баз данных на магнитных лентах.

  1. Цитирование, библиографическое сочетание, социтирование

Принцип цитирования был использован Институтом научной информации США, основанным в 1958 г. Ю. Гарфилдом, для создания принципиально нового вида информационного обслуживания. Английское слово citation означает упоминание, ссылку и не соответствует русскому слову цитирование, означающему дословное повторение "чужого" текста. Однако в данном случае в качестве термина привилась прямая калька с английского языка, поскольку речь идет о библиографических ссылках (для цитирования в русском значении употребляется английское слово quotation).

При поиске информации Ю. Гарфилд взял в качестве индексов библиографические ссылки в документах. В выпускаемых им указателях цитированной литературы, называемых также "индексами цитирования", эти ссылки располагаются по алфавиту фамилий авторов цитированных работ с указанием сведений о документах, в которых они упоминаются. Произведения, использованные при написании статьи, составляют как бы координатную сетку для ее поиска. Если статья написана по совсем новой проблеме, не нашедшей рубрики в классификации наук, с еще не устоявшейся и малоизвестной терминологией, найти ее в потоке мировой литературы другими методами очень трудно. Указатель цитированной литературы можно представить себе как многоуровневую систему библиографических описаний документов, находящихся в обратной связи друг с другом.

Указатели цитированной литературы позволяют искать информацию по совершенно новым межотраслевым или комплексным проблемам под фамилиями пионеров и наиболее известных специалистов каждой из таких проблем. Например, для поиска литературы по цитированию достаточно знать фамилию Ю. Гарфилда, так как почти в каждой работе по этой проблеме есть упоминание о нем и его статьях. Фамилии авторов найденных работ могут, в свою очередь, служить входами в указатель, и за 1-5 таких итераций (последовательных поисков) все сведения об отраженной в указателе литературе по проблеме оказываются найденными.

Индексы цитирования предоставляют уникальную возможность проследить за всеми случаями применения какой-либо идеи или метода, за их критикой и обсуждением, оценить информационный вклад того или иного ученого или научной школы, степень и динамику популярности их работ. Известны случаи, когда по этим указателям предсказывали нобелевских лауреатов. Институт научной информации США выпускает указатели цитированной литературы по точным, естественным и прикладным наукам (с 1964 г.), по общественным наукам (с 1969 г.), по искусству и гуманитарным наукам (с 1976 г.), для чего просматривается около 10 тыс. научных журналов и ежегодно несколько тысяч названий книг. Указатели распространяется не только в обычном (бумажном), но и в машиночитаемом виде (на магнитной ленте, дискетах, оптических дисках). Нужно ли говорить о том, что осуществление принципа, положенного в основу этих изданий, стало возможным лишь благодаря компьютерам. Ведь речь идет о ежегодном библиографировании более 10 млн ссылок.

В двух статьях и , например (см. рис. 3.2) имеются библиографические ссылки, которые устанавливают прямую библиографическую связь между ними (цитирующими документами) и статьями и , которые в них упоминаются (цитируемыми документами). В указателе цитированной литературы эти ссылки, по алфавиту которых упорядочивается его массив, обозначают цитируемые документы, а под ними располагаются описания цитирующих документов.

Понимание потенциальных возможностей комплексирования документов по признаку общих ссылок и стремление максимально использовать накопленный массив в машиночитаемой форме повели к поискам новых путей применения метода цитирования. Можно считать связанными по смыслу документы, авторы которых ссылаются на одни и те же работы, а числом совпадающих ссылок - измерять степень такой связанности. Этот метод, который называется библиографическим сочетанием документов, долгое время не имел широкого практического применения, но затем был использован для создания ретроспективной поисковой системы на компакт-дисках.




Рис. 3.2. Схема цитирования, социтирования и библиографического сочетания документов

Можно также считать связанными по смыслу и тематике работы, на которые совместно ссылаются авторы нескольких документов. Этот метод, чаще всего называемый социтированием, имеет другую коммуникационную основу. В каждой исследовательской области имеется некоторый набор важных работ, отражающих познавательную основу этой области. Данные работы цитируются многими исследователями и поэтому принадлежат к числу высоко цитируемых. Больше того, они часто цитируются вместе, образуя таким образом социтирование. Другими словами, социтированием принято называть одновременное упоминание любых двух или большего числа публикаций в какой-либо последующей публикации.

Для лучшего представления разницы в этих методах приведена схема (рис. 3.2), на которой и являются цитирующими документами текущего года, а и - цитируемыми документами более ранних годов. Сплошными стрелками показаны связи по цитированию, т. е. цитирует и , а цитирует и . Тогда между цитирующими работами и образуется библиографическое сочетание, а между цитируемыми работами и - социтирование (обозначено пунктиром). Для простоты и наглядности степень связанности на схеме минимальная, хотя на практике она значительно больше (т. е. для признания библиографического сочетания между двумя работами или кластера социтирования в каждом отдельном случае устанавливается определенный минимальный порог, который тем выше, чем интенсивнее цитирование).

Между характером этих методов установления связи и областью их применения имеется существенная разница. Библиографическое сочетание - это однократно произошедший факт, поскольку и были однажды опубликованы со своими ссылками, и с ними в дальнейшем ничего уже произойти не может. Именно поэтому данный метод применяется для ретроспективного поиска документов, связанных между собой единством тематики, которая исследовалась их авторами.

Совсем по-другому обстоит дело с социтированием, так как связь между цитируемыми B и C может сохраняться (увеличиваться или уменьшаться) в последующие годы в зависимости от того, насколько часто они будут попарно цитироваться в новых работах. Частое социтирование указывает на их концептуальную близость, поскольку они используются как единый комплекс. Между этими работами как бы возникают невидимые связи, которые после наглядного их выражения образуют смысловые сгустки (кластеры). Совокупность таких кластеров ключевых работ, отражающих исследовательские области, представляет собой как бы карту определенной научной области, а совокупность карт - атлас науки на данный момент.
1   2   3   4   5   6   7   8   9   ...   12

Похожие:

1. Основы информационной культуры iconОтчёт о результатах апробации комплексного курса
России. Учебный предмет имеет комплексный характер и включает 6 модулей: основы православной культуры, основы исламской культуры,...
1. Основы информационной культуры iconСценарий зачетного учебного занятия по курсу «основы информационной культуры»
Стародубова Г. А. Информина: сценарий зачетного учебного занятия по курсу «Основы информационной культуры» (2005)
1. Основы информационной культуры iconИнформационная культура личности библиографический указатель кемерово 2006
Библиографический указатель предназначен для исследователей, занимающихся разработкой теории формирования информационной культуры...
1. Основы информационной культуры iconПрограмма внеурочной деятельности «Основы информационной грамотности младших школьников»
Большими возможностями для ее реализации располагают образовательные учреждения, в том числе библиотека. Именно в условиях библиотечно-информационной...
1. Основы информационной культуры iconЧто будут изучать ваши дети?
Учебный курс «Основы религиозных культур и светской этики» состоит из 6 модулей: основы православной культуры, основы исламской культуры,...
1. Основы информационной культуры iconПрограмма по формированию навыков безопасного поведения на дорогах...
Учебный курс «Основы религиозных культур и светской этики» состоит из 6 модулей: основы православной культуры, основы исламской...
1. Основы информационной культуры iconПрограмма по формированию навыков безопасного поведения на дорогах...
Учебный курс «Основы религиозных культур и светской этики» состоит из 6 модулей: основы православной культуры, основы исламской культуры,...
1. Основы информационной культуры iconПрограмма по формированию навыков безопасного поведения на дорогах...
Учебный курс «Основы религиозных культур и светской этики» состоит из 6 модулей: основы православной культуры, основы исламской культуры,...
1. Основы информационной культуры icon«основы информационной культуры личности» Гендина Н. И., Колкова...
Гендина Н. И., Колкова Н. И., Стародубова Г. А. Анализ общеобразовательных знаний и умений учащихся как база формирования учебных...
1. Основы информационной культуры iconРабочая программа по предмету основы религиозных культур и светской...
М.: Просвещение, 2010. 95 с и Электронным приложением к учебнику Основы духовно- нравственной культуры народов России. Основы православной...
1. Основы информационной культуры iconУчебник: Кураев А. В. «Основы духовно- нравственной культуры народов...

1. Основы информационной культуры iconИнструктивно-нормативное письмо «Об обучении основам религиозных...
Сного учебного курса для общеобразовательных учреждений «Основы религиозных культур и светской этики», включающего основы православной...
1. Основы информационной культуры iconРешение педсовета протокол №1 от 30 августа 2011 года
«основы православной культуры» А. В. Бородина. «Основы православной культуры: организация курса» М. Основы православной культуры,...
1. Основы информационной культуры iconПравительство Российской Федерации Государственное образовательное...
Базовый учебник имеется в библиотеке в достаточном числе экземпляров («Основы информатики» Р. С. Гиляревского), главы 1-3, 5 Ридеры...
1. Основы информационной культуры iconПояснительная записка Курс, адресованный руководителям образовательных...
Данная установка становится базовой для воплощения идеи непрерывного образования, в котором особое значение имеет информационное...
1. Основы информационной культуры iconПрограмма по формированию навыков безопасного поведения на дорогах...
Интеграция предметов: основы православной культуры, основы исламской культуры, основы буддизма, литература, изобразительное искусство,...


Школьные материалы


При копировании материала укажите ссылку © 2013
контакты
100-bal.ru
Поиск