Заместитель Директора Департамента корпоративного управления Минэкономразвития России





НазваниеЗаместитель Директора Департамента корпоративного управления Минэкономразвития России
страница9/27
Дата публикации26.01.2015
Размер3.43 Mb.
ТипОтчет
100-bal.ru > Информатика > Отчет
1   ...   5   6   7   8   9   10   11   12   ...   27

.4.4Методические рекомендации по развитию системы стандартов


На современном этапе необходимо развитие стандартов по трем основным направлениям:

Первое связано с дальнейшим развитием системы, разработкой новых стандартов.

Второе направление – ведение и совершенствование системы:

а) мониторинг состояния стандартизации, соответствия предъявляемых в стандартах требований новым условиям, своевременный пересмотр, введение необходимых изменений;

б) информационно-аналитическая работа – выявление тенденций развития стандартизации за рубежом, изучение новых объектов стандартизации;

в) научно-методическое сопровождение системы, обеспечение ее внедрения.

Третье направление связано с развитием информационного обеспечения: изданием стандартов, сборников стандартов, словарей стандартизованной терминологии.

.4.4.1Информационные сети


Основным перспективным средством передачи информации в настоящее время и в обозримом будущем являются информационные сети. Несмотря на имеющуюся эйфорию относительно эффективности сетевых технологий поиск информации в сети сопряжён с трудностями обеспечения полноты и точности из-за недостаточной структурированности глобального информационного ресурса. Наполнение глобальных сетей хорошо структурированными документами по общественно важной тематике является существенной предпосылкой развития и функционирования электронных библиотек. К сожалению, это направление почти не отражено в имеющихся и планируемых разработках СИБИД.

Разработанные в 70-80-х годах стандарты на коммуникативный формат были ориентированы на использование техники больших ЭВМ и, хотя они могут применяться на современных информационных носителях, они не решают многих задач, возникающих в глобальных сетях. Развёртывание соответствующих работ является главным приоритетом развития системы стандартов. Надо отметить, что и в международной практике стандартизации это направление пока не получило широкого распространения. Многочисленные разработки стандартов ИСО по взаимодействию открытых систем (OSI) решают, главным образом, вопросы технической совместимости источника и получателя данных, а не интерпретации представленного данными документа и поэтому не относятся к центральной тематике системы СИБИД. Основная работа в этом плане идёт сейчас в рамках инициативных технических ассоциаций, из которых большой интерес представляет, например, «Дублинское ядро». Конечным результатом таких работ должна стать общепринятая система описания (метаданных) электронных документов в сетях, которая могла бы обеспечить целенаправленную навигацию по информационным ресурсам, поиск документов по тематическим, организационным, материальным и другим признакам. Также следует обратить внимание на необходимость разработки отечественных ГОСТ на основе уже имеющихся стандартов ИСО по инвентаризации элементов библиографических данных для однозначной идентификации их при информационном обмене.

Дальнейшее развитие стандартов должно быть связано с новыми проблемными областями:

  • электронные документы и издания,

  • электронные библиотеки,

  • описание и каталогизация электронных информационных ресурсов.

Для основных объектов указанных проблемных областей и связанных с ними процессов должны проводиться исследования, экспериментальные работы и разрабатываться нормативные документы способствующие:

  • повышению качества электронной информации и услуг по ее сохранению и использованию,

  • обеспечению их унификации, совместимости и соответствия существующим требованиям отечественной и международной систем стандартизации,

  • проведению государственной политики в сфере информатизации, в частности по созданию и использованию общественно значимых электронных информационных ресурсов и по усилению роли государства в сети Интернет.

В рамках этой деятельности основное внимание должно уделяться способам подготовки и представления электронной информации, идентификации и описанию информационных объектов. Такой подход полностью соответствует профилю деятельности 4-го и 9-го подкомитетов ИСО/ТК 46 и деятельности отечественного ТК 191.

Указанная область деятельности является сравнительно новой и интенсивно развивающейся. В связи с этим она еще недостаточно, особенно в России, обеспечена нормативными документами.

Для внедрения и использования стандартов на выходные сведения для электронных изданий и на библиографическое описание электронных информационных ресурсов готовятся проекты ГОСТ, в основе которых использован международный стандарт: «Состав и определения основных параметров для описания электронных информационных ресурсов (аналог Dublin Core Metadata for Resource Discovery. RFC 2413. September, 1998)».

Предлагается также начать разработку отечественных нормативных документов по стандартным номерам для электронных документов и изданий. Этот стандарт должен стать отечественным аналогом международного стандарта ISTC (International Standard Textual Work Code; project 21047). Создание такого стандарта позволит в значительной степени решить чрезвычайно важную задачу идентификации, прежде всего в Интернете, электронных документов и изданий и своевременно обеспечить интеграцию в этом направлении с международной практикой.

С учетом внедрения в практику подготовки электронных изданий и документов в Интернете с использованием языков разметки (в частности XML) представляется важным разработка унифицированной формы их создания и представления. основой указанных работ должен стать ИСO 12083.

.4.4.2Индексирование


Оценка состояния. В настоящее время в системе представлено два стандарта: ГОСТ 7.59 и ГОСТ 7.66. Оба стандарта полностью соответствуют Международному стандарту, но дополняют и конкретизируют его содержание с учетом особенностей практики россии. Доклад на международной конференции и опубликованная в профессиональной печати статья, раскрывающие принятый в России подход к использованию международного стандарта, вызвали широкий положительный отклик специалистов.

Стандартизация общих требований к индексированию документов привела к пересмотру нормативов затрат времени на основные процессы, повысила качество и функциональную эффективность процессов индексирования. Требования стандартов отражены в содержании учебной и методической литературы.

Перспективы развития. При очередном обновлении и пересмотре целесообразно рассмотреть вопрос об объединении указанных стандартов.

В системе функционирует также стандарт, регламентирующий структуру, правила использования и ведения одного из применяемых в стране информационно-поисковых языков (ГОСТ 7.77-98). Следовало бы подумать о целесообразности разработки аналогичных стандартов для других применяемых в России ИПЯ.

Стандартные формы описания и структурирования информационных ресурсов должны ориентироваться на имеющиеся средства заполнения этих форм, которые в свою очередь должны быть приспособлены к использованию в этом качестве. В системе СИБИД такие средства представлены стандартами на классификационные и дескрипторные языки индексирования и поиска информации. Эта ветвь стандартизации должна быть усилена разработкой новых требований к развитию, представлению и применению не только Государственного рубрикатора НТИ, но также и других классификаций – УДК, ББК, языков ключевых слов, языка предметных заголовков и информационно-поисковых тезаурусов.

.4.4.3Представление библиографических записей


Оценка состояния. Система СИБИД по данному направлению полностью соответствует рекомендациям ИФЛА по международному стандартному библиографическому описанию. ГОСТ 7.1 положен в основу Правил описания и коммуникативных форматов и машиночитаемых форматов каталогизации. В последние годы подсистема подвергалась коренному обновлению: вместо большого количества однородных стандартов был создан комплекс с общим заглавием «Библиографическая запись», в который вошли стандарты на заголовок записи (ГОСТ 7.80-2000), на описание электронных ресурсов (ГОСТ 7.82-2001), на сокращения в описании (ГОСТ 7.12-93). В этот комплекс входит и пересмотренный ГОСт 7.1, который имеет универсальный характер и распространяется на все виды документов на различных физических носителях.

Перспектива развития

  1. Создание новых стандартов, регламентирующих:

    • формирование библиографической записи на новые, постоянно возникающие виды документов,

    • новые требования к технологии обработки документов,

    • требования к созданию и функционированию электронных каталогов,

    • правила создания и ведения авторитетных файлов для различных точек доступа,

    • общие требования к формированию метаданных для обработки сетевых ресурсов,

    • правила оформления библиографических ссылок,

    • новые международные стандартные номера.

  2. Ведение действующих стандартов

  3. Издание сборников стандартов:

на первом этапе целесообразно подготовить официальный сборник стандартов «Библиографическая запись» в связи с тем, что отдельные стандарты имеют малые тиражи, дороги и недоступны для библиотек.

В условиях функционирования глобальных сетей и построения распределенных систем доступа к информационным ресурсам происходит сближение между центрами научно-технической информации и классическими библиотеками. Поэтому должен быть преодолён разрыв практики стандартизации этих двух близкородственных отраслей, имеющийся до сих пор, например, в области коммуникативных форматов и классификационных систем. Хорошим примером может служить успешная разработка единого основополагающего ГОСТ на информационную и библиотечную терминологию. При этом опыт работы библиотек с классическими документами является основой для разработки стандартных решений по работе с новыми носителями информации, а требования, выдвигаемые применением автоматизированных информационных систем, должны послужить источником дальнейшего совершенствования библиотечных процессов и их адаптации к условиям электронного века.

Более того, сейчас стираются различия между традиционными бумажными и компьютерными документами: бумажные документы создаются с помощью компьютерных технологий и в свою очередь служат источником для создания компьютерных версий традиционных документов. Поэтому следует стремиться к унификации требований к традиционным и компьютерным (в частности, сетевым) документам, например, в части разрабатываемого сейчас нового варианта ГОСТ на правила библиографического описания и серии стандартов издательского дела.

Помимо этого следует применять понятия библиографическое описание произведений печати, состоящих из элементов, объединенных в области и заголовка (ГОСТ 7.1), представленных для электронных изданий в виде библиографических записей.

.4.4.4Архивное дело


В практике ИСO наблюдаются признаки сближения между различными классами научно-технической и распорядительной документации, которая у нас относится к разным классам: научно-технической и распорядительной. Это проявляется в том, что в техническом комитете ИСО/ТК 46 разработана серия стандартов по архивному делу.

Представляется также целесообразным с учетом концепции создания распределительной информационно-аналитической системы включить в перспективы развития СИБИД разработку стандартов на представление метаданных об информационных единицах и коллекциях, хранящихся в информационных центрах на информационные технологии и пр.

.4.4.5Текстовые документы как цифровые объекты


Для представления текстов в электронном виде возможны два способа: в виде графического изображения (образа) или посимвольное кодирование.

Каждый способ имеет свои достоинства и недостатки. Кодирование дает возможность посимвольной обработки текстов и, следовательно, разнообразных вариантов работы с ними (поиск, редактирование, экспорт, импорт и т.д.).

Представление в виде графического образа таких возможностей не дает, но зато позволяет сохранить индивидуальные особенности текста или обеспечивает достоверность электронного представления по сравнению с печатным оригиналом. Поэтому оцифровка древних рукописей, особо ценных документов или текстов, к достоверности которых предъявляются особые требования, осуществляется в виде графических образов.

Кроме того, перевод текста из бумажного варианта в электронный в символьном виде значительно дороже, поскольку сначала осуществляется сканирование с переводом в электронную форму в виде графического образа, а затем уже распознавание знаков текста при помощи программ оптического распознавания символов (OCR). Программы OCR работают не идеально, допуская определенное количество ошибок, поэтому для качественной подготовки текста обычно требуется еще и ручная корректура. Количество ошибок при работе программ OCR зависит от качества текста. Хороший четкий текст позволяет снизить число ошибок до 1% и даже меньше. В то же время, например, при оцифровке старых геологических отчетов количество ошибок достигало 50%. Альтернативой технологии сканирование – распознавание – корректура является технология ручного ввода (перепечатка) текста, которая во многих случаях оказывается дешевле.

При выборе способа электронного представления текста (графического или символьного) нужно также иметь в виду, что многие документы (включая полиграфические издания) в настоящее время готовятся в электронном виде (причем тексты всегда в символьных форматах), по этому их ввод в информационную систему часто не требует дополнительных преобразований.

.4.4.6Кодировки символов


Базовыми элементами текста являются символы или знаки алфавитов естественных языков или искусственных формальных систем, таких, как математическая, химическая или музыкальная нотация. Знак представляет собой абстрактное понятие, которое может иметь множество различных материальных воплощений, например изображений в разных шрифтах.

В ходе компьютерной эволюции шло активное развитие систем кодирования символов, начиная с примитивной, предназначенной для вывода текстов на АЦПУ, в которой различалось всего 64 символа, до системы UNICODE, которая поддерживает почти 39 тыс. различных практически не всех языках мира, использующих алфавиты.

Большая часть современных компьютеров основана на поддержке кодировки ASCII. Эта кодировка имеет две разновидности: 7-битный и 8-битный коды.

7-битный стандартный код поддерживает 128 знаков: 96 печатных и 32 служебных. Эти 96 знаков используются почти во всех устройствах, во многих программах и электронной почте.

Существует расширенная 8-битная кодировка ASCII, в которой 256 различных знаков, в том числе символы кириллицы. В России, естественно, она пользуется особой популярностью.

Однако наиболее мощной современной системой кодировки является UNICODE, использующая 16-битные коды. Она позволяет представлять письменности всех современных языков, кроме иероглифических, а также математические, технические и другие символы.

При помощи специальных средств коды UNICODE совместимы с кодировками ASCII, что способствует широкому распространению UNICODE.

Кроме UNICODE можно применять транслитерацию, когда знаки одного языка передаются при помощи знаков или комбинации знаков другого. Пока транслитерация сохраняет свое значение для представления знаков некоторых языков, например китайского, которые не поддерживаются UNICODE.

Кроме того, транслитерация применяется в ряде случаев, когда правилами орфографии предписано использовать только определенные алфавиты. Например, в России транслитерацию на кириллицу необходимо использовать при передаче собственных имен, при составлении библиографического описания и др.

.4.4.7Языки разметки


Гипертекстовый язык разметки HTML. Язык разметки HTML разработан в Лаборатории физики высоких энергий (CERN) в Женеве в 1990 г. Первоначально HTML был предназначен для разметки научных документов и их последующего совместного использования сотрудниками разных институтов и лабораторий. HTML состоял из небольшого фиксированного набора элементов, заголовков нескольких уровней, абзацев, списков и др. Но главной его особенностью было использование гиперссылок и специальных меток для указания точек перехода. Все это позволяло достаточно легко размечать простые документы и устанавливать связи как между ними, так и между компонентами одного документа. Человек всегда обрабатывает и анализирует информацию нелинейным образом. Поэтому возможности нелинейного хранения информации, простота использования языка разметки и широкие возможности применения привели к тому, что популярность HTML стала быстро расти и вне академических рамок. Как это часто бывает с любыми гениальными открытиями, успех превзошел все ожидания создателей.

В 1992 г. HTML был формализован в качестве SGML DTD, при этом в его спецификацию была заложена возможность дальнейшего расширения. Простой синтаксис языка в отличие от SGML позволял создавать простые программы для анализа размеченного текста и его отображения. Начался бурный рост публикаций в HTML-формате и числа приложений, поддерживающих этот формат.

В целях регулирования процесса развития и стандартизации предлагаемых решений для WWW в октябре 1994 г. была создана координирующая рабочая группа World Wide Web Consortium (W3C), которая сегодня объединяет представителей более чем 370 организаций. Основными задачами W3C являются накопления информации о WWW, необходимой как разработчикам, так и пользователям, подготовка и утверждение стандартов на технологии, связанные с WWW.

Положительная роль W3C в судьбе HTML очевидна. Этот язык удалось сохранить от разделения на несколько диалектов, правда, ценой постоянного принятия все новых и новых расширенных спецификаций, которые сменяют друг друга с периодичностью раз в два года. Борьба между двумя крупнейшими разработчиками Web-навигаторов в конце концов привела к тому, что стандарты утратили четкость и однозначность, а пользователям приходилось часто менять программное обеспечение. Сами же пользователи все больше и больше становились зависимы от разработчиков программных продуктов, у них не было возможности добавлять собственные расширения в языки разметки.

За время своего существования HTML претерпел множество изменений, что весьма неприятно для создателей документов и разработчиков программ. Но гораздо большей неприятностью стало то, что, изначально задуманный как язык структурной разметки, в результате своего развития HTML превратился в язык разметки представления. Исходный текст таких документов становится практически нечитаемым, а доля полезной информации составляет лишь несколько процентов.

Кроме того, несомненным шагом вперед по направлению к структуризации языка стало удаление элементов, отвечающих только за внешнее представление, и декларирование строгой необходимости использования для целей внешнего представления таблиц стилей.

Таким образом, языки разметки составили две крайности: SGML и HTML. С одной стороны, максималистский подход при создании SGML привел к чрезмерной сложности языка и соответствующих программных продуктов, что неприемлемо для массового потребления. С другой – простота и ограниченность HTML создала трудности при описании сложных информационных объектов, поиске необходимой информации, создании приложений, обменивающихся данными через Интернет. Поэтому в 1996 г. была сформирована рабочая группа W3C, основной задачей которой являлось создание нового языка разметки. Этот язык должен был включать в себя гораздо больше возможностей SGML, чем HTML, но в тоже время оставаться подходящим для использования в WWW. Чуть позже этот язык стал известен как XMLK (extensible Markup Language, расширяемый язык разметки).

Расширяемый язык разметки XML. Разработка нового языка разметки велась около двух лет, и в начале февраля 1998 г. W3C утвердила в качестве рекомендации первую спецификацию XML — XML версии 1.0. За сравнительно недолгий срок с момента своего появления на свет XML сумел завоевать огромную популярность среди разработчиков интернет-технологий. Число созданных и разрабатываемых программных продуктов на основе XML, число компаний, включающих поддержку XML в свои уже готовые продукты, количество публикаций в компьютерной прессе велики и продолжают расти.

Как и SGML, XML является метаязыком для формального описания прикладных языков разметки, предназначенных для кодирования структурированных документов. Спецификация XML определяет, как стандартным способом разметить документа, выделяя все семантически значимые компоненты.

При разработке нового языка разметки учитывались достоинства и недостатки уже существующих, а также то, что основным местом применения XML является Интернет. Основные требования к создаваемому языку были сформулированы следующим образом:

XML должен быть годен к непосредственному применению в Интернете;

XML должен быть совместим с SGML (XML-документ одновременно является и SGML-документом без внесения каких-либо изменений или дополнений);

XML-документы должны быть легко читаемы с помощью простейших текствоых процессоров;

XML-разметка призвана быть простой для понимания.

Для классификации правильно составленных (с точки зрения XML) документов вводятся понятия структурной и синтаксической корректности. XML-документ является структурно корректным, если отвечает следующим требованиям:

  • конструкция документа должна соответствовать общим правилам его составления, определенным в спецификации;

  • некоторые конструкции могут присутствовать только в определенных местах документа;

  • никакой атрибут не используется более одного раза в одном маркере элемента;

  • значения атрибутов не ссылаются на внешние объекты;

  • все непустые элементы удовлетворяют принципу вложенности;

  • все используемые объекты продекларированы;

  • отсутствуют ссылки на бинарные объекты непосредственно их текста: такие ссылки возможны лишь в момент декларации объекта;

  • текстовые объекты не являются рекурсивными.

При наличии у документа DTD возможна его проверка на синтаксическую корректность. При этом XML-документ считается синтаксически корректным, если он, во-первых, является структурно корректным, а во-вторых, полностью соответствует всем правилам, изложенным в соответствующем DTD.

Все элементы XML имеют специально зарезервированный атрибут XML-LINK. Его присутствие в элементе определяет наличие ссылки, а значение атрибута указывает, какой тип ссылки в данном месте используется. В XML в отличие от HTML возможно создание не только однонаправленных гипертекстовых ссылок по типу «один-к-одному», но и других, а именно:

  • двунаправленных ссылок;

  • ссылок с возможностью перехода к одному или нескольким объектам («один-ко-многим»);

  • ссылок к объектам, размещенным в базах данных.

Используя XML автор документа может самостоятельно определять тот набор элементов, который наиболее точным образом соответствует его структурным компонентам. Но свобода выбора имеет свою цену; набор используемых элементов не обладает предопределенной семантикой. Для совместной работы с XML-документами необходим стандартный механизм получения внешнего представления. Таким механизмом для XML является XSL (extensible Style Language, расширяемый язык стилей).

Работа с XML начинается с обработки исходного текста программой-анализатором (parser). Эта программа проверяет структурную и синтаксическую корректность XML-документа и создает дерево элементов исходного документа. Далее вступает в действие XSL-процессор, который в качестве исходных данных берет построенное дерево и соответствующий стиль. Шаг за шагом, начиная с корневого элемента, XML-процессор по шаблону, определенному в таблице стилей, обрабатывает всю структуру документа. Полученное в результате дерево элементов может состоять из форматирующих объектов, которые и описывают внешнее представление документа. Форматирующие объекты являются описанием|, независимым от устройства представления, и, следовательно, конечный документ может быть использован различными устройствами вывода.

Основными преимуществами XSL над другими механизмами наложения стилей помимо возможности работы с элементами непредопределенной семантики являются:

Возможность изменения порядка следования элементов в результирующем документе;

Возможность сортировки и сравнения элементов текста (список используемых терминов, упомянутых авторов);

Повторная обработка некоторых элементов (например, для печати разными стилями названия главы в начале страницы, в колонтитуле, оглавлении);

Возможность генерации вспомогательного текста («Глава», «Оглавление», «Список иллюстраций» и т.п.);

Подавление вывода некоторого текста (удаление редакторских примечаний или ввод только предисловия, а не полного документа).

Диалекты XML. XML получает очень широкое распространение при обработке определенных классов текстов в различных предметных областях Такие версии XML иногда называют его диалектами.

Большое количество проектов ведется в научных кругах. Например, для осуществления обмена стандартизованными данными на основе XML в астрономии был создан язык разметки AML (Astronomical Markup Language). AML поддерживает работу со следующими объектами: статьями, таблицами, наборами таблиц, изображениями астрономических объектов, персоналиями. Это означает, что все они могут быть описаны с помощью единого языка разметки, что облегчает установление связей между объектами и создание программных продуктов, поддерживающих их в рамках единого пользовательского интерфейса.

Другим примером является создание математического языка разметки MathML (Mathematical Markup Language). Еще одно научное приложение – CML (Chemical Markup Language), предназначенный для представления химических текстов, прежде всего формул.

Создан также язык разметки географических данных GML (Geography Markup Language), который позволяет кодировать географическую информацию, в частности геометрические характеристики объектов в форме XML-документов.

Однако основное направление развития приложений XML – это электронный бизнес и электронная торговля. Например, разработан международный формат ONIX, являющийся приложением XML для электронной торговли книгами. Далее кратко описываются некоторые другие стандарты на основе XML для деловой и коммерческой информации.

Язык разметки финансовых продуктов FPML (Financial Products Markup Language) предназначен для обеспечения электронной интеграции широкого перечня финансовых услуг – от электронного трейдинга до спецификаций инвестиционного портфеля для анализа рисков. Первая версия языка была создана в июне 1999 г. В его создании участвовали крупнейшие банки США и Европы.

Спецификация для обмена бизнес-сообщениями IFX (Interactive Financial exchange) предназначена для определения форматов сообщений и протокола их передачи в процессе электронного обмена данными. В апреле 1999 г. образован комитет по созданию IFX. В нем также представлены крупнейшие банки и финансовые компании, а также Ассоциация стандартов обмена данными, Сообщество банковского обслуживания и другие организации.

Язык для кодировки финансовых отчетов XBRL (eXtensible Business Reporting Language) основан на общепринятых стандартах статистической и финансовой отчетности и предназначен для обмена между программами через Интернет. Международный комитет, который занимается этим языком, был создан в 1999 г. На сегодняшний день разработаны способы описания формальных требований к отчету, представленному в формате XBRL, они соответствуют стандартам США и других стран в области финансовой отчетности.

.4.4.8Лингвистическое обеспечение информационных систем


Представление цифровых объектов (документов) для ввода в любую информационную систему кроме разметки предполагает обработку этого документа при помощи различных языковых средств, отображающих информацию, имеющуюся в документе. Совокупность этих языковых средств принято называть лингвистическим обеспечением (ЛО), а сами языки – информационно-поисковыми языками (ИПЯ).

Следует заметить, что эта терминология и вся совокупность идей и методов в области лингвистического обеспечения, излагаемая в настоящем разделе, характерна для той области информатики, которая традиционно имела дело с текстовыми документами. В теории баз данных использовались другая терминология и другая парадигма отношения данные – описание и представление данных.

Средства лингвистического обеспечения классифицируются в зависимости от уровня отображения информации, имеющейся в цифровых объектах. Их четыре:

  • уровень отображения цифрового объекта в целом, включая его формальные характеристики;

  • уровень отображения тематики или содержания цифрового объекта;

  • уровень отображения семантики единиц естественного языка, содержащихся в цифровом объекте или связанных с ним;

  • уровень отображения фактов, содержащихся в цифровом объекте.

Для объектов, которые могут рассматриваться как документы, первому уровню отображения соответствуют языки описания документов, весьма детально разработанные в традиционных областях информационной деятельности: библиотековедении, архивном деле, делопроизводстве, картографии и др. Самый известный тип образуют языки библиографических данных, включающие правила библиографического описания и форматы библиографической записи.

В настоящее время происходит активная интеграция этих языков с применяющимися для описания других видов цифровых объектов. Особенно активно этот процесс развивается в сети Интернет. Общее название языков, предназначенных для комплексного описания цифровых объектов, - системы метаданных.

На втором уровне отображения используются языки классификационного или предкоординатного типа, также имеющие большую историческую традицию. Их принципиальным свойством является разделение множества цифровых объектов на классы, описанные при помощи априорного связывания (предкоординации) поисковых признаков этих классов, чаще всего в виде иерархического дерева.

Судьбы языков такого типа с учетом перспектив глобальных информационных сетей вызывают оживленные дискуссии в связи с их имманентными недостатками, главный из которых – необходимость интеллектуального индексирования. При этом классификационные языки обладают заметными преимуществами перед другими типами, прежде всего наглядностью, простотой для пользователя и независимостью от естественного языка. В настоящее время классификационные языки являются обязательным компонентом практически всех АИС рассматриваемого класса.

Наиболее новым типом языковых средств, появившимся только в рамках автоматизированных систем в 1950-е гг., являются языки, ориентированные на использование в качестве лексики единиц естественного языка. Поэтому вполне адекватное название этой групп – вербальные языки. Однако наиболее распространенное наименование этих языков – дескрипторные в соответствии с названием общепринятой формы представления их лексических единиц (дескрипторов). Иногда эти языки также называют посткоординатными, подчеркивая противопоставление с классификационными по базовой функции – способу отражения информации текста. Если в классификационных языках используется априорное связывание поисковых признаков, то в дескрипторных признаки связываются непосредственно в цифровом объекте (посткоординация).

Большое развитие получили также языки, ориентированные на представление и поиск фактов, содержащихся в документах. Этот класс языков находится на стыке АИС типа электронной библиотеки и АИС типа банк данных. Поскольку основной и чуть ли не единственный класс фактов, которые удается автоматически извлекать из плохо структурированной информации, - это факты вида объект – признак – значение, постольку языки данного класса принято именовать объектно-признаковыми. Иногда их также называют фактографическими или объектографическими.

Кроме перечисленных типов языковых средств для поиска текстовых документов используются другие средства, как языковые, так и неязыковые. Сюда можно отнести многочисленные, но не слишком успешные методы поиска, основанные на анализе статических свойств текста и запроса, методы, использующие сведения о пользователе, поиск по аналогии, и т.д. Весьма распространенным при поиске в сети Интернет в последние годы стало использование данных о распределении гипертекстовых ссылок.

Рассмотренные выше языковые средства имеют некоторую общую часть, представленную в интерфейсе пользователя с АИС. Это операторы и синтаксические правила, которые непосредственно применяются при составлении запросов. Их естественно рассматривать отдельно от конкретных типов языков, поскольку в любом сколько-нибудь дружественном интерфейсе пользователя язык запросов интегрирует средства различных ИПЯ: библиографических, классификационных и вербальных. Эти средства обычно называются языками запросов.

Применение языковых средств достигается при помощи автоматической обработки текста, под которой здесь будут пониматься процессы автоматического формирования описания текста (документа) на одном или нескольких информационных языках, включая индексирование, аннотирование или реферирование. В основе этих процессов лежат конкретные лингвистические алгоритмы, прежде всего морфологического и синтаксического анализа.

Итак, ЛО включает следующие компоненты.

Информационно-поисковые языки:

Системы метаданных,

Классификационные языки

Вербальные языки,

Фактографические (объектно-признаковые) языки.

Системы автоматической обработки текста.

.4.5Состояние стандартизации для проведения работ по формированию
национального библиотечно-информационного фонда и
предложения по их изменению и дополнению


Ежегодное увеличение количества издаваемых электронных изданий (ЭИ), появление их новых производителей требует централизованного учета этого вида информационного продукта. Политика государства, направленная на борьбу с пиратством, установления имущественных и авторских прав на этот вид электронного продукта также предполагает наличие государственной системы, обеспечивающей их сбор, регистрацию и депозитарное хранение обязательных экземпляров.

Регистрацией и учетом созданных на территории Российской Федерации электронных изданий на основании Федерального Закона от 29 декабря 1994 г. № 77-ФЗ “Об обязательном экземпляре документов” (с изменениями и дополнениями, внесенными Федеральными законами от 27 декабря 2000 г. № 150-ФЗ, от 11 февраля 2002 г. № 19-ФЗ, от 24 декабря 2002 г. № 176-ФЗ, от 23 декабря 2003 г. №186-ФЗ, от 22 августа 2004 г. № 122-ФЗ), занимается Федеральный депозитарий электронных изданий, который является структурным подразделением НТЦ «Информрегистр». В функции депозитария входит информирование потребителей о поступающих экземплярах электронных изданий путем предоставления доступа к электронному каталогу «Российские электронные издания» через сеть Интернет.

Библиотечные и информационные организации, задачей которых является информационное обслуживание конечных пользователей, распространители электронной продукции и потребители заинтересованы в получении актуальной и полной информации об отечественном рынке мультимедийной продукции.

Производители и владельцы ЭИ, со своей стороны, в случае соблюдения требований указанного выше ФЗ о предоставлении в Федеральный депозитарий электронных изданий обязательного бесплатного экземпляра всех выпускаемых ими изданий, получают дополнительную возможность по информированию потенциальных потребителей о своей продукции. Разрозненные сведения, размещаемые ими в виде прайс-листов, рекламных или информационных сообщений, о таких ресурсах не дают пользователю возможности получения достоверной комплексной информации и возможности сделать обоснованный выбор.

Одновременно в соответствии с Постановлением Правительства Российской Федерации от 3 декабря 2002 г. № 859 ”Об обязательном экземпляре изданий” Федеральный депозитарий электронных изданий обеспечивает формирование национального информационно-библиотечного фонда отечественных электронных изданий. Подготовка библиографических описаний единиц хранения фонда и их передача в заинтересованные библиотечно-информационные организации позволяет обеспечить единообразие подхода к представлению информации об ЭИ в библиотечной системе страны и при предоставлении метаописаний ЭИ в публичный доступ.

Унифицированное представление описаний ЭИ может быть достигнуто только на основе использования стандартов.

В настоящее время разработано два ГОСТа непосредственно для электронных изданий и используются ГОСТы СИБИД, предназначенные для работы с традиционными изданиями.

Типология и правила оформления электронных изданий устанавливаются ГОСТ 7.83-2001 «СИБИД. Электронные издания. Основные виды и выходные сведения».

Значительная доля издателей не соблюдает предписанные ГОСТ правила оформления электронных изданий, что существенно осложняет обработку материалов. Например, предписанные ГОСТ сведения об издании на титульном экране либо содержат неполную информацию, либо титульный экран отсутствует (в большинстве случаев – при автозапуске мультимедийных изданий), что является нарушением раздела 4.1.

Основные элементы выходных сведений на ЭИ определены в разделе 4.2 указанного ГОСТа. Требования к ним согласованы ГОСТ 7.4-95 «СИБИД. Издания. Выходные сведения» и дополнены специфическими характеристиками электронных изданий (например, минимальные системные требования). Несоблюдение издателями ЭИ требований ГОСТ по оформлению электронных изданий и, как следствие, отсутствие необходимых сведений для их описания создает проблемы при научной обработке документов.

Составленное по единым правилам библиографическое описание способствует оптимизации поиска в электронных каталогах и делает более доступной информацию об электронных изданиях.

Научная обработка электронных изданий (библиографическое описание) производится на основании ГОСТ 7.82—2001 "СИБИД. Библиографическая запись. Библиографическое описание электронных ресурсов. Общие требования и правила составления", который устанавливает общие требования к описанию всех видов электронных ресурсов, независимо от технологии распространения.

Настоящий стандарт устанавливает общие требования к описанию всех видов электронных ресурсов, независимо от технологии распространения.

ЭИ могут быть отнесены к одному из классов: локальные (на съемных носителях) или сетевые, и имеют свои особенности представления и характеристики.

Унифицировать описание этих классов ресурсов целесообразно лишь в определенных областях описания – автор, заглавие, заглавие серии.

Описание ряда параметров возможно для электронных аналогов печатных изданий (в частности для сетевых версий оцифрованных изданий).

В целом требуется переработка структуры ГОСТ 7.82—2001 с целью выделения электронных изданий по технологии распространения.

Необходимо рассмотреть вопрос унификации типологии электронных изданий в ГОСТ 7-82-2001 и ГОСТ 7-83-2001. Обозначения, приведенные в «Области вида и объема ресурса» в ГОСТ 7-82-2001, включают обобщенную характеристику содержащихся в них материалов, однако такое деление не соответствует характеристике электронных изданий по различным основаниям классификации (п. 5.5.3).

Требуется привести типологию электронных изданий в соответствие с классификациями, предложенными в ГОСТ 7-83. В частности с точки зрения, содержащейся информации, в соответствии с ГОСТ 7.83 деления электронных изданий по природе основной информации предлагается представлять таким образом:

  • текстовое (символьное) электронное издание: Электронное издание, содержащее преимущественно текстовую информацию, представленную в форме, допускающей посимвольную обработку.

  • изобразительное электронное издание: Электронное издание, содержащее преимущественно электронные образы объектов, рассматриваемых как целостные графические сущности, представленных в форме, допускающей просмотр и печатное воспроизведение, но не допускающей посимвольной обработки.

  • звуковое электронное издание: Электронное издание, содержащее цифровое представление звуковой информации в форме, допускающей ее прослушивание, но не предназначенной для печатного воспроизведения,

  • программный продукт: Самостоятельное, отчуждаемое произведение, представляющее собой публикацию текста программы или программ на языке программирования или в виде исполняемого кода,

  • мультимедийное электронное издание: Электронное издание, в котором информация различной природы присутствует равноправно и взаимосвязано для решения определенных разработчиком задач, причем эта взаимосвязь обеспечена соответствующими программными средствами.

Развитие технологий представления информации значительно расширяет функциональность этого вида ресурса, и, как следствие, требует введения новых типов ресурсов, а именно:

  • Геоинформационное электронное издание: Картографическое электронное издание, содержащее преимущественно картографическую информацию представленную в форме, допускающей просмотр и печатное воспроизведение;

  • Видео-анимационное электронное издание: Электронное издание, содержащее цифровое представление видеоанимационной информации в форме, допускающей ее просмотр, но не предназначенной для печатного воспроизведения.

Область заглавия и сведений об ответственности в ГОСТ 7.82—2001 содержит информацию о лицах и организациях, ответственных за интеллектуальное или художественное содержание произведения, помещенного в объекте описания. При расшифровке сведений об ответственных лицах перечислены композиторы, писатели, художники, составители, иллюстраторы, т.е. лица, чьи непосредственно произведения помещены в издании. К юридическим лицам отнесены создатели, изготовители разработчики и др. – персоны принимавшие участие в подготовке электронного издания.

В приведенном в ГОСТ 7.822001 перечне к «Области заглавия и сведений об ответственности» отсутствует категория «правообладатели». В соответствии с ФЗ «Об авторских и смежных правах», лицо или организация, указанные со знаком охраны авторского права на этикетке диска или титульном листе электронного издания, при библиографическом описании должны быть приравнены к лицам, приведенным в ГОСТ в качестве «лиц ответственных за само ЭИ». При составлении библиографического описания, необходимо включать правообладателей в «Область сведений об ответственности» после знака «/», но без указания самого «знака охраны авторских прав» и года первого воспроизведения т.к. эти сведения относятся непосредственно к юридической стороне вопроса, а не к библиографическому описанию.

Необходимым этапом обработки электронного издания является аналитико-синтетическая обработка документа – аннотирование. Правила подготовки аннотации регламентированы межгосударственным стандартом СИБИД ГОСТ 7.9-95 «Реферат и аннотация. Общие требования». В ГОСТ 7.9-95 приведено следующее определение аннотации: "Аннотация - краткая характеристика документа с точки зрения его назначения, содержания, вида, формы и других особенностей". Рекомендуемый средний объем аннотации - 500 печатных знаков.

В аннотации оговаривается предоставление следующих сведений об электронном издании: назначение; содержание; источник информации; количественные характеристики ЭИ; категории и возраст пользователей; сведения о сертификатах, рекомендациях министерств и ведомств, призах; при наличии сетевого аналога – адрес в Интернет. В большинстве случаев производители электронных изданий аннотацией считают рекламный текст, размещённый на упаковке (на коробке или поверхности диска). Объём такого текста может быть большим и представлять собой изложение сюжета или дублировать сведения содержания. С точки зрения библиографической обработки издания такой текст не может являться аннотацией.

Аннотация на электронное издание, безусловно, должна содержать все сведения, предусмотренные ГОСТ 7.9-95. Главной задачей аннотации на электронное издание является описание содержания документа, пояснение и уточнение заглавия и сведений, относящихся к заглавию, в аннотации не допускается дублирование заглавия.

Учитывая специфику электронных изданий, как вида изданий, имеющего новые пользовательские возможности, в аннотации необходимо раскрыть функциональность и технические характеристики ресурса, технологию распространения, условия доступа.

В связи с этим требуется пересмотреть и внести дополнения в ГОСТ 7.9-95 «Реферат и аннотация. Общие требования» с целью его адаптирования к обработке электронных ресурсов.

Соблюдение требований стандартов при подготовке электронных изданий производителями создаст основу для единообразного подхода к оформлению изданий, что позволит собрать, сохранить и представить конечному пользователю сведения о продукции.

Доработка существующих или разработка новых стандартов и их безусловное использование при научной и аналитико-синтетической обработке электронных изданий, повысят качество информационных услуг и облегчат работу по комплектованию и ведению фондов электронных изданий.

.4.6Рекомендации


При создании системы распределенного доступа к информационным ресурсам первой программно-технологической задачей встанет задача совмещения гетерогенных ресурсов и/или метаданных о ресурсах. В связи с этим, первоочередными стандартами , которые необходимо разработать и принять, должны стать стандарты или технологические регламенты, определяющие взаимодействие объектов системы стандартов на форматы описания и протоколы передачи данных.
1   ...   5   6   7   8   9   10   11   12   ...   27

Похожие:

Заместитель Директора Департамента корпоративного управления Минэкономразвития России iconЗаместитель Директора Департамента корпоративного управления Минэкономразвития России
Директор Всероссийского института научной и технической информации Российской академии наук
Заместитель Директора Департамента корпоративного управления Минэкономразвития России iconОбязанности совета директоров и роль заинтересованных лиц в области корпоративного управления
Четвертое заседание круглого стола по вопросам корпоративного управления в России
Заместитель Директора Департамента корпоративного управления Минэкономразвития России iconПротокол заседания Управляющего Совета
Приглашенные: Колосова В. С., заместитель директора по увр; Коробец В. А., заместитель директора по вр; Шлык А. А., заместитель директора...
Заместитель Директора Департамента корпоративного управления Минэкономразвития России iconСамосудов М. В., к э. н., вице-президент Института корпоративного...
На карточках написаны названия рыб, нужно за 1 минуту отобрать, карточки с названиями морских рыб, за правильный ответ 1 балл, неправильный...
Заместитель Директора Департамента корпоративного управления Минэкономразвития России iconДоклад о результатах деятельности муниципального учреждения средней...
А. В. Тунцев, директор му сош №68; Е. В. Антонова, заместитель директора по увр; Е. А. Шерудилло, заместитель директора по увр; Л....
Заместитель Директора Департамента корпоративного управления Минэкономразвития России iconДементьева А. Г., зам декана факультета Международного бизнеса и...
Практика показывает, что наличие в компании эффективной системы корпоративного управления зачастую становится основной для привлечения...
Заместитель Директора Департамента корпоративного управления Минэкономразвития России iconПрограмма внеклассного кружка «Проектная работа в педагогике»
Руководитель шмо заместитель директора по мнр заместитель директора по ур директор
Заместитель Директора Департамента корпоративного управления Минэкономразвития России iconЗаместитель директора департамента образования мэрии
Методический совет «Нормативно-правовое обеспечение деятельности орц в 2012 году»
Заместитель Директора Департамента корпоративного управления Минэкономразвития России iconПрограмма по формированию навыков безопасного поведения на дорогах...
Ответственные: заместитель директора по увр: Михайлова Л. А. заместитель директора по увр
Заместитель Директора Департамента корпоративного управления Минэкономразвития России iconДроздов Б. В. д т. н., заместитель директора нии информационных технологий...
Заместитель Председателя Правительства Московской области – министр транспорта Правительства Московской области – П. Д. Кацыв
Заместитель Директора Департамента корпоративного управления Минэкономразвития России iconОтчет по работе экологической площадки Гурылева Наталья Владимировна,...
...
Заместитель Директора Департамента корпоративного управления Минэкономразвития России iconЗакон РФ от 10. 07. 1992 n 3266-1 «Об образовании»
М. О. Антонова, к п н., заместитель директора Департамента образования и науки Костромской области, начальник отдела обеспечения...
Заместитель Директора Департамента корпоративного управления Минэкономразвития России iconРекомендации по организации учебного процесса и подготовке локальных...
Кудрявцев Л. В. — заместитель начальника Департамента кадрового обес­печения мвд россии, кандидат юридических наук
Заместитель Директора Департамента корпоративного управления Минэкономразвития России iconПрограмма по формированию навыков безопасного поведения на дорогах...
Милославского района, Рязанской области в составе: Свиридова Н. А. – директор моу «Центральная средняя общеобразовательная школа»,...
Заместитель Директора Департамента корпоративного управления Минэкономразвития России iconДоклад директора Департамента государственной политики в сфере воспитания,...
Доклад директора Департамента государственной политики в сфере воспитания, дополнительного образования и социальной защиты детей...
Заместитель Директора Департамента корпоративного управления Минэкономразвития России iconПротокол №14 заседания Комиссии по землепользованию и застройке города Томска
Коренев В. И. заместитель начальника Департамента строительства и архитектуры Администрации г. Томска — заместитель председателя...


Школьные материалы


При копировании материала укажите ссылку © 2013
контакты
100-bal.ru
Поиск