Технологии обработки документов





НазваниеТехнологии обработки документов
страница1/9
Дата публикации20.05.2015
Размер1.43 Mb.
ТипУчебное пособие
100-bal.ru > Информатика > Учебное пособие
  1   2   3   4   5   6   7   8   9


Восточная экономико-юридическая гуманитарная академия (Академия ВЭГУ)

ИНТЕЛЛЕКТУАЛЬНЫЕ ИНФОРМАЦИОННЫЕ

ТЕХНОЛОГИИ ОБРАБОТКИ ДОКУМЕНТОВ

Учебное пособие для студентов вузов

УФА

2010

УДК 681.3.01

ББК 73

И 73
Печатается по решению редакционно-издательского совета

Академии ВЭГУ

Рецензенты:

директор Уфимского института коммерции и права И.М. Ахметов;

канд. техн. наук, доцент Э.А. Гумеров


И 73 Интеллектуальные информационные технологии обработ-

ки документов : учебное пособие для студентов вузов / сост. Ф.М. Шакирова ; Восточная экономико-юридическая гуманитарная академия (Академия ВЭГУ). – Уфа, 2010. – 132 с.
ISBN 978-5-87865-535-4 (в обл.)
В учебном пособии освещаются современные достижения в области информационных технологий.

Разработано в соответствии с требованиями Государственного образовательного стандарта высшего профессионального образования ЕН.Ф.01 «Математика, информатика, современные компьютерные технологии» к подготовке студентов, обучающихся по специальности 03060165 «Журналистика».

Предназначено для студентов Института журналистики и ино­странных языков Академии ВЭГУ.


УДК 681.3.01

ББК 73


ISBN 978-5-87865-535-4 (в обл.)

© Шакирова Ф.М. (сост.), 2010




© Академия ВЭГУ, 2010




ОГЛАВЛЕНИЕ
ВВЕДЕНИЕ 7
ТЕОРЕТИЧЕСКАЯ ЧАСТЬ
ТЕМА 1. ТЕХНОЛОГИЯ АВТОМАТИЧЕСКОГО

РАСПОЗНАВАНИЯ ОБРАЗОВ 9

Компьютерная обработка печатных изданий 9
ТЕМА 2. СИСТЕМЫ МАШИННОГО ПЕРЕВОДА 11

2.1. Проблемы машинного перевода 13

2.2. Системы машинного перевода 13

2.3. Перевод в Интернете 15

2.4. Электронные словари 17
ТЕМА 3. СВОБОДНОЕ ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ

В УЧЕБНОМ ПРОЦЕССЕ 19

3.1. Инициативы корпорации Microsoft 19

3.2. Инициативы корпорации IBM 20

3.3. ПО серии Student Edition 21

3.4. Аналоги ПО Windows в Linux 22
ТЕМА 4. ДИСТАНЦИОННОЕ ОБУЧЕНИЕ 24

4.1. Характерные черты дистанционного образования 24

4.2. Преимущества дистанционного обучения 25

4.3. Недостатки дистанционного обучения 26

4.4. Электронные тесты 27

4.5. Lotus LearningSpace – система дистанционного обучения

на основе Интернет-технологий 28
ТЕМА 5. ТЕХНОЛОГИЯ ПОИСКА ИНФОРМАЦИИ

В СЕТИ ИНТЕРНЕТ 29

5.1. Особенности поиска информации в сети Интернет 29

5.2. Советы по поиску информации в сети Интернет 30

5.3. Поиск «по-русски» 32
ТЕМА 6. КОМПЬЮТЕРНАЯ ГРАФИКА. ГРАФИЧЕСКИЕ

ФОРМАТЫ 34
ПРАКТИЧЕСКИЕ ЗАНЯТИЯ
ТЕМА 1. ТЕХНОЛОГИИ АВТОМАТИЧЕСКОГО

РАСПОЗНАВАНИЯ ОБРАЗОВ 37

Пакет программ FineReader 8.0 Professional 37

1.1. Запуск FineReader 37

1.2. Получение отсканированного изображения текста 40

1.3. Выбор участка текста для дальнейшего распознавания 43

1.4. Распознавание различных типов изображения 45

1.5. Редактирование текста 48

1.6. Сохранение текста в виде файла 49

1.7. Выход из пакета по окончании работы с ним 51

1.8. Работа в режиме распознавания с обучением 51

ТЕМА 2. СИСТЕМЫ МАШИННОГО ПЕРЕВОДА 53

2.1. Переводчик текста «Сократ Персональный 4.1» 53

2.1.1. Вкладки программы 55

2.1.2. Знакомство с режимами перевода 59

2.1.3. Сохранение результатов перевода 62

2.1.4. Окно словаря и его основные элементы 62

2.1.5. Клавишные команды программы 64
2.2. Пакет программ Stylus 3.1. (PROMT). Перевод текстов

из различных предметных областей 65

2.2.1. Окно PROMT Professional 68

2.2.2. Информационная панель 69

2.2.3. Вкладка НЕЗНАКОМЫЕ СЛОВА 70

2.2.4. Вкладка ЗАРЕЗЕРВИРОВАННЫЕ СЛОВА 70

2.2.5. Вкладка СВОЙСТВА 71

2.2.6. Вкладка СПРАВКА ПО СЛОВАРНОЙ СТАТЬЕ 71

2.2.7. Направление перевода 72

2.2.8. Алгоритм использования PROMT-среды 73

2.2.9. Научиться подключать словари 75

2.2.10. Изменение порядка словарей в очереди 76

2.2.11. Создание пользовательского словаря 76

2.2.12. Ввод словарной статьи в пользовательский словарь 77
2.3. Персональный словарь LINGVO 4.0 78

2.3.1. Изменение текущего словаря 79

2.3.2. Опции конфигурации 81

2.3.3. Основные действия в среде программы 82

2.3.4. Словарь терминов 86

ТЕМА 3. СВОБОДНОЕ ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ

В УЧЕБНОМ ПРОЦЕССЕ 88

ТЕМА 4. ДИСТАНЦИОННОЕ ОБУЧЕНИЕ 88

Пример разработки текста в MS PowerPoint 88

ТЕМА 5. ТЕХНОЛОГИЯ ПОИСКА ИНФОРМАЦИИ

В СЕТИ ИНТЕРНЕТ 93

Адресация и навигация в сети Интернет 93
5.1. Отправка и получение электронной почты 94

ТЕМА 6. КОМПЬЮТЕРНАЯ ГРАФИКА 95

6.1. Работа с издательской системой MS Publisher 95

6.1.1. Создание макета публикации на основе шаблонов 95

6.1.2. Создание публикации на основе пустых публикаций.

Использование готовых и создание собственных графических

объектов 96

6.1.3. Сборка публикации из готовых объектов 97

САМОСТОЯТЕЛЬНАЯ РАБОТА СТУДЕНТОВ
ТЕМА 1. ТЕОРИЯ ВЕРОЯТНОСТЕЙ И СТАТИСТИКА 100

1.1. Перестановки, размещения, сочетания 100

1.2. Понятие случайного события, вероятность события.

Сумма, произведение и разность событий 102

1.3. Условная вероятность. Вероятность произведения.

Независимость событий 106

ТЕМА 2. ЯЗЫКИ ПРОГРАММИРОВАНИЯ 114

2.1. Основные понятия 114

2.2. Структура программы – блок-схема 114
ТЕМА 3. ДВОИЧНАЯ СИСТЕМА СЧИСЛЕНИЯ 118
ТЕМА 4. ЗАЩИТА ИНФОРМАЦИИ 120

4.1. Актуальность защиты информации 120

4.2. Методы защиты информации 120




ЗАКЛЮЧЕНИЕ 125
СПИСОК РЕКОМЕНДУЕМОЙ ЛИТЕРАТУРЫ 127
Приложение 128

ВВЕДЕНИЕ
Учебное пособие содержит дополнительные сведения по информа­ционным технологиям, которые изучают по курсу «Математика, информатика, современные компьютерные технологии».

Материалы данной работы могут быть использованы при изучении других дисциплин, ориентированных на прикладное использование компьютера, и современных достижений в области информационных тех­нологий в профессиональной деятельности.

Структура и содержание работы позволяют студентам ознакомить­ся с кратким изложением теоретических основ изучаемого материала по новым информационным технологиям, воспользоваться им при выполнении СРС, а также при подготовке к практическим занятиям и зачету. Каждая тема завершается списком вопросов и заданий, которые помогут учащемуся расставить акценты в предложенном для усвоения теоретическом материале.

В данной работе содержатся сведения по технологиям автоматического распознавания образов; дается обзор наиболее известных систем машинного перевода; предлагаются к использованию в процессе обу­чения наименования и Интернет-источники свободного программного обес­печения; приводятся характеристики дистанционного обучения и технологии поиска информации в сети Интернет.

В учебном пособии также даны основы систем машинного перевода (СМП). К системам машинного перевода относятся как электронные переводчики текстов и файлов, так и иностранные словари, в том числе, доступные в сети Интернет.

В учебное пособие включены практические занятия, позволяющие освоить основы работы с программами перевода PROMT (Stylus) и «Сократ», словарем иностранных слов LINGVO, программой распознавания машинописного и рукописного текста FineReader, браузером Internet Ex­plorer и программой создания презентаций MS PowerPoint в качестве ин­струмента для создания теста.

В конце учебного пособия приводится список рекомендуемой литературы.

Цели изучения дисциплины – формирование у студентов знаний по интеллектуальным информационным технологиям, используемым в образовательном процессе, получение ими представления о базовых основах и отличительных особенностях информационных технологий, о сферах применения существующих технологий, способах обработки ин­формации, системах классификации и поиска информации, системах рас­познавания машинописного и рукописного текста, системах перевода с одного иностранного языка на другой, о типах документов, адекватно пе­реводимых с помощью СМП, классификации СМП и словарей, доступных в сети Интернет, возможности интерактивного перевода в Интернет.

Основными задачами дисциплины являются: изучение основ новых информационных технологий, в том числе, систем машинного распознавания текста и его перевода;

– получение знаний в области выбора соответствующего программного приложения, реализующего необходимые инструментальные средства решения задач в профессиональной деятельности;

– овладение работой с прикладными программами и использование современных программных средств поддержки принятия решений.

В результате изучения дисциплины студент должен знать:

– основные понятия интеллектуальных информационных технологий;

– основные инструментальные средства, реализующие «интеллектуальные» функции в прикладных программах;

– основные понятия технологии машинного перевода;

– основные типы СМП и рекомендации к их использованию для пе­ревода различного рода документов;

– возможности перевода в сети Интернет.

После изучения дисциплины студент должен уметь:

– выполнять распознавание машинописного и рукописного текста с помощью программы FineReader;

– составлять оптимальные запросы для поиска информации в сети Интернет;

– составлять тесты для проверки знаний и автоматизировать их ис­пользование средствами MS PowerPoint;

– выполнять перевод текста с помощью программ «Сократ» и PROMT (Stylus);

– работать со словарем LINGVO;

– выполнять перевод в сети Интернет.

В процессе изучения данной дисциплины студент должен приобрести навыки:

– выбора наиболее предпочтительной для решения текущей задачи прикладной программы из класса специальных программ;

– работы в среде соответствующих прикладных программ;

– интерпретации результатов обработки информации прикладными программами.

ТЕОРЕТИЧЕСКАЯ ЧАСТЬ
ТЕМА 1. ТЕХНОЛОГИЯ АВТОМАТИЧЕСКОГО

РАСПОЗНАВАНИЯ ОБРАЗОВ
Компьютерная обработка печатных изданий
В процессе работы с документом, составленным на иностранном языке, может возникнуть необходимость в предварительном его преобразовании в электронный вид. При переводе электронного документа могут возникнуть ошибки из-за затруднений в результатах распознавания текста документа, поэтому знание систем распознавания и технологии улучшения результатов является частью работы переводчика.

Часто в практике работы с документами необходимо получение его электронного варианта. Такая ситуация может возникнуть, например, в процессе срочного внесения изменений в документ, файл с которым был утерян, или его поиски на ПК занимают значительное время. Если доку­мент содержит не одну страницу, его повторный набор также потребует большого времени.

Другая ситуация – необходимость преобразования в электронный вариант печатного издания. Даже если его текст набран бледным шрифтом и содержит помарки, оцифровка (распознавание текста) книги – лучший выход из ситуации, т. к. внесение исправлений в оцифрованный вариант займет меньше времени, чем его клавиатурный набор.

И наконец, в связи с распространением документов в графических форматах, например, pdf или djvu, также появляется необходимость их преобразования в формат MS Word. Средств программ Adobe Acrobat или LizardTech недостаточно, т. к. они изначально разработаны для чтения документов графического формата.

Современные OCR-системы (системы оптического распознавания), например, FineReader от компании «Арсеналъ», могут распознавать не только машинописный, но и рукописный текст. Рукописный текст сос­тавляет большинство анкет, в том числе, выборные бюллетени, и машинное прочтение таких документов представляется наиболее эффективным по скорости и точности вариантом их анализа.

Текст может также содержать таблицы, которые будут распознаны в формате таблиц. Результаты распознавания можно сохранять в формате программ MS Office или передавать в среду этих программ для последующей корректировки, хотя в среде программы FineReader текст также можно корректировать. Перед распознаванием в настройках системы можно задать словарь, который будет использоваться при распознавании исходного текста по выбранному варианту.

В конце концов, можно варьировать подключаемые словари, например, подключить словарь русского языка, затем этот же текст распознать с помощью словаря английского языка, а затем совместить оба варианта. В современных системах есть возможность устанавливать и сме­шанные словари, в частности, русско-английский словарь.
Контрольные вопросы и задания
1. Особенность компьютерной обработки печатных изданий.

2. Какие задачи решают OCR-системы?

3. В каких целях система OCR может использоваться в качестве вспомогательной системы?




ТЕМА 2. СИСТЕМЫ МАШИННОГО ПЕРЕВОДА
Переводом называется процесс и результат создания на основе исходного текста на одном языке равноценного ему в коммуникативном отношении текста на другом языке. При этом коммуникативная равноценность, или эквивалентность, понимается как такая особенность текста перевода, которая позволяет ему выступать в процессе общения носителей разных языков в качестве полноправной замены исходного текста (оригинала) в сфере действия языка перевода.

Коммуникативная эквивалентность нового текста по отношению к оригиналу обеспечивается выполнением трех основных требований. Текст перевода должен:

– в наиболее полном объеме передавать содержание оригинала, что, прежде всего, означает недопустимость произвольного опущения или добавления информации;

– соответствовать нормам языка перевода, так как их нарушение, по меньшей мере, создает помехи для восприятия информации, а иногда ведет к ее искажению;

– быть примерно сопоставим с оригиналом по своему объему, чем обеспечивается сходство стилистического эффекта с точки зрения лаконичности или развернутости выражения.

Развитие кибернетики сделало возможным машинный перевод, т. е. перевод, строящийся на использовании машиной определенных и посто­янных для данного вида материала соответствий между словами и грам­матическими явлениями разных языков. Считается, что история машинного перевода началась с эксперимента, проведенного в Джорджтаунс­ком университете США в 1954 г. Впервые в мире текст, состоящий из нескольких фраз, был переведен с русского языка на английский с помощью вычислительной машины. Сегодня в разных странах известно не менее сотни коммерческих систем машинного перевода (СМП), экспе­риментальные же исчисляются тысячами. При этом не менее десятка сис­тем имеют дело с русским языком. Среди стран, в которых разрабатываются коммерческие СМП, следует назвать США, Японию, Россию и Германию. Развитие систем автоматического перевода идет в двух направлениях: создание собственно систем машинного перевода и разработка электронных словарей.

Достоверных сведений о том, что происходит в голове переводчика, нет. Поэтому о содержании процесса перевода приходится говорить гипотетически. Можно предположить, что в процессе перевода имеют место операции двух типов:

1. Перевыражение содержания исходного текста средствами системы языка перевода.

2. Адаптация (приспособление) создаваемого переводного текста к лингвоэтнической коммуникативной компетенции адресата перевода: язы­ковой норме языка перевода, соответствующему узусу и преинформационному запасу.

Нуль-перевод – первоначальный перевод исходного текста, написанного на другом языке, полученный с помощью программы-перевод­чика.

Черновой перевод – перевод исходного текста, написанного на дру­гом языке, с полной передачей смысла информации, заложенной автором исходного текста.

Белый перевод – перевод исходного текста, написанного на другом языке, с полной передачей смысла информации, заложенной автором исходного текста и с сохранением узнаваемого стиля изложения материала, присущего конкретному автору или фирме.

Выделим достоинства программ машинного перевода.

Высокая скорость. Всего несколько секунд – и вы получаете перевод многостраничного текста.

Низкая стоимость. Если вы обращаетесь к профессиональным пе­реводчикам, приходится платить за каждую страницу переведенного тек­ста, либо вы нанимаете штатного переводчика, которому приходится пла­тить зарплату. В случае с системой машинного перевода, вы платите день­ги только один раз при покупке программы.

Доступ к услуге. Программа-переводчик всегда под рукой, а обращение в переводческое бюро во многих случаях связано с дополнительными финансовыми и временными затратами.

Конфиденциальность. СМП вы можете доверить любую информацию.

Универсальность. Любой переводчик всегда имеет специализацию, т. е. переводит тексты по той теме, которой он хорошо владеет. Когда переводчик художественной литературы берется за перевод, например, технических текстов, ляпсусов не избежать. СМП выгодно отличается тем, что она абсолютно универсальна. Нужно только грамотно подключить специализированный словарь по соответствующей тематике. Следует учесть и еще одно преимущество СМП: пополнение их специализированных словарей новейшими терминами значительно опережает аналогичные словари полиграфического исполнения.

Перевод информации в Интернете. В он-лайне наиболее ярко проявляются все преимущества СМП. Более того, в большинстве случаев переводить информацию в Интернете, если вы, конечно, сами не зна­ете нескольких языков, можно только с помощью программ-переводчи­ков. Только благодаря онлайновым СМП появилась возможность просматривать иностранные сайты, не затрудняясь с их переводом.

2.1. Проблемы машинного перевода
В зависимости от того или иного стиля и назначения текста одно и то же слово нередко имеет разные значения. В какой-то мере эта особенность учитывается – в системах МП предусмотрены сменные словари, иногда для каждого вида текста предусмотрен свой словарь. Если лексики одного машинного словаря не хватает и применяются несколько словарей одновременно, можно указать системе, из какого словаря нужно брать слово. Наконец, программа сама может предлагать на выбор пользователю несколько вариантов перевода, и он выбирает подходящий вариант, так сказать, вручную.

Наряду с установленными правилами построения предложения в каждом языке существуют и свои неписаные законы, которые иногда называются красотами языка. Например, предложение на английском языке THIS IS MY BOOK дословно переводится ЭТО ЕСТЬ МОЯ КНИГА, и формально это будет правильным, но по-русски так не говорят. В данном случае можно сказать, что предложение написано так, будто его составил иностранец. Таким образом, результаты МП часто требуют редактирования. Насколько адекватными можно считать результаты перевода на компьютере – это определяется не только качеством системы МП, но и качеством последующего редактирования.

Первая проблема машинного перевода – проблема создания больших словарей для систем.

Вторая – научить систему распознавать устойчивые обороты.

В-третьих, понятно, что предложение для перевода пишется по оп­ределенным правилам, по определенным правилам переводится, а значит, есть еще одна проблема записать все эти правила в виде программы. Эти проблемы действительно являются основными при разработке систем МП, другое дело, что методы их решения известны далеко не всем и отнюдь не так просты, как может показаться.

2.2. Системы машинного перевода
Системы машинного перевода обеспечивают автоматический перевод с одного языка на другой и позволяют, в случае необходимости, отредактировать полученный текст.

К последним разработкам относятся:

  • MT News International фирмы Linguistic Product;

  • LOGOS фирмы Logos Corporation;

  • GTS фирмы Globalink;

  • LogoVista E to J фирмы Language Engineering Corporation;

  • Ultra фирмы Tradux Corporation;

  • Spanish Amigo фирмы WestCliff Software;

  • Translation Assistant фирмы MicroTac Software;

  • Stylus или PROMT 98 фирмы PROMT (Санкт-Петербург);

  • СПРИНТ – разработка Всероссийского центра переводов;

  • ЭТАП – разработка Лаборатории вычислительной лингвистики Института проблем передачи информации РАН (Москва);

  • ПАРС фирмы «Лингвистика 93» (Харьков);

  • RETRANS – разработка Всероссийского института научной и тех­нической информации (Москва);

  • Сократ компании «Арсеналъ».

Одним из лидеров машинного перевода на российском рынке является компания PROMT, которая предлагает семейство систем Stylus для перевода на русский с английского, немецкого, французского, испанского, итальянского, а также с русского на английский.

Отличительной особенностью систем семейства Stylus является вы­сокая скорость и качество перевода, совместимость с распространенными текстовыми процессорами, в том числе MS Word. Пользователь может пополнить словарь новыми терминами непосредственно из окна ненайденных слов. Англо-русская и русско-английская системы семейства Stylus предоставляют пользователю англоязычный и русскоязычный интерфейсы.

В системах семейства PROMT разработано практически уникальное по полноте морфологическое описание для всех языков, с которыми системы умеют обращаться. Оно содержит 800 типов словоизменений для русского языка, более 300 типов как для немецкого, так и для французского языка; и даже для английского, который не принадлежит к флективным языкам, выделено более 250 типов словоизменений. Множество окончаний для каждого языка хранится в виде древесных структур, что обеспечивает не только эффективный способ хранения, но и эффективный алгоритм морфологического анализа.

На сегодняшний день PROMT обладает и серьезными недостатками:

• не оценивает контекст и, как следствие, неправильно переводит слож­ноподчиненные предложения и побудительные обороты, а также названия;

• PROMT, как и любая программа-переводчик, тяготеет к дословно­му переводу, так как реализует алгоритмы искусственного интеллекта всег­да направленные на однозначность решения поставленной задачи, вслед­ствие чего появляется ошибочная трактовка глагольных форм, длительнос­ти действия, нарушение грамматической и синтаксической сочетаемости.

Для домашнего применения можно порекомендовать следующие системы МП: Magic Gooddy (от компании PROMT), «Сократ Персональный» и «Коперник».

«Коперник» лучше всего подойдет для домашнего офиса профессионального переводчика. Он обладает достаточными возможностями для подготовки переводных текстов высокого качества. Программа хорошо переводит тексты самых разнообразных тематик, иногда даже без дополнительных словарей. В некоторых случаях, после подключения сло­варей и несложного постредактирования, удается получить переводы, удовлетворяющие всем правилам грамматики и стилистики русского язы­ка. Кроме того, эта программа поддерживает четыре языка. Интеграция с MS Word и функция выбора вариантов перевода слов позволяют значительно сократить затраты времени на постредактирование.

«Сократ Персональный» – это предельно простая система для ознакомительного перевода небольших фрагментов текста. Ее козыри – ком­пактность и наличие встроенного электронного словаря, она нетребовательна к квалификации пользователя и максимально автоматизирована. Качество перевода этой системы не всегда высокое, но зато мало зависит от тематики текста. Соответственно, эта программа найдет применение при интенсивной работе с разнообразными иностранными текс­тами на ознакомительном уровне. Лучше всего поддаются переводу с ее помощью тексты интерактивной справки. Их смысл удается понять во всех случаях, а большинство предложений построены грамотно.

Также хорошие результаты можно получить при работе с деловыми письмами. Здесь сказываются хорошая сбалансированность словаря, большой запас экономической лексики, а также строгость и шаблонность делового стиля речи, под который, в частности, и настраивался программный алгоритм «Сократа».

Удовлетворительными можно считать результаты работы с документацией к программам и руководствами к бытовым приборам, однако понять их содержание, как правило, можно. Слабым местом программы являются научные тексты, личная переписка, разговорные темы и руководства к компьютерным играм. В первом случае сказывается отсутствие в составе «Сократа» словарей специальных терминов. Остальные же представляют собой естественное затруднение для всех систем машинного перевода, вызванное неформализованной лексикой, сложностью обо­ротов и стилистическим разнообразием указанных текстов.

2.3. Перевод в Интернете
Для облегчения просмотра страниц Интернета на незнакомом поль­зователю языке появились дополнения к браузерам, которые осуществляют немедленный перевод выбранных фрагментов просматриваемой Web-страницы. Достаточно лишь выделить часть текста мышкой и перенести ее на специальную панель либо нажать указателем на специальную кнопку меню. Примером такого переводчика является система Web Trans Site фирмы PROMT, созданная на базе программы Stylus, которая подключается как к браузеру Netscape Navigator, так и к браузеру MS Internet Explorer.

Онлайновый перевод информации в Интернете становится все более популярным. Интернет стремительно превращается из преимущественно англоязычной в многоязычную среду, что вынуждает владельцев Web-сайтов предоставлять информацию на нескольких языках. Наиболее часто к услугам СМП прибегают информационные и поисковые сайты, которые стремятся привлечь на свои страницы разноязычных пользователей. Так, на канадском информационно-поисковом портале InfiniT (http//www.infiniT.com) открылся новый сервис переводов. На сайте теперь доступен онлайновый перевод текста с английского и немецкого языков на французский язык и обратно.

Увеличение числа посетителей портала обусловлено возможностью онлайнового перевода Web-страниц. Для этого пользователю достаточно указать только адрес Web-страницы, выбрать направление перевода и нажать кнопку перевода. В результате через несколько секунд пользователь получает полностью переведенную Web-страницу с сохранением форматирования.

Новый сервис позволяет ликвидировать языковую проблему в канадском Интернете, где, в силу исторических особенностей, широко используются два языка – английский и французский. Кроме того, онлайновый переводчик открывает доступ к сайтам на немецком языке тем жи­телям Канады, которые не владеют иностранными языками.

Сервис работает на базе серверного Интернет-решения компании PROMT под названием PROMT Internet Translation Server version 2.0. Проект был реализован совместно с компанией Softissimo, которая зани­мается продвижением продуктов компании PROMT под торговой маркой REVERSO.

Интересной особенностью Web-сайтов, знакомящих с программами МП, электронными словарями и другими программами лингвистической поддержки, является то, что с работой многих программных продуктов можно ознакомиться в интерактивном режиме, используя версию, установленную на сервере и имеющую шлюз для удаленного общения через Web-интерфейс. На сервере Web-издательства «ИнфоАрт» (http//www.infoart.ru/misc/dict) организована интерактивная демонстрация словарей LINGVO (фирма «БИТ») и «МультиЛекс» (ЗАО «Медиалингва»). Вы можете ввести слово или словосочетание и мгновенно получить перевод, толкование, примеры употребления и устойчивые словосочетания.

С помощью программы «Сократ-Интернет» можно выполнять «син­хронный» перевод Web-страниц с сохранением их форматирования, однако в ней никаких средств управления настройками опций перевода нет. Браузер от компании «Арсеналъ» не позволяет подключать тематические словари, что сильно ухудшает качество перевода специальных текстов (их, кстати, в Интернете очень много). Простота использования, которой так добивались разработчики, отнюдь не пошла на пользу программе, потерявшей гибкость и управляемость, такие важные для систем машинного перевода. В итоге «Сократ-Интернет» существенно уступает продуктам PROMT по многим параметрам, в том числе и по самому важному – качеству выходного текста.

2.4. Электронные словари
Электронные словари (ЭС) начали разрабатываться значительно раньше, чем альтернативные им СМП, поэтому в настоящее время на рынке программного обеспечения имеется чрезвычайно широкий выбор словарей от самых простейших (например, DIC) до мощных систем, объединяющих в одной программной оболочке несколько лексических баз данных специализированных тематических словарей, последовательность подключения которых определяется пользователем (LINGVO, Lingvo.yandex.ru).

Наиболее распространенными сегодня являются следующие системы поддержки двуязычных словарей:

• WordSwitch фирмы Second Thought b.v.;

• Vertaal фирмы Vertaal Publishers b.v.;

• Euroglot фирмы Linguistic System (Нидерланды);

• MTX Termex фирмы Traswoord (США, Нидерланды);

• КОНТЕКСТ фирмы «Информатик»;

• LINGVO фирмы «БИТ»;

• POLYGLOSSUM фирмы ЭТС (Россия);

• DUE – разработка фирмы «Лингвистика 93» (Харьков).

Демо-версию словаря «Сократ» можно бесплатно скачать на сайте компании «Арсеналъ» (http://www.ars.ru/), предварительно заполнив регистрационную форму. В инсталляционный пакет входят только два словаря – общий англо-русский и общий русско-английский (объемом 55451 и 61959 слов соответственно), а остальные нужно покупать дополнительно, причем они весьма дороги – от 600 до 2000 рублей.

Система КОНТЕКСТ (http://www.informatic.ru) фирмы «Информатик» разработана для перевода слов и словосочетаний с английского языка на русский и наоборот. Кроме того, система предоставляет пользователю толкования терминов и синонимы русских слов, осуществляет вставку перевода или его синонима в нужное место. Обладая механизмом морфологического анализа, система находит переводы как русских, так и английских слов вне зависимости от их формы в тексте. Система предоставляет контексты употребления некоторых английских слов, что облегчает понимание их значения. Словари системы ориентированы на общеупотребительную лексику, а также на такие области, как компьютеры и бизнес.

Демонстрационную версию словаря можно скачать бесплатно. В ком­плект входят шесть словарей, способных осуществлять перевод с русского на английский и обратно. Поддерживаются пользовательские словари, автоматическое переключение языков, функция drag’n‘drop, перевод по «горячим клавишам», распознавание различных морфологических форм слова, перевод устойчивых словосочетаний (программа выводит список словосочетаний с определенным ключевым словом, что не очень удобно, так как порой список очень длинный).

Система LINGVO фирмы «БИТ» (http://www.lingvo.ru/) – англо-русские и русско-английские электронные словари, в том числе микрословари, охватывающие широкий тематический спектр: «авиация», «математика», «экономика», «компьютеры» и т. д. Система позволяет проводить поиск слов и словосочетаний, не прерывая выполнения текущей задачи. LINGVO обеспечивает задание приоритетов словарей при поиске, работу одновременно с несколькими словарями. Полученные от системы переводы слов автоматически вставляются в редактируемый текст. Пользователь может создавать собственные словари, каталоги, справочники.

Контрольные вопросы и задания
1. Понятие машинного перевода.

2. Требования, предъявляемые к результатам машинного перевода.

3. Определите «нуль-перевод», «черновой» и «белый» перевод.

4. В чем отличие машинных переводчиков от словарей?

5. Назовите основные машинные переводчики и словари.

6. Каковы причины допускаемых при машинном переводе ошибок?

7. Приведите классификацию электронных словарей по их техническим и эксплуатационным характеристикам.

8. В чем особенность перевода в сети Интернет?




  1   2   3   4   5   6   7   8   9

Добавить документ в свой блог или на сайт

Похожие:

Технологии обработки документов iconУчебное пособие Технологии обработки информации. Технологии хранения,...
Технологии обработки информации. Технологии хранения, поиска и сортировки информации в бд. Учеб. Пособие. М. МиигаиК, 2014. 31с
Технологии обработки документов iconСовершенствование процессов профилирования винтовых канавок и обработки...
Специальность 05. 02. 07 – Технологии и оборудование механической и физико-технической обработки
Технологии обработки документов iconРабочая программа по технологии ориентирована на освоение обучающимися...
«Технология», составленной на основе федерального компонента государственного стандарта основного общего образования, рекомендованной...
Технологии обработки документов iconРабочая программа учебной дисциплины «технологии обработки материалов»
Направление подготовки: 261400. 62 Технология художественной обработки материалов
Технологии обработки документов iconУрок технологии в 5 классе по теме «Технология обработки изделия»
Цели: обобщить знания учащихся по теме: «Технология обработки изделия», защитить презентацию
Технологии обработки документов iconУрок по разделам «Технология обработки ткани, изготовление поясного изделия»
Цели: повторение и систематизация знаний, закрепление умений и навыков по технологии обработки тканей и изготовлению поясного изделия,...
Технологии обработки документов iconПояснительная записка Тематический план дисциплины
Курс Практические работы по технологии обработки металлов дает студентам теоретические знания и помогает овладеть практическими умениями...
Технологии обработки документов iconТехнологии для организации внеаудиторной самостоятельной работы обучающихся
Но одновременно начинают широко использоваться компьютерные технологии, как для поиска нужной информации педагогами и обучающимися,...
Технологии обработки документов iconДокументирование управленческой деятельности
Делопроизводство составляет полный цикл обработки и движения документов с момента их создания (или получения) до завершения исполнения...
Технологии обработки документов iconЛабораторная работа №3
«Технологии обработки, автоматизированного реферирования и аннотирования текстов на естественном языке»
Технологии обработки документов iconОткрытые образовательные технологии
Технология совокупность приемов и способов получения, обработки и переработки сырья, материалов
Технологии обработки документов iconРабочая программа по технологии в 5-8 классах Учитель технологии: Писцова
М.: Мнемозина, 2012. Она рассматривает подготовку учениц основной школы по разделам «Кулинария», «Создание изделий из текстильных...
Технологии обработки документов iconВопросы к Государственному экзамену
Использование программ обработки текстов, компьютерной графики, макетирования и верстки при составлении рабочих документов, презентационных...
Технологии обработки документов iconСовременные автоматизированные технологии обработки разнородных информационных потоков
Акимова Г. П., Богданов Д. С., Мусатов И. В., Пашкин М. А., Солдатов Д. В., Сомин Н. В
Технологии обработки документов iconМосковский энергетический институт (технический университет)
Профиль(и) подготовки: Машины и технологии высокоэффективных процессов обработки материалов
Технологии обработки документов icon«Технологии изготовления и обработки художественных изделий»
Рабочая программа утверждена на заседании кафедры «Литейно-металлургические процессы и сплавы»


Школьные материалы


При копировании материала укажите ссылку © 2013
контакты
100-bal.ru
Поиск