Скачать 60.48 Kb.
|
УДК 81’33 АВТОМАТИЧЕСКОЕ РЕФЕРИРОВАНИЕ И АННОТИРОВАНИЕ ТЕКСТА Галуза И.В., Кузнецова А.В. Научный руководитель старший преподаватель Лабушева Т.М. Сибирский федеральный университет Ещё в школе каждый встречался с рефератами – кто-то их делал как домашнее задание, кто-то их читал у доски на оценку. Большинство учеников, услышав слово «реферат» при объявлении домашнего задания, начинал сожалеть о потерянном, на его составление, времени – ведь нужно несколько часов провести за поиском необходимой информации, её чтением, конспектированием и написанием. Но, как известно, технологии не стоят на месте. Теперь все это может сделать компьютер. Именно автоматизации процесса написания реферата посвящена эта статья, но сначала разберёмся с некоторыми терминами. Реферат – это краткое изложение, отражающее главную тему первоисточника, указанные цели и способы работы. Из жизни мы знаем, что реферат составляется к научным документам (книгам, статьям, документам и т.п.). Реферат помогает человеку быстро ознакомиться с поступившей к нему информацией и отобрать значимую часть. Сам процесс фиксации информации получил название реферирование. Аннотация — кратко составленное содержание и характеристика статьи, книги или любого другого источника. В аннотации к произведению указываются его особенности и достоинства. Процессом написания содержания и характеристики статьи является аннотирование. Составление рефератов (реферирование) и аннотаций (аннотирование) занимает очень много времени. В результате до специалистов новая информация доходит в течение длительного времени, это чревато тем, что информация теряет актуальность. Во избежание этого, в современном мире для составления рефератов все чаще и чаще используют компьютерные системы. Относясь к фундаментальным технологиям искусственного интеллекта, автоматическое реферирование является одним из направлений компьютерной обработки естественного языка. Для того, чтобы компьютер мог составлять качественные рефераты, ему необходимо уметь следующее:
Ключевое слово — слово, повторяющееся несколько раз и несущее основную тематику текста, с учетом синонимов. Ключевое словосочетание — это словосочетание, собранное из одного и более ключевых слов. Ключевое предложение — предложение, содержащее в себе более одного ключевого слова или словосочетания.» (информация пункта взята из источника №1)
«Смысловыми единицами аннотации могут быть:
(информация пунктов “a”-“c” взята из источника №2)
На сегодня почти все системы авто-реферирования текстов используют ключевые единицы реферируемой статьи, являющиеся составляющими текста реферата и используемые системой для составления табличных рефератов. Аннотации, составленные компьютером, также имеют ключевые единицы. Имеется несколько методов выделения из реферируемого текста ключевых единиц. Самые распространенные из них:
Статический метод основывается на том, что:
При помощи статистических коэффициентов система определяет принадлежность какой-либо единицы к понятию «ключевая». Позиционные методы базируются на ключевых предложениях, т.е. таких, которые присутствуют в заголовках, начале, конце или каких-либо других частях текста. В них содержится важная информация, взятая из источника. Изучая семантику реферируемого источника, эксперты определяют важность этих предложений. На исследовании структуры и семантики текстов базируются логико-семантические методы. Несмотря на наличие нескольких вариантов этого метода, все они преследуют одну цель — выделение из текста первоисточника предложений, имеющих, по сравнению с другими, наибольший функциональный вес. Эта параметр зависит от большого числа факторов: смысловой зависимости предложения от других, имеет ли предложение значимые семантические слова, фразеологизмы и т.п. Чаще всего прикладная лингвистика используется интернет сервисами-переводчиками. Авто-реферирование текстов может быть полезным дополнением к программному арсеналу пользователя. Качество работы таких программ зависимы от огромного числа языковых особенностей. Это усложняет решение многих задач, связанных с автоматическим реферированием текста. И в Интернете трудно найти универсальный и бесплатный сервис для решения таких проблем. Однако, несколько вариантов все же есть. Приведем несколько примеров систем, осуществляющих авто-реферирования текста. (информация из источника №3) Например, сервис “Visualworld”, Здесь, помимо других интересных возможностей, реализована служба «Рефератор» (visualworld.ru/referat.jsp). Она способна обрабатывать любой предложенный текст и моментально его легко читаемый пересказ. Результат работы службы разделяет страницу на две колонки: слева показан исходный текст, справа – его краткий пересказ. Так же можно управлять объемом полученного реферата, регулируя степень сжатия от 40 до 90%. Эта служба работает по принципу извлечения из исходного текста отдельных смысловых фрагментов и формируя из них список. Такой принцип имеет небольшой недостаток: иногда «Рефератор» делит большие предложения, и это может повлиять на его понятливость. (текст взят из романа Л.Н. Толстого «Война и мир») На практике полезен и англоязычный сервис “WikiSummarizer” (www.wikisummarizer.com), специализирующийся на обработке научных и энциклопедических статей. Составленный реферат вполне годен к прочтению и предоставляет полное впечатление о статье. Сервис удобен и тем, что показывает результат работы алгоритма в трех режимах:
Подведём итоги. С развитием компьютерных технологий, появляется все больше решений различного рода проблем, которые доставляли неудобства человеку. Современные компьютерные сервисы могут решать многие из них. Например, составлять рефераты и аннотации к любому тексту. Такие процессы называются авто-реферирование и автоаннотирование. Основой их работы являются ключевые фрагменты текста, несущие смысловую нагрузку и называемые «единицами». По способам извлечения таких единиц из текста наиболее распространены три метода: статический, позиционный и логико-семантический. Так же необходимо понимать, что совершенной, универсальной и, к тому же, бесплатной системы авто-реферирования текста на данный момент не существует по причине того, что автоматический процесс написания рефератов усложнен особенностями каждого из языков. Но в Интернете можно найти несколько неплохих систем со своими плюсами и минусами. Пользуйтесь ими, составляйте рефераты и аннотации, тратя минимум времени и помните, компьютерные технологии не стоят на месте. Список литературы: |
Автоматическое реферирование и аннотирование текста Он помогает человеку ориентироваться в информационных потоках, оперативно отбирать для себя наиболее ценную и полезную информацию.... | Л екция №5 Автоматическое реферирование и аннотирование Под аннотацией понимается краткая характеристика произведения печати или рукописи. Обычно аннотация приводится после библиографического... | ||
Лингвометодический аспект обучения аспирантов реферированию научных текстов В этих условиях популярными и довольно эффективными в методическом плане становятся и такие разновидности компрессии текста, как... | Аннотирование и реферирование как основные аспекты формирования письменной... | ||
Н. А. Фролова федеральное агентство по образованию Фролова Н. А. Реферирование и аннотирование текстов по специальности (на материале немецкого языка): Учеб пособие / Волггту, Волгоград,... | А. В. Игнатовская Так, приводя пример вторичных текстов, Л. М. Майданова ставит в этот ряд и адаптации: «Таковы пересказ, аннотирование, реферирование,... | ||
Учебной дисциплины «Реферирование и аннотирование текстов на иностранном... Программа предназначена для обучения студентов 3 курса указанного профиля и направления. Дисциплина предшествует изучению курсов... | Методические указания (Английский язык) удк: Реферирование научно-технического текста: При отборе материала учитывались информативный и познавательный характер текстов, их стиль, терминологическая насыщенность, а также... | ||
Требования к реферату по социологии требования к написанию реферата Реферат – одна из форм интерпретации исходного текста или нескольких источников. Реферирование предполагает изложение какого- либо... | Автоматическое управление и идентификация Пятьдесят лет факультету летательных аппаратов нгту 3 | ||
Универсальное автоматическое электронное устройство для обработки,... | Уроку II. Актуализация знаний учащихся Рассказать учащимся о преимуществах компьютерного текста перед рукописными и машинописными текстами; познакомить детей с понятием... | ||
Работа с фрагментами текста ... | Программа по формированию навыков безопасного поведения на дорогах... Автоматическое составление основного расписания и его корректировка с учетом норм СанПиН 4 2821-10 | ||
Методы организации познавательной деятельности Методами организации познавательной деятельности с учебно-научным текстом являются лингвосмысловой анализ текста, перекодирование... | Информационные технологии и анализ художественного текста Выпускная... Ит при анализе художественного текста определяется актуальность изучения данной темы. В настоящем реферате будут рассмотрены вспомогательные... |