Лекция 11. Прикладная лингвистика. Моделирование языковых процессов. Лингвистические аспекты искусственного интеллекта. Текстовые процессоры. Искусственные языки. Лингвостатистические методы. Новые информационные технологии





НазваниеЛекция 11. Прикладная лингвистика. Моделирование языковых процессов. Лингвистические аспекты искусственного интеллекта. Текстовые процессоры. Искусственные языки. Лингвостатистические методы. Новые информационные технологии
страница3/5
Дата публикации21.01.2015
Размер0.55 Mb.
ТипЛекция
100-bal.ru > Литература > Лекция
1   2   3   4   5

Модели языка. В настоящее время принято говорить о трех типах моделей языка. Первый — это модели, воспроизводящие тот или иной тип речевой деятельности: понимания (анализа) текста, по­рождения речевых произведений (синтеза), автоматического пере­вода; обучающие модели языка; интеллектуальные системы разных типов, использующие диалог на естественном языке, и т.д. Второй тип моделей — речевые произведения, являющиеся обязательными компонентами любых типов речевой деятельности, а следовательно, и обязательными компонентами любых ее моделей. Третьим типом моделей являются модели собственно языкового механизма, кото­рые воспроизводят языковые закономерности понимания и постро­ения речевых произведений. Вопросы моделирования излагаются здесь в соответствии с мнениями М.И. Откупщиковой, Л.В. Бондар-ко, В.Д. Буторова, В.В. Богданова.

Проблемы моделирования. Основные трудности моделирования различных видов речевой деятельности связаны с тем, что речевые произведения — тексты — моделируют действительный мир. Отсюда следует практическая невозможность создания универсальной моде ли, воспроизводящей все виды речевого поведения человека и анали­зирующей/синтезирующей любые тексты, описывающие все миры действительности, реальные и нереальные.

Обычные лингвистические описания структуры языка могут быть классифицированы как интеллектуальные структурные моде­ли. Для ряда социально значимых целей эти модели оказываются высокоэффективными. Они используются для обучения родному и неродному языку, для перевода и редактирования. Очевидно, что они рассчитаны на интеллект человека, способный широко исполь­зовать так называемую интуицию, т.е. ассоциации, прошлый опыт, догадки и т.д.

Следует отметить, что в плане создания таких моделей лингвис­тика накопила материал, которому может позавидовать любая дру­гая наука и который, несомненно, должен в той или иной мере быть использован при разработке компьютерных моделей речевого поведения.

Сложившаяся в последнее время практика моделирования систем речевого поведения, ориентированных на узкую предметную об­ласть, получает теоретическое обоснование в идеях о моделировании мира при помощи речевых произведений. Однако следует подчерк­нуть, что даже при ориентации компьютерной системы на узкую предметную область эффективность и сама возможность автоматиче­ской обработки достаточно большого количества текстов существен­но зависит от полноты, универсальности модели языкового механиз­ма. Поэтому возникает необходимость построения общей такой модели, являющейся важнейшим компонентом компьютерной моде­ли речевого поведения.

Кроме создания математических моделей языка, являющихся компонентом математического обеспечения, для компьютерных мо­делей речевого поведения требуется разработка структурных лингви­стических моделей, воспроизводящих процессы функционирования языкового механизма, а также структурных моделей, воспроизводя­щих структуру языкового механизма. В отличие от обычных лингви­стических описаний, эти модели должны отвечать требованиям точ­ности, адекватности, простоты, компактности, непротиворечивости и полноты.
Моделироваие уровней языка.
Уровни языка — некоторые фрагменты языка, подсистемы обшей языковой системы, каждая из которых характеризуется сово­купностью относительно однородных единиц и набором правил, ре­гулирующих их использование и группировку в различные классы и подклассы.
Моделирование звуковой формы языка. Звуковая форма существова­ния языка является основной и исходной для любого естественного языка. Это определяет особую роль фонетических исследований в прикладной лингвистике. Можно говорить об основных направле­ниях в изучении звуковой формы языковых единиц, к которым от­носятся:

  1. анализ акустических характеристик речевого сигнала — для со­здания систем передачи речи по каналам связи, для разработки про­цедур автоматического распознавания и синтеза речи, для улучшения методики восстановления речи и слуха у больных с соответствующи­ми нарушениями;

  2. анализ артикуляторных характеристик процессов речепроизвод­ства — для выявления механизмов управления произносительными органами со стороны соответствующих центров коры головного моз­га, что облегчает понимание процессов, характеризующих высшую нервную деятельность человека. Такое понимание имеет и практиче­ское значение при лечении больных, страдающих различными фор­мами нарушения речи. Многие исследователи считают сведения о ме­ханизмах речеобразования очень важными для построения систем автоматического распознавания и синтеза речи;

3) исследование процессов восприятия речевых сообщений слу­ховой системой человека, важное как для оценки значимости акус­тических свойств этих сообщений, так и для построения модели слуховой обработки речевого сигнала. Такого рода исследования чрезвычайно важны для специалистов и в области записи и переда­чи речевых сообщений, и в области автоматического распознаванияи синтеза речи.

Все перечисленные направления в изучении свойств речевого сигнала имеют огромное значение при обучении родному или нерод­ному языку. Значительное место в этой проблеме занимают выработ­ка орфоэпических навыков, устранение диалектных и просторечных явлений, а также постановка так называемого сценического произ­ношения.

Моделирование синтаксической структуры языка. Синтаксический анализ предложения — необходимый этап автоматической обработки текста или речи при решении различного рода задач в прикладной лингвистике. Целью синтаксического анализа является распознава­ние синтаксической структуры предложения или отдельных его час­тей. К основным проблемам моделирования синтаксиса в приклад­ной лингвистике относятся представление синтаксических структур естественного языка и разработка оптимальных методов (алгоритмов) синтаксического анализа, ориентированных на то или иное представ­ление синтаксической структуры.

В настоящее время широко используются три основных способа представления синтаксической структуры предложения, а именно представление ее как: 1) структуры составляющих (дерева непосред­ственно составляющих); 2) структуры зависимостей (дерева зависи­мостей); 3) структуры, совмещающей свойства структур зависимостей и составляющих (ориентированной структуры составляющих).

Моделирование семантики. При моделировании семантики пред­ложения прежде всего возникает вопрос о том, что считать смыслом предложения. Однозначного ответа на него в настоящее время не су­ществует. Однако большинство исследователей сходится на том, что смысл предложения представляет собой сложное, многоаспектное образование. В содержании предложения сложнейшим образом сфо­кусированы характеристики экстралингвистической действительнос­ти, ее отражения в сознании человека в виде концептуальных струк­тур, коммуникативных установок участников общения, а также особенности самого языка. При моделировании семантики предло­жения каждый из названных аспектов может получить статус исход­ного или даже единственного, если прочие аспекты по каким-либо соображениям не рассматриваются. В зависимости от того, какой исходный аспект кладется в основу моделирования семантики пред­ложения, возможны, в принципе, четыре подхода: онтологоцентриче-ский, концептоцентрический, синтактикоцентрический, антропо­центрический. В рамках каждого из них существует некоторая система воззрений, разработанных с различной степенью детальнос­ти. Поэтому важно выявить фундаментальные принципы и постула­ты, которыми можно руководствоваться, строя теорию с преимущест­венной ориентацией на какой-нибудь один аспект.

Моделирование статичтическиз параметров языка. На фоне непреходящего интереса лингвистов к технике обработки данных в настоя­щее время на первый план выдвигается вопрос о месте и роли статис­тического метода в лингвистике и особенностях его применения к решению конкретных задач. Не теряет актуальности и попытка разо­браться в том, на что может претендовать статистический метод и на что он претендовать не может.

В статистическом методе — универсальном методе познания дей­ствительности — оптимально отражены взаимоотношения между субъектом и объектом исследования, объектом и методом, объектом и знанием о нем. Позиция исследователя при этом характеризуется объективностью, беспристрастностью, а его интерес к объекту дикту­ется прежде всего практическими, прикладными целями, например задачей автоматического индексирования текста, его дешифровки или атрибуции.

В результате взаимодействия исследователя с объектом рождается статистическое знание, обладающее свойствами, вытекающими из позиции и интереса исследователя (объективность, прагматичность), а также объекта исследования (системность, стохастичность, симпто­матичность, многомерность, конкретность, количественность) и ме­тода исследования (строгость, приближенность, верифицируемость). Обращает на себя внимание тот факт, что метод взаимодействует не только с объектом, но и добытым знанием, отсюда свойство верифицируемости знания.

Моделирование уровня текста. К актуальным проблемам модели­рования уровневой структуры языка, прежде всего уровня текста, относится компьютерная обработка древних рукописей и подготов­ка их к последующему изданию, что имеет большое историко-куль­турное значение. Немало рукописей на восточных, германских, ро­манских, славянских языках дошли до нас из глубины веков. Изучением древних рукописей занимаются специалисты самых раз­ных профессий: филологи, историки, этнографы, географы, эконо­мисты, социологи. С точки зрения лингвистов, целью подлинно на­учной истории языка является строгое объективное воссоздание системы языка текстов.

Синхронное моделирование систем языка древних текстов преду­сматривает построение различных моделей на уровне морфологии, лексики. Такие модели могут быть как собственно морфологически­ми, ареально-типологическими, функционально-семантическими, так и хронологически-статистическими, описательными, формаль­ными. При этом надо различать исследования, направленные, с од­ной стороны, на построение системы языка как таковой, а с другой — на воссоздание истории текста. При моделировании системы языка главным является выявление основных доминирующих типов и тен­денций; здесь наиболее показательны морфология, высокочастотные факты в статистике. История памятника связана с проблемами атри­буции текста, где главное — выделение диагностических различитель­ных его признаков. Наиболее показательны в этом отношении пись­мо текста, его лексика, синтаксис, собственно стилистика, редкие факты статистики.

В процессе моделирования языка особое место занимают слово­указатели к древним памятникам литературы. Они нужны языко­ведам, литературоведам, историкам, этнографам, поскольку дают полное представление о лексике памятника, о типах слов и форм по их структуре, о характере применения титл, о видах использова­ния графем и их последовательностях. Словоуказатели демонстри­руют абсолютную частоту словоформы в тексте и в целом позволя­ют судить об общем семантическом характере приведенных слов. Идя по пути создания полных словоуказателей, реестров грамма­тических форм, конкордансов и словарей к отдельным памятникам (центрам письменности), сопоставляя затем между собой словни­ки и словари текстов и зон, изученных лучше других, мы придем постепенно к относительно полной картине ареального и жанрово­го распределения лексики памятников письменности и сможем бо­лее уверенно говорить о неологизмах изводов, школ и авторов от­дельных текстов.

Актуальной нерешенной проблемой в сфере составления автома­тических словарей является автоматическое сведение словоформ к канонической (словарной) форме. Не говоря уже о трудности опреде­ления грамматической характеристики словоформы, следует отме­тить проблему отождествления графических вариантов одной и той же формы слова. Предпринимавшиеся в этой области усилия пока плодов не принесли, и единственной надежной процедурой сведения словоформ к канонической форме, к сожалению, является ручное постредактирование полученного словаря.
Искусственный интеллект.
Искусственный интеллект — условное обозначение ком­пьютерных систем, моделирующих некоторые стороны интеллекту­альной деятельности человека, его логическое, аналитическое мыш­ление.

Искусственный интеллект: ДА ИЛИ НЕТ? В 1950-х гг. был поставлен вопрос: можно ли научить машину мыслить, как человек, или, другими словами, можно ли создать искусственный интеллект? Ответ на него получить далеко не так просто, как это может показаться на первый взгляд. Сложность вопроса связана с тем, что мы очень плохо пред­ставляем себе, как человек мыслит. Общей теории мышления в насто­ящее время не существует. Более того, мы даже не знаем, что такое мышление, нет его определения, по крайней мере такого, которое удовлетворило бы одновременно философов, психологов, инжене­ров, лингвистов, а также других специалистов, участвующих в реше­нии задач искусственного интеллекта.

Хотя различные исследователи по-разному определяют набор сво­их задач, тем не менее существует «устойчивая сердцевина» — пробле­мы, которые практически всеми специалистами включаются в число задач искусственного интеллекта. К таковым относятся, как считает И.П. Панков, решение задач, принятие решений, распознавание об­разов.

Решение задач. Этот термин объединяет многие проблемы: от до­казательства теорем высшей алгебры и решения задач из учебника физики 6-го класса средней школы до бытовых проблем, например какой можно приготовить обед из имеющихся продуктов. Разумеет­ся, здесь речь идет не о непосредственном решении упомянутых вы­ше задач, а о нахождении общего механизма, который использует человек для решения подобных задач, т.е. не о решении задач, а о моделировании этого процесса.

Пока исследуются вопросы, в основном касающиеся моделирова­ния решения различных математических задач. Это связано в первую очередь с тем, что математические задачи проще поддаются формали­зации. Кроме того, для общего решения проблемы следует разобрать­ся с тем, каким образом человек проводит рассуждения, осуществляет логический вывод. Для моделирования решения только математичес­ких задач можно использовать формальную (математическую) логику. Однако для общего решения этой проблемы математическая логика (точнее, только математическая логика) вряд ли подойдет: человек пользуется логикой, весьма отличающейся от формальной. Это не зна­чит, что люди не пользуются формальной логикой (или чем-то вроде этого), но они явно используют что-то еще для логических преобразо­ваний. Вероятно, мир, где господствовала бы только формальная логи­ка, был бы очень скучен. Но если математическая логика — это хоро­шо разработанная научная дисциплина, то «логика человека» остается почти не исследованной.

Принятие решений. Эта проблема в основном рассматривается на материале стратегических игр, таких, как шахматы, шашки, го и т.д.

Работы по моделированию игр осуществляются отнюдь не только для развлечения скучающей публики. Скорее наоборот. Коммерческие программы, играющие в шахматы и другие игры, являются «побоч­ным эффектом» работ такого рода. Дело в том, что «правила игры» су­ществуют не только для перемещения фигур по шахматной доске, но и для размещения сырья и оборудования по предприятиям, передви­жения полков и армий по театру военных действий, перемещения де­нежных средств по финансовой системе и т.д.

Выработка общих методов принятия решения о выборе в каждом конкретном случае правил, которые приводят к наилучшим результа­там (т.е. нахождение оптимальной стратегии), не только дает возмож­ность создать эффективные автоматизированные системы управле­ния, экспертные системы, но и вносит свой вклад в общую теорию мышления.

Распознавание образов. Человеку свойственно классифициро­вать окружающий его материальный мир. Бесчисленное множество различных объектов он объединяет в группы. Два различных ябло­ка, не очень похожих друг на друга, человек называет одним сло­вом — яблоко. А груша, может быть, очень похожая на яблоко, тем не менее — груша.

Предполагается, что в процессе мышления человек создает некие эталонные образы объектов и групп объектов, с которыми имеет дело, и, сравнивая образ рассматриваемого объекта с эталонными образа­ми, относит этот объект к той или иной группе. Такое действие и на­зывается распознаванием образов.

Самое главное для решения проблемы распознавания образов — это найти ответ на два очень сложных вопроса: как создается эта­лонный образ (т.е. как человек членит, классифицирует мир) и ка­кие отличия образа объекта от эталона являются существенными, а какие нет?

Человек имеет различные каналы получения информации об окру­жающей его действительности — зрительный, слуховой, осязатель­ный и др., поэтому у него могут формироваться образы различных ти­пов, и проблема их распознавания распадается на отдельные проблемы: распознавание зрительных образов, распознавание акус­тических образов и т.д.

Не следует думать, что эти исследования так и остались исследовательской абстракцией. Наиболее простой и понятный пример применения данных разработок для широкого использования – это системы оптического распознавания текста (тот же Файнридер).
1   2   3   4   5

Похожие:

Лекция 11. Прикладная лингвистика. Моделирование языковых процессов. Лингвистические аспекты искусственного интеллекта. Текстовые процессоры. Искусственные языки. Лингвостатистические методы. Новые информационные технологии iconРабочая программа дисциплины опд. В. 02 «Практика аудирования» для...
«Лингвистика и новые информационные технологии», специальности 031301. 65 «Теоретическая и прикладная лингвистика», введённому в...
Лекция 11. Прикладная лингвистика. Моделирование языковых процессов. Лингвистические аспекты искусственного интеллекта. Текстовые процессоры. Искусственные языки. Лингвостатистические методы. Новые информационные технологии iconЛекция Текстовые процессоры (или текстовые редакторы)
Работа с таблицей: вставка таблицы через меню Таблица, через кнопку на панели инструментов Стандартная
Лекция 11. Прикладная лингвистика. Моделирование языковых процессов. Лингвистические аспекты искусственного интеллекта. Текстовые процессоры. Искусственные языки. Лингвостатистические методы. Новые информационные технологии iconПрограмма дисциплины «Миграционная политика в России и за рубежом. Лингвистические аспекты»
Программа предназначена для преподавателей, ведущих данную дисциплину, и студентов направления подготовки 45. 04. 03 «Фундаментальная...
Лекция 11. Прикладная лингвистика. Моделирование языковых процессов. Лингвистические аспекты искусственного интеллекта. Текстовые процессоры. Искусственные языки. Лингвостатистические методы. Новые информационные технологии iconВ. К. Финн к структурной когнитологии: феноменология сознания с точки...
Ки и искусственного интеллекта – полигона экспериментальной проверки научных средств имитации рациональности и продуктивного мышления....
Лекция 11. Прикладная лингвистика. Моделирование языковых процессов. Лингвистические аспекты искусственного интеллекта. Текстовые процессоры. Искусственные языки. Лингвостатистические методы. Новые информационные технологии iconРабочая программа по курсу «Имитационное моделирование экономических...
«Имитационное моделирование экономических процессов» составлена в соответствии с требованиями государственного образовательного стандарта...
Лекция 11. Прикладная лингвистика. Моделирование языковых процессов. Лингвистические аспекты искусственного интеллекта. Текстовые процессоры. Искусственные языки. Лингвостатистические методы. Новые информационные технологии iconСамостоятельная работа: 76 час. Итоговый контроль: экзамен I. Организационно-методический...
Цель дисциплины – познакомить студентов с основными задачами искусственного интеллекта, как области человеческой деятельности
Лекция 11. Прикладная лингвистика. Моделирование языковых процессов. Лингвистические аспекты искусственного интеллекта. Текстовые процессоры. Искусственные языки. Лингвостатистические методы. Новые информационные технологии iconВалентин Юрьевич Технологии и системы искусственного Выпускная работа...
В условиях резкого увеличения объемов информации переход к работе со знаниями на основе искусственного интеллекта является, по всей...
Лекция 11. Прикладная лингвистика. Моделирование языковых процессов. Лингвистические аспекты искусственного интеллекта. Текстовые процессоры. Искусственные языки. Лингвостатистические методы. Новые информационные технологии iconНовые информационные и педагогические технологии
...
Лекция 11. Прикладная лингвистика. Моделирование языковых процессов. Лингвистические аспекты искусственного интеллекта. Текстовые процессоры. Искусственные языки. Лингвостатистические методы. Новые информационные технологии iconПояснительная записка: Цели и задачи дисциплины. Дисциплина «Языки программирования»
Ступников А. А. Языки программирования. Учебно-методический комплекс. Рабочая программа для студентов очной формы обучения, направления...
Лекция 11. Прикладная лингвистика. Моделирование языковых процессов. Лингвистические аспекты искусственного интеллекта. Текстовые процессоры. Искусственные языки. Лингвостатистические методы. Новые информационные технологии iconРеферат по информатике на тему История и тенденции развития искусственного интеллекта
На сегодняшний день проблема исследования ai занимает актуальное место в системе информационных наук. В своем реферате я попытаюсь...
Лекция 11. Прикладная лингвистика. Моделирование языковых процессов. Лингвистические аспекты искусственного интеллекта. Текстовые процессоры. Искусственные языки. Лингвостатистические методы. Новые информационные технологии iconРабочая программа по курсу «Имитационное моделирование экономических...
«Имитационное моделирование экономических процессов» составлена в соответствии с требованиями государственного образовательного стандарта...
Лекция 11. Прикладная лингвистика. Моделирование языковых процессов. Лингвистические аспекты искусственного интеллекта. Текстовые процессоры. Искусственные языки. Лингвостатистические методы. Новые информационные технологии iconМоделирование в химической технологии, расчет химических реакторов
Методы оптимизации химико-технологических процессов и нахождения экстремума функций
Лекция 11. Прикладная лингвистика. Моделирование языковых процессов. Лингвистические аспекты искусственного интеллекта. Текстовые процессоры. Искусственные языки. Лингвостатистические методы. Новые информационные технологии iconТема: Текстовые документы и текстовые процессоры
Знакомство с отраслями использования текстовых документов обеспечить применение знаний и способов действий в разнообразных ситуациях...
Лекция 11. Прикладная лингвистика. Моделирование языковых процессов. Лингвистические аспекты искусственного интеллекта. Текстовые процессоры. Искусственные языки. Лингвостатистические методы. Новые информационные технологии iconПрограмма по формированию навыков безопасного поведения на дорогах...
Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов направления подготовки 010400....
Лекция 11. Прикладная лингвистика. Моделирование языковых процессов. Лингвистические аспекты искусственного интеллекта. Текстовые процессоры. Искусственные языки. Лингвостатистические методы. Новые информационные технологии iconРабочая программа учебной дисциплины изотопная геохимия специальность:...
«Прикладная геохимия, петрология, минералогия» в течение 6 семестра после прохождения курсов «Химия», «Общая геология», «Кристаллохимия»,...
Лекция 11. Прикладная лингвистика. Моделирование языковых процессов. Лингвистические аспекты искусственного интеллекта. Текстовые процессоры. Искусственные языки. Лингвостатистические методы. Новые информационные технологии iconПрограмма дисциплины «Лингвистические и логические задачи» для направления...
Составитель – Т. Н. Ермакова, кандидат юридических наук, старший преподаватель кафедры уголовно-правовых дисциплин Вятггу


Школьные материалы


При копировании материала укажите ссылку © 2013
контакты
100-bal.ru
Поиск