Скачать 0.55 Mb.
|
Модели языка. В настоящее время принято говорить о трех типах моделей языка. Первый — это модели, воспроизводящие тот или иной тип речевой деятельности: понимания (анализа) текста, порождения речевых произведений (синтеза), автоматического перевода; обучающие модели языка; интеллектуальные системы разных типов, использующие диалог на естественном языке, и т.д. Второй тип моделей — речевые произведения, являющиеся обязательными компонентами любых типов речевой деятельности, а следовательно, и обязательными компонентами любых ее моделей. Третьим типом моделей являются модели собственно языкового механизма, которые воспроизводят языковые закономерности понимания и построения речевых произведений. Вопросы моделирования излагаются здесь в соответствии с мнениями М.И. Откупщиковой, Л.В. Бондар-ко, В.Д. Буторова, В.В. Богданова. Проблемы моделирования. Основные трудности моделирования различных видов речевой деятельности связаны с тем, что речевые произведения — тексты — моделируют действительный мир. Отсюда следует практическая невозможность создания универсальной моде ли, воспроизводящей все виды речевого поведения человека и анализирующей/синтезирующей любые тексты, описывающие все миры действительности, реальные и нереальные. Обычные лингвистические описания структуры языка могут быть классифицированы как интеллектуальные структурные модели. Для ряда социально значимых целей эти модели оказываются высокоэффективными. Они используются для обучения родному и неродному языку, для перевода и редактирования. Очевидно, что они рассчитаны на интеллект человека, способный широко использовать так называемую интуицию, т.е. ассоциации, прошлый опыт, догадки и т.д. Следует отметить, что в плане создания таких моделей лингвистика накопила материал, которому может позавидовать любая другая наука и который, несомненно, должен в той или иной мере быть использован при разработке компьютерных моделей речевого поведения. Сложившаяся в последнее время практика моделирования систем речевого поведения, ориентированных на узкую предметную область, получает теоретическое обоснование в идеях о моделировании мира при помощи речевых произведений. Однако следует подчеркнуть, что даже при ориентации компьютерной системы на узкую предметную область эффективность и сама возможность автоматической обработки достаточно большого количества текстов существенно зависит от полноты, универсальности модели языкового механизма. Поэтому возникает необходимость построения общей такой модели, являющейся важнейшим компонентом компьютерной модели речевого поведения. Кроме создания математических моделей языка, являющихся компонентом математического обеспечения, для компьютерных моделей речевого поведения требуется разработка структурных лингвистических моделей, воспроизводящих процессы функционирования языкового механизма, а также структурных моделей, воспроизводящих структуру языкового механизма. В отличие от обычных лингвистических описаний, эти модели должны отвечать требованиям точности, адекватности, простоты, компактности, непротиворечивости и полноты. Моделироваие уровней языка. Уровни языка — некоторые фрагменты языка, подсистемы обшей языковой системы, каждая из которых характеризуется совокупностью относительно однородных единиц и набором правил, регулирующих их использование и группировку в различные классы и подклассы. Моделирование звуковой формы языка. Звуковая форма существования языка является основной и исходной для любого естественного языка. Это определяет особую роль фонетических исследований в прикладной лингвистике. Можно говорить об основных направлениях в изучении звуковой формы языковых единиц, к которым относятся:
3) исследование процессов восприятия речевых сообщений слуховой системой человека, важное как для оценки значимости акустических свойств этих сообщений, так и для построения модели слуховой обработки речевого сигнала. Такого рода исследования чрезвычайно важны для специалистов и в области записи и передачи речевых сообщений, и в области автоматического распознаванияи синтеза речи. Все перечисленные направления в изучении свойств речевого сигнала имеют огромное значение при обучении родному или неродному языку. Значительное место в этой проблеме занимают выработка орфоэпических навыков, устранение диалектных и просторечных явлений, а также постановка так называемого сценического произношения. Моделирование синтаксической структуры языка. Синтаксический анализ предложения — необходимый этап автоматической обработки текста или речи при решении различного рода задач в прикладной лингвистике. Целью синтаксического анализа является распознавание синтаксической структуры предложения или отдельных его частей. К основным проблемам моделирования синтаксиса в прикладной лингвистике относятся представление синтаксических структур естественного языка и разработка оптимальных методов (алгоритмов) синтаксического анализа, ориентированных на то или иное представление синтаксической структуры. В настоящее время широко используются три основных способа представления синтаксической структуры предложения, а именно представление ее как: 1) структуры составляющих (дерева непосредственно составляющих); 2) структуры зависимостей (дерева зависимостей); 3) структуры, совмещающей свойства структур зависимостей и составляющих (ориентированной структуры составляющих). Моделирование семантики. При моделировании семантики предложения прежде всего возникает вопрос о том, что считать смыслом предложения. Однозначного ответа на него в настоящее время не существует. Однако большинство исследователей сходится на том, что смысл предложения представляет собой сложное, многоаспектное образование. В содержании предложения сложнейшим образом сфокусированы характеристики экстралингвистической действительности, ее отражения в сознании человека в виде концептуальных структур, коммуникативных установок участников общения, а также особенности самого языка. При моделировании семантики предложения каждый из названных аспектов может получить статус исходного или даже единственного, если прочие аспекты по каким-либо соображениям не рассматриваются. В зависимости от того, какой исходный аспект кладется в основу моделирования семантики предложения, возможны, в принципе, четыре подхода: онтологоцентриче-ский, концептоцентрический, синтактикоцентрический, антропоцентрический. В рамках каждого из них существует некоторая система воззрений, разработанных с различной степенью детальности. Поэтому важно выявить фундаментальные принципы и постулаты, которыми можно руководствоваться, строя теорию с преимущественной ориентацией на какой-нибудь один аспект. Моделирование статичтическиз параметров языка. На фоне непреходящего интереса лингвистов к технике обработки данных в настоящее время на первый план выдвигается вопрос о месте и роли статистического метода в лингвистике и особенностях его применения к решению конкретных задач. Не теряет актуальности и попытка разобраться в том, на что может претендовать статистический метод и на что он претендовать не может. В статистическом методе — универсальном методе познания действительности — оптимально отражены взаимоотношения между субъектом и объектом исследования, объектом и методом, объектом и знанием о нем. Позиция исследователя при этом характеризуется объективностью, беспристрастностью, а его интерес к объекту диктуется прежде всего практическими, прикладными целями, например задачей автоматического индексирования текста, его дешифровки или атрибуции. В результате взаимодействия исследователя с объектом рождается статистическое знание, обладающее свойствами, вытекающими из позиции и интереса исследователя (объективность, прагматичность), а также объекта исследования (системность, стохастичность, симптоматичность, многомерность, конкретность, количественность) и метода исследования (строгость, приближенность, верифицируемость). Обращает на себя внимание тот факт, что метод взаимодействует не только с объектом, но и добытым знанием, отсюда свойство верифицируемости знания. Моделирование уровня текста. К актуальным проблемам моделирования уровневой структуры языка, прежде всего уровня текста, относится компьютерная обработка древних рукописей и подготовка их к последующему изданию, что имеет большое историко-культурное значение. Немало рукописей на восточных, германских, романских, славянских языках дошли до нас из глубины веков. Изучением древних рукописей занимаются специалисты самых разных профессий: филологи, историки, этнографы, географы, экономисты, социологи. С точки зрения лингвистов, целью подлинно научной истории языка является строгое объективное воссоздание системы языка текстов. Синхронное моделирование систем языка древних текстов предусматривает построение различных моделей на уровне морфологии, лексики. Такие модели могут быть как собственно морфологическими, ареально-типологическими, функционально-семантическими, так и хронологически-статистическими, описательными, формальными. При этом надо различать исследования, направленные, с одной стороны, на построение системы языка как таковой, а с другой — на воссоздание истории текста. При моделировании системы языка главным является выявление основных доминирующих типов и тенденций; здесь наиболее показательны морфология, высокочастотные факты в статистике. История памятника связана с проблемами атрибуции текста, где главное — выделение диагностических различительных его признаков. Наиболее показательны в этом отношении письмо текста, его лексика, синтаксис, собственно стилистика, редкие факты статистики. В процессе моделирования языка особое место занимают словоуказатели к древним памятникам литературы. Они нужны языковедам, литературоведам, историкам, этнографам, поскольку дают полное представление о лексике памятника, о типах слов и форм по их структуре, о характере применения титл, о видах использования графем и их последовательностях. Словоуказатели демонстрируют абсолютную частоту словоформы в тексте и в целом позволяют судить об общем семантическом характере приведенных слов. Идя по пути создания полных словоуказателей, реестров грамматических форм, конкордансов и словарей к отдельным памятникам (центрам письменности), сопоставляя затем между собой словники и словари текстов и зон, изученных лучше других, мы придем постепенно к относительно полной картине ареального и жанрового распределения лексики памятников письменности и сможем более уверенно говорить о неологизмах изводов, школ и авторов отдельных текстов. Актуальной нерешенной проблемой в сфере составления автоматических словарей является автоматическое сведение словоформ к канонической (словарной) форме. Не говоря уже о трудности определения грамматической характеристики словоформы, следует отметить проблему отождествления графических вариантов одной и той же формы слова. Предпринимавшиеся в этой области усилия пока плодов не принесли, и единственной надежной процедурой сведения словоформ к канонической форме, к сожалению, является ручное постредактирование полученного словаря. Искусственный интеллект. Искусственный интеллект — условное обозначение компьютерных систем, моделирующих некоторые стороны интеллектуальной деятельности человека, его логическое, аналитическое мышление. Искусственный интеллект: ДА ИЛИ НЕТ? В 1950-х гг. был поставлен вопрос: можно ли научить машину мыслить, как человек, или, другими словами, можно ли создать искусственный интеллект? Ответ на него получить далеко не так просто, как это может показаться на первый взгляд. Сложность вопроса связана с тем, что мы очень плохо представляем себе, как человек мыслит. Общей теории мышления в настоящее время не существует. Более того, мы даже не знаем, что такое мышление, нет его определения, по крайней мере такого, которое удовлетворило бы одновременно философов, психологов, инженеров, лингвистов, а также других специалистов, участвующих в решении задач искусственного интеллекта. Хотя различные исследователи по-разному определяют набор своих задач, тем не менее существует «устойчивая сердцевина» — проблемы, которые практически всеми специалистами включаются в число задач искусственного интеллекта. К таковым относятся, как считает И.П. Панков, решение задач, принятие решений, распознавание образов. Решение задач. Этот термин объединяет многие проблемы: от доказательства теорем высшей алгебры и решения задач из учебника физики 6-го класса средней школы до бытовых проблем, например какой можно приготовить обед из имеющихся продуктов. Разумеется, здесь речь идет не о непосредственном решении упомянутых выше задач, а о нахождении общего механизма, который использует человек для решения подобных задач, т.е. не о решении задач, а о моделировании этого процесса. Пока исследуются вопросы, в основном касающиеся моделирования решения различных математических задач. Это связано в первую очередь с тем, что математические задачи проще поддаются формализации. Кроме того, для общего решения проблемы следует разобраться с тем, каким образом человек проводит рассуждения, осуществляет логический вывод. Для моделирования решения только математических задач можно использовать формальную (математическую) логику. Однако для общего решения этой проблемы математическая логика (точнее, только математическая логика) вряд ли подойдет: человек пользуется логикой, весьма отличающейся от формальной. Это не значит, что люди не пользуются формальной логикой (или чем-то вроде этого), но они явно используют что-то еще для логических преобразований. Вероятно, мир, где господствовала бы только формальная логика, был бы очень скучен. Но если математическая логика — это хорошо разработанная научная дисциплина, то «логика человека» остается почти не исследованной. Принятие решений. Эта проблема в основном рассматривается на материале стратегических игр, таких, как шахматы, шашки, го и т.д. Работы по моделированию игр осуществляются отнюдь не только для развлечения скучающей публики. Скорее наоборот. Коммерческие программы, играющие в шахматы и другие игры, являются «побочным эффектом» работ такого рода. Дело в том, что «правила игры» существуют не только для перемещения фигур по шахматной доске, но и для размещения сырья и оборудования по предприятиям, передвижения полков и армий по театру военных действий, перемещения денежных средств по финансовой системе и т.д. Выработка общих методов принятия решения о выборе в каждом конкретном случае правил, которые приводят к наилучшим результатам (т.е. нахождение оптимальной стратегии), не только дает возможность создать эффективные автоматизированные системы управления, экспертные системы, но и вносит свой вклад в общую теорию мышления. Распознавание образов. Человеку свойственно классифицировать окружающий его материальный мир. Бесчисленное множество различных объектов он объединяет в группы. Два различных яблока, не очень похожих друг на друга, человек называет одним словом — яблоко. А груша, может быть, очень похожая на яблоко, тем не менее — груша. Предполагается, что в процессе мышления человек создает некие эталонные образы объектов и групп объектов, с которыми имеет дело, и, сравнивая образ рассматриваемого объекта с эталонными образами, относит этот объект к той или иной группе. Такое действие и называется распознаванием образов. Самое главное для решения проблемы распознавания образов — это найти ответ на два очень сложных вопроса: как создается эталонный образ (т.е. как человек членит, классифицирует мир) и какие отличия образа объекта от эталона являются существенными, а какие нет? Человек имеет различные каналы получения информации об окружающей его действительности — зрительный, слуховой, осязательный и др., поэтому у него могут формироваться образы различных типов, и проблема их распознавания распадается на отдельные проблемы: распознавание зрительных образов, распознавание акустических образов и т.д. Не следует думать, что эти исследования так и остались исследовательской абстракцией. Наиболее простой и понятный пример применения данных разработок для широкого использования – это системы оптического распознавания текста (тот же Файнридер). |
Рабочая программа дисциплины опд. В. 02 «Практика аудирования» для... «Лингвистика и новые информационные технологии», специальности 031301. 65 «Теоретическая и прикладная лингвистика», введённому в... | Лекция Текстовые процессоры (или текстовые редакторы) Работа с таблицей: вставка таблицы через меню Таблица, через кнопку на панели инструментов Стандартная | ||
Программа дисциплины «Миграционная политика в России и за рубежом. Лингвистические аспекты» Программа предназначена для преподавателей, ведущих данную дисциплину, и студентов направления подготовки 45. 04. 03 «Фундаментальная... | В. К. Финн к структурной когнитологии: феноменология сознания с точки... Ки и искусственного интеллекта – полигона экспериментальной проверки научных средств имитации рациональности и продуктивного мышления.... | ||
Рабочая программа по курсу «Имитационное моделирование экономических... «Имитационное моделирование экономических процессов» составлена в соответствии с требованиями государственного образовательного стандарта... | Самостоятельная работа: 76 час. Итоговый контроль: экзамен I. Организационно-методический... Цель дисциплины – познакомить студентов с основными задачами искусственного интеллекта, как области человеческой деятельности | ||
Валентин Юрьевич Технологии и системы искусственного Выпускная работа... В условиях резкого увеличения объемов информации переход к работе со знаниями на основе искусственного интеллекта является, по всей... | Новые информационные и педагогические технологии ... | ||
Пояснительная записка: Цели и задачи дисциплины. Дисциплина «Языки программирования» Ступников А. А. Языки программирования. Учебно-методический комплекс. Рабочая программа для студентов очной формы обучения, направления... | Реферат по информатике на тему История и тенденции развития искусственного интеллекта На сегодняшний день проблема исследования ai занимает актуальное место в системе информационных наук. В своем реферате я попытаюсь... | ||
Рабочая программа по курсу «Имитационное моделирование экономических... «Имитационное моделирование экономических процессов» составлена в соответствии с требованиями государственного образовательного стандарта... | Моделирование в химической технологии, расчет химических реакторов Методы оптимизации химико-технологических процессов и нахождения экстремума функций | ||
Тема: Текстовые документы и текстовые процессоры Знакомство с отраслями использования текстовых документов обеспечить применение знаний и способов действий в разнообразных ситуациях... | Программа по формированию навыков безопасного поведения на дорогах... Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов направления подготовки 010400.... | ||
Рабочая программа учебной дисциплины изотопная геохимия специальность:... «Прикладная геохимия, петрология, минералогия» в течение 6 семестра после прохождения курсов «Химия», «Общая геология», «Кристаллохимия»,... | Программа дисциплины «Лингвистические и логические задачи» для направления... Составитель – Т. Н. Ермакова, кандидат юридических наук, старший преподаватель кафедры уголовно-правовых дисциплин Вятггу |