Лекция 11. Прикладная лингвистика. Моделирование языковых процессов. Лингвистические аспекты искусственного интеллекта. Текстовые процессоры. Искусственные языки. Лингвостатистические методы. Новые информационные технологии. Прикладная лингвистика — направление в языкознании, занимающееся разработкой методов решения практических задач, связанных с использованием языка.
Прикладные сферы языкознания издавна отличались широким разнообразием. Наиболее древние из них — письмо (графика), методика обучения родному и неродному языкам, лексикография. В дальнейшем появились перевод, дешифровка, орфография, терминоведение. Одно из традиционных направлений прикладной лингвистики связано с участием в языковой политике государства и формируется как языковая политика и языковое строительство. Одновременно с развитием и совершенствованием классических областей прикладного языкознания во второй половине XX в. наметился и определился ряд новых его направлений, которые представляют собой логическое продолжение исторического развития прикладной лингвистики на новом этапе, обусловленном современной научно-технической революцией, укреплением взаимосвязи общественных, естественных и технических наук. К этим направлениям относятся: обработка информации, моделирование знаний, автоматическая обработка языка в его письменной и устной формах. Методы прикладной лингвистики. Разнообразие методов прикладной лингвистики вполне сопоставимо с разнообразием конкретных областей приложения научных знаний о языке: каждая конкретная прикладная дисциплина обладает своим уникальным набором методов. Тем не менее можно выделить нечто общее, характерное для методов прикладной лингвистики в целом. Эта общая часть хорошо видна при сравнении методических инструментариев описательной, теоретической и прикладной лингвистики.
Перед описательной лингвистикой стоит задача описания фактов языка. На первом плане при этом находится метод классификации, т.е. выявления той сетки параметров, которая позволяет охватить все существенные свойства языковых структур. Теоретическая лингвистика формирует само представление о том, какие свойства языка являются существенными, а какие – нет. Создаваемые в теоретической лингвистике концептуальные модели языка не просто описывают наблюдаемые факты, но и претендуют на их объяснение. При этом как описательная, так и теоретическая лингвистика исходят из познавательной установки, известной как «God"s Truth» («Божественная Истина»). Иными словами, классификации языковых фактов и концептуальные модели теоретической лингвистики претендуют на описание того, как действительно устроен язык.
Прикладная лингвистика также использует и метод классификации, и метод моделирования. Однако поскольку задачи прикладной лингвистики сосредоточены в области оптимизации функций языка, а оптимизация определяется конкретной задачей, то в прикладной лингвистике широкое распространение имеет познавательная установка, известная под несколько ироническим названием «Фокус-покус» (более уважительное название – «инженерный подход»). Эта установка в качестве основной ценности выдвигает не познание того, «как все обстоит на самом деле», а решение конкретной задачи, в частном случае – удовлетворение требований «заказчика», преследующего свои собственные цели. Это, впрочем, не означает, что результаты прикладных исследований не представляют никакой ценности для теории языка: напротив, прикладные модели оказывают значительное влияние на лингвистическую теорию, способствуя обновлению концептуального аппарата современного языкознания.
В силу сказанного важнейшим общим свойством методов прикладной лингвистики является ориентация на создание такой модели данной проблемной области, которая отображает только те ее свойства, которые необходимы для решения конкретной практической задачи. Иными словами, если теоретическое исследование в идеале стремится к полному описанию проблемной области со всеми ее сложностями и т.п., то прикладное описание обязано удовлетворять только данной конкретной задаче. Оно, конечно, может обладать и большей, чем это необходимо для решения конкретной прикладной задачи, описательной адекватностью и объяснительной силой, но принципиально этого от него не требуется.
Суммируя основные частные отличия прикладных моделей от теоретических и описательных, можно сказать, что прикладные модели в целом ориентированы на конкретные подъязыки, а не весь язык в целом; они часто (но не всегда) требуют большей степени формализации; прикладные модели используют знания о языке выборочно; прикладные модели не делают различий между собственно лингвистическими и экстралингвистическими аспектами семантики языковых выражений; прикладные модели в существенно большей степени огрубляют моделируемый объект, чем теоретические модели и, наконец, прикладные модели не налагают никаких существенных ограничений на инструмент моделирования.
Термин «квантитативная лингвистика» характеризует междисциплинарное направление в прикладных исследованиях, в котором в качестве основного инструмента изучения языка и речи используются количественные или статистические методы анализа. Иногда квантитативная (или количественная) лингвистика противопоставляется комбинаторной лингвистике. В последней доминирующую роль занимает «неколичественный» математический аппарат – теория множеств, математическая логика, теория алгоритмов и т.д. С теоретической точки зрения, использование статистических методов в языкознании позволяет дополнить структурную модель языка вероятностным компонентом, т.е. создать структурно-вероятностную модель, обладающую значительным объяснительным потенциалом. Эту сторону использования количественных методов следует считать приложением статистики в языкознании. Иными словами, задача построения структурно-вероятностной модели функционирования языка относится к теоретическим проблемам лингвистики и входит в компетенцию теории языка. В прикладной же области квантитативная лингвистика представлена прежде всего фрагментами этой модели, используемыми для лингвистического мониторинга функционирования языка, дешифровки кодированного текста, авторизации/атрибуции текста и т.п. Языковая политика Языковая политика— совокупность общефилософских и част-нонаучных принципов и практических мероприятий по решению языковых проблем в социуме, государстве.
Реформы русского письма. В данном параграфе необходимо рассказать о реформах русского письма как одного из фрагментов отношения общества к языку; коллективном выборе языка и соотношении языка и власти с точки зрения Л.Р. Зиндера. Развитие русского письма, его орфографии было постепенным. Его история знала две реформы: петровскую реформу азбуки (1708—1710) и реформу орфографии 1917—1918 гг. Петр I вместо церковной кириллицы, исключив из нее некоторые буквы, ввел новый гражданский шрифт, установил начертательное различие строчных и прописных букв (до этого использовались только прописные буквы), отменил обязательность постановки знаков ударения в каждом слове, что строго соблюдалось в печатных текстах. Вторую реформу провело Советское правительство, хотя готовилась она в рамках Академии наук с начала XX в. 23 декабря 1917 г. Народный комиссариат просвещения издал декрет о введении нового правописания. 10 октября 1918 г. Советом народных комиссаров был издан специальный декрет, подтвердивший декрет Народного комиссариата просвещения. Советская реформа была вызвана необходимостью расширить сферу применения новой орфографии, утвердить ее во всей советской печати. Реформа изъяла ставшие совершенно чуждыми духу русского языка церковно-славянские окончания -аго, -яго у прилагательных, причастий и местоимений (доброго, пятого, которого, синяго и т.п.), заменив их русскими окончаниями -ого, -его (доброго, пятого, которого, синего). Было устранено разграничение форм одни они, с одной стороны, и однђ, онђ) — с другой (первые употреблялись для слов мужского и среднего рода, вторые — для слов женского рода). Формы одни, они теперь предназначались для всех трех родов. Реформа изменила также написание окончаний прилагательных, причастий и местоимений женского и среднего рода в именительном и винительном падежах множественного числа, которые писались с окончаниями -ыя, -ия (большыя старыя липы). Была изъята форма ея (ея сестра) и оставлена только форма её (её сестра). Ликвидировалась буква ђ («ять») и другие дублетные буквы, еще остававшиеся в алфавите, и т.д.
Реформа 1917—1918 гг. была первой и пока единственной реформой русской орфографии (петровская реформировала только азбуку).
В 1956 г. было проведено упорядочение орфографии. Это не было реформой правописания, поскольку не затронуло его основ, но унификация колеблющихся написаний коснулась всех его разделов.
Кроме названных реформ и упорядочения 1956 г. были еще два не проведенных в жизнь проекта реформ, подготовленных: 1) Сектором науки Наркомпроса РСФСР в 1930 г.; 2) Комиссией по усовершенствованию русской орфографии при Институте русского языка АН СССР и Отделении литературы и языка АН СССР в 1964 г.
Первый из этих проектов, декларировавший равнение на малограмотных и неграмотных, узаконивавший малограмотные написания был отвергнут как научно не обоснованный.
Подготовка проекта 1964 г., длившаяся два года, сопровождалась большой и чрезвычайно интенсивной исследовательской работой. Научная его платформа отражала одно из направлений в теории орфографии (построенное на концепции Московской фонологической школы). Однако к обсуждению проекта не была подготовлена общественность, что показала развернувшаяся дискуссия. Особенно острой критике проект был подвергнут на страницах «Литературной газеты». При этом больше всего возражений вызвали первые четыре его пункта: изъять из алфавита ъ, заменив его на ь: съезд, объявление и т.п.; отменить употребление ь в грамматической функции: ноч, доч, береч, не плач и т.п.; писать огурци, циган и т.п.; писать по произношению чорный, жоны, смягчонный, течот и т.п. В результате реформа была отложена.
Совершенствование русской орфографии продолжается непрерывно, хотя и не в рамках реформы. Большая роль в упорядочении правописания принадлежит словарям. Новые правописные тенденции отражают различные справочники. При этом необходимость координационной работы изданном этапе языковой политики и языкового строительства в начале третьего тысячелетия остается актуальной, в связи с чем в 1990 г. при Институте русского языка РАН была образована новая Орфографическая комиссия. Нормирование языка. Орфоэпия — совокупность произносительных норм национального языка, обеспечивающая сохранение единообразия его звукового оформления; раздел языкознания, изучающий произносительные нормы.
Культура речи — владение нормами устного и письменного литературного языка, а также умение использовать выразительные средства языка в различных условиях общения в соответствии с целями и содержанием речи; раздел языкознания, исследующий проблемы нормализации с целью совершенствования языка как орудия культуры.
Норма в языке. Для исследования литературно-языковой нормы вообще и произносительной нормы в частности, как считает Л.А. Вербицкая, необходимо изучение не только внутренних системных, но и социолингвистических факторов, а также определенных психологических законов, которые управляют речевой деятельностью людей. До сих пор остается нерешенным вопрос, существует ли норма в самом языке или она вносится в язык извне, противопоставляется ли норма кодификации или не отличается от нее.
При рассмотрении одного из частных вопросов общей проблемы нормы — произносительной нормы принято различать два аспекта последней — орфоэпию и орфофонию.
Орфоэпия и орфофония. В самом общем виде можно сказать, что орфоэпия — это правила, определяющие нормативный фонемный состав слов, а орфофония — правила произношения вариантов фонем. Так, вопрос о том. следует ли употреблять в слове тихий твердое [х] или мягкое [х'], регулируется правилами орфоэпии, а требование произносить согласный [j] в конце слова как сонорный, а не глухой, относится к правилам орфофонии.
Орфоэпия для устной речи играет роль, подобную той, которую играет орфография для письменной речи (орфография определяет буквенный состав слова на письме, орфоэпия — фонемный состав). Сознательной кодификации подвергается именно орфоэпия, так как фонемный состав слов хорошо осознается носителями языка.
Орфофонические различия носителями языка часто не осознаются. Вместе с тем диалектные и просторечные особенности обычно проявляются не в нарушении фонемного состава слова, а в изменении фонетических характеристик фонем, в искажении звуковой их реализации (например, недостаточная редукция безударных гласных, недостаточная мягкость [с']).
Реальные пути развития произносительной нормы определяются фонологической системой языка, прежде всего существующей в ней вариантностью. Произносительная норма также характеризуется известной вариантностью, которую допускает система.
При утверждении того или иного орфоэпического или орфофони-ческого варианта в качестве ведущего варианта нормы большое значение имеет анализ основных тенденций развития фонологической системы. Чаще побеждают варианты, соответствующие этим тенденциям.
Знание основных направлений развития фонологической системы имеет особое значение для кодификаторов, вынужденных сознательно выбирать один из вариантов в случаях, когда один становится ведущим вариантом нормы, а второй — отживающим. При выборе одного из вариантов необходимо учитывать разнообразные фонетические, фонологические, морфонологические и экстралингвистические факторы, опираться на экспериментально-фонетические исследования реальной речи носителей языка. Стилеметрия и атрибуция текстов. Стилеметрия — прикладная филологическая дисциплина, занимающаяся измерением стилевых характеристик с целью систематизации и упорядочения (типологии, атрибуции, датировки, диагностики, реконструкции и т.д.) текстов и их частей. Стилеметрия. Термин «Стилеметрия» ввел в научный обиход немецкий филолог В. Диттенбергер, решавший в конце XIX в. проблему авторства диалогов Платона с помощью частот слов, реализация которых не зависит от тематики текста. В России первым «стилеметром» был Н.А. Морозов, известный писатель и разносторонний ученый. Он ис пользовал частотные распределения служебных слов для отличения плагиата от подлинных произведений.
Объектом стилеметрии является текст, созданный конкретным автором, в конкретное время, в конкретной ситуации. Предметом исследования являются элементы стиля, которые понимаются как особенности периферии характеристики объекта. Стиль может быть описан через факультативные, поверхностные признаки текста, которые лишь неявным образом затрагивают его сущностные, глубинные характеристики.
Стилеметрия имеет дело с количественным классифицированием, а эта область классификационных занятий тесно соприкасается с несколькими научными направлениями: теорией группировок, теорией оценивания, распознаванием образов, теорией корреляции, количественной таксономией, методами психологического тестирования и др. Границы между этими направлениями стираются, и сегодня можно говорить о комплексе подходов и методов, занимающихся теми или иными видами количественной систематизации объектов произвольной природы.
К настоящему времени, как показывают исследования Г.Я. Мар-тыненко и С.В. Чебанова, накоплен большой опыт в применении статистического метода для решения проблемы спорного авторства (атрибуции) текстов; в сущности, этот метод стал хрестоматийным, причем не только в филологии (текстологии, источниковедении, стилистике), но и в криминалистике, медицинской диагностике, социальной психологии.
В последние годы круг решаемых стилеметрией задач и репертуар применяемых ею методов существенно расширились. Практической повседневностью стала количественная таксономия текстов, стилистическое приложение нашли дешифровочные модели, относительно самостоятельное направление образовала квантитативная типология текста, начала формироваться стилистическая диагностика, большое развитие получили методы реконструкции древних текстов.
Атрибуция текстов. При решении таких традиционных филологических задач, как атрибуция анонимного или псевдонимного текста, определение или уточнение датировки текста, типология жанров и Функциональных стилей, становится очевидно, что, по мнению М.А. Марусенко, во всех вышеперечисленных случаях мы имеем дело только с одной научной задачей — либо с объединением объектов в однородные классы, либо с отнесением объекта (группы объектов) к какому-либо классу, либо с определением меры близости/удаленности между разными объектами (группами объектов).
При всей актуальности этих проблем и несмотря на то, что работа над ними ведется со времен филологов-классиков, нынешнее состояние дел не позволяет однозначно и с фиксированной достоверностью производить атрибуцию анонимного или псевдонимного текста как и другие классификационные процедуры. Произведения анонимного или спорного авторства существуют в любой литературе. До настоящего времени процедура атрибуции таких текстов сводилась к тому, что филолог-литературовед, хорошо знакомый с периодом, в который был написан спорный текст, и с творчеством писателей, работавших в то время, пытался найти те или иные доказательства, позволяющие приписать данный текст известному ему автору. При этом самым важным являлись свидетельства внешнего характера, такие, как биографические данные предполагаемого автора, его пребывание в данном месте, круг его знакомств, переписка, политические взгляды и т.д. Пользуясь этим методом, разные исследователи зачастую приходят к совершенно противоположным выводам относительно предполагаемого автора анализируемого текста. Необходимо учитывать и субъективный фактор, который оказывает негативное воздействие в двух планах: с одной стороны, исследователи выбирают в качестве оснований для атрибуции те критерии, которые лучше «укладываются» в их гипотезу, с другой — проявляется отчетливая тенденция приписывать спорные тексты перу наиболее крупных и значительных писателей.
Новые перспективы в этой области открываются при комплексном подходе к проблеме атрибуции, когда для признания принадлежности анализируемого произведения данному автору необходимо учитывать доводы по меньшей мере трех основных групп: а) биографические; б) идеологические; в) стилистические. Чем большее число разных методов используется в процессе атрибуции, тем выше его точность и надежность, достоверность окончательных выводов.
Совершенствование исследовательских приемов связано с использованием средств и методов прикладной лингвистики, а также с четким разграничением сферы действия и возможностей традиционных филологических методов, их комплексным сочетанием со статисти-ко-вероятностными методами, разработанными для решения классификационных задач и применяемых для задач атрибуции на основе межнаучного переноса. |