Скачать 0.93 Mb.
|
Пояснительная записка.В курсе рассматриваются основные методы корпусной лингвистики: автоматизированное извлечение информации, обучение на основе данных, текстовые поиски в крупномасштабных корпусах с использованием методов обработки естественного языка. При изучении курса студенты знакомятся с концепциями корпусной лингвистики и историей корпусных исследований, осваивают основы корпусных технологий, приобретают навыки работы с корпусами, получая возможность параллельно овладеть базовыми принципами корпусных методов лингвистического анализа, а также выполняют ряд практических заданий и участвуют в моно- и мультиязычных корпусных проектах. Особенностью данного курса является рассмотрение значительного числа примеров из практики консультационной деятельности и работа студентов над кейсами. 2. Содержание курса. 1. Введение в корпусную лингвистику. Тема 1. Основные понятия и определения. Лингвистические (языковые) и нелингвистические корпусы. Тема 2. История лингвистических корпусов: от картотеки к корпусу. Корпусная лингвистика: современное состояние. Корпусная лингвистика в России. Тема 3. Классификация (типология) корпусов по различным основаниям. Типы корпусов по задачам. Типы корпусов по формальным признакам.
Тема 4. Проблемы репрезентативности. Отбор источников. Внешние и внутренние критерии отбора. Нормализация файлов. Графематический анализ. Тема 5. Разметка. Средства создания и разметки корпусов. Понятие разметки. Типы разметки. Автоматический морфологический и синтаксический анализ. Металингвистическая разметка. Параллельные корпусы. Проблема выравнивания. Тема 6. Стандартизация в корпусной лингвистике. Языковые средства представления размеченных текстов. Международные стандарты и проекты (TEI, EAGLES, CDIF, XCES).
Тема 7. Обзор существующих корпусов различных типов. Зарубежные национальные корпусы. Корпусы русского языка. Специальные корпусы.Тема 8. Корпусные менеджеры. Корпус как поисковая система. Языки запросов. Выходные интерфейсы. Сравнительный анализ.Тема 9. Корпусные исследования. Лексические исследования, базирующиеся на корпусах. Грамматические исследования, базирующиеся на корпусах. Семантические исследования, базирующиеся на корпусах. Использование корпусов в социологии, исторической науке и др.Основная литература
Дополнительная литература
Аннотация курса «Машинное обучение» 1.Пояснительная записка Цель курса – познакомить магистров с основными проблемами и алгоритмами машинного обучения. Курс «Машинное обучение» входит в профессиональный цикл (вариативная часть) магистерской программы «Компьютерная лингвистика» и является продолжением курса «Методы и алгоритмы интеллектуального анализа данных». Задачи курса: по итогам изучения курса слушатели должны - понимать теоретическую базу машинного обучения - разбираться в алгоритмах классификации и обучения - уметь применять теоретические знания для решения практических задач Содержание курса:
Постановка задач обучения по прецедентам. Объекты и признаки. Типы шкал: бинарные, номинальные, порядковые, количественные. Типы задач: классификация, регрессия, прогнозирование, кластеризация. Основные понятия: модель алгоритмов, метод обучения, функция потерь и функционал качества, принцип минимизации эмпирического риска, обобщающая способность, скользящий контроль.
Вероятностная постановка задачи классификации. Основные понятия: априорная вероятность, апостериорная вероятность, функция правдоподобия класса. Функционал среднего риска. Ошибки I и II рода. Оптимальный байесовский классификатор.
Многомерное нормальное распределение: геометрическая интерпретация, выборочные оценки параметров: вектора математического ожидания и ковариационной матрицы. Квадратичный дискриминант. Вид разделяющей поверхности. Подстановочный алгоритм, его недостатки и способы их устранения. Линейный дискриминант Фишера. Проблемы мультиколлинеарности и переобучения. Регуляризация ковариационной матрицы.
Стохастический EM-алгоритм. Смесь многомерных нормальных распределений. Сеть радиальных базисных функций (RBF) и применение EM-алгоритма для её настройки.
Обобщённый метрический классификатор, понятие отступа. Метод потенциальных функций, градиентный алгоритм. Отбор эталонных объектов. Псевдокод: алгоритм СТОЛП. Функция конкурентного сходства, алгоритм FRiS-СТОЛП. Биологический нейрон, модель МакКаллока-Питтса. Линейный классификатор, понятие отступа, непрерывные аппроксимации пороговой функции потерь.
Квадратичная функция потерь, метод наименьших квадратов, связь с линейным дискриминантом Фишера. Метод стохастического градиента и частные случаи: адаптивный линейный элемент ADALINE, перcептрон Розенблатта, правило Хэбба. Недостатки метода стохастического градиента и способы их устранения. Ускорение сходимости, «выбивание» из локальных минимумов. Проблема переобучения, редукция весов (weight decay). Гипотеза экспоненциальности функций правдоподобия классов. Метод стохастического градиента, аналогия с правилом Хэбба.
Оптимальная разделяющая гиперплоскость. Понятие зазора между классами (margin). Случаи линейной разделимости и отсутствия линейной разделимости. Связь с минимизацией регуляризованного эмпирического риска. Кусочно-линейная функция потерь. Задача квадратичного программирования и двойственная задача. Понятие опорных векторов. Функция ядра (kernel functions), спрямляющее пространство, теорема Мерсера. Способы конструктивного построения ядер. Примеры ядер. Сопоставление SVM с гауссовским ядром и RBF-сети.
Теоретические обоснования различных непрерывных функций потерь и различных регуляризаторов. Байесовский подход. Принцип максимума совместного правдоподобия данных и модели. Некоторые разновидности регуляризаторов, применяемые на практике. Квадратичный (L2) регуляризатор. L1- и L0- регуляризаторы и их связь с отбором признаков. Метод релевантных векторов. Сложностный подход. Радемахеровская сложность и некоторые её свойства. Верхняя оценка вероятности ошибки для линейных классификаторов.
Задача восстановления регрессии, метод наименьших квадратов. Одномерная непараметрическая регрессия (сглаживание): оценка Надарая-Ватсона, выбор ядра и ширины окна сглаживания. Многомерная линейная регрессия. Сингулярное разложение. Регуляризация: гребневая регрессия и лассо Тибширани. Метод главных компонент и декоррелирующее преобразование Карунена-Лоэва. Робастная регрессия: простой алгоритм отсева выбросов LOWESS.
Структура многослойной нейронной сети. Функции активации. Проблема полноты. Задача исключающего или. Полнота двухслойных сетей в пространстве булевских функций. Алгоритм обратного распространения ошибок. Формирование начального приближения. Проблема паралича сети. Методы оптимизации структуры сети. Выбор числа слоёв и числа нейронов в скрытом слое. Постепенное усложнение сети. Оптимальное прореживание сети (optimal brain damage). Литература
Аннотация курса «Семантика» 1.Пояснительная записка Цель курса – познакомить магистров с базовыми теоретическими положениями и современными разработками в области семантики, с особенностями содержательной стороны различных единиц. Задачи курса: 1) определить место семантики в кругу лингвистических и иных дисциплин; 2) рассмотреть основные понятия семантики: значение, смысл, семантический метаязык; 3) сформировать представление об особенностях содержательной стороны языковых единиц разных уровней, прежде всего слова и предложения, а также о тех общих закономерностях, которые определяют правила передачи и получения информации с помощью языковых средств; 4) охарактеризовать основные направления и школы современной лингвистической семантики; 5) показать возможности метаязыкового представления значения и смысла. Содержание курса:
Литература:
Аннотация курса «Имитационное моделирование» 1.Пояснительная записка Цель курса – познакомить магистров с современными проблемами построения и использования имитационных моделей интеллектуального анализа данных. Курс «Поиск информации в интернет» входит в вариативную часть профессионального цикла магистерской программы «Компьютерная лингвистика». Задачи курса: по итогам изучения курса слушатели должны - понимать теоретическую базу имитационного моделирования - разбираться в алгоритмах построения имитационных моделей -уметь применять теоретические знания для решения практических задач Содержание курса: 1. Общие вопросы имитационного моделирования. Виды моделей: Статические и динамические, непрерывные, дискретные и гибридные, детерминированные и стохастические, аналитические и имитационные. 2. Имитационное моделирование. Примеры задач решаемых с помощью имитационного моделирования. Этапы имитационного моделирования. Визуализация и анимация. Общие понятия моделирования в среде AnyLogic. 3. Бизнес-моделирование. Теоретические основы моделирования бизнес-процессов и систем. Концепция управления бизнес-процессами. Разработка простых моделей непрерывных систем. Разработка моделей дискретно-непрерывных систем. 4. Современные парадигмы в имитационном моделировании. Динамические системы, Системная динамика, Дискретно-событийное моделирование. Простая динамическая модель. Построение моделей с иерархической структурой. Нотация и основные идеи системной динамики. Концепция и терминологии системной динамики. Средства AnyLogic для построения моделей системной динамики. Парадигма блочного моделирования. Системы массового обслуживания 5. Многоагентные системы. Архитектура агентных моделей. Взаимодействие агентов со средой. Взаимодействие агентов между собой. Агенты в пространстве. Пример агентной модели. 6. Моделирование с использованием IBM WebSPhere Business Modeler. Создание процессов. Определения и Структуры модели. Элементы и атрибуты модели. Статистический анализ модели. Создание отчетов. Проверка модели, выполнение статистического анализа, формирования соответствующих отчетов Литература
Аннотация курса «Язык профессиональных коммуникаций»
Целью курса является повышение профессиональной языковой квалификации магистров, имеющих устойчивый продвинутый уровень владения иностранным языком в устной и письменной формах (Upper Intermediate English) и обучение навыкам профессионально-ориентированного общения (сферы прикладной математики, лингвистики, IT-технологий) на иностранном языке.
Тема 1. Виды чтения текста: просмотровое чтение, чтение с извлечением специальной информации, чтение с полным пониманием прочитанного. Тема 2. Терминологическая база профессионального общения. Профессиональная лексика прикладной математики и лингвистики. IT-терминология и ее использование. Фразеологизмы в технической литературе. Тема 3. Словообразовательные ресурсы профессиональной коммуникации (частотные словообразовательные модели, аффиксы, словообразовательные гнезда). Тема 4. Морфологическая база профессионального общения (номинация, атрибуция, акциональность и пр.). Знаменательные части речи, коннекторы, служебные слова. Тема 5. Употребление глаголов в профессиональном тексте. Времена, залоги, наклонения. Модальные глаголы. Инфинитив. Причастия, Герундий. Тема 6. Стили профессионального общения. Формулы, принятые в научном, деловом стиле, в переписке и переговорах. Тема 7. Фонетические ресурсы профессионального общения. Мелодика. Акцент. Паузация. Литература
Аннотация курса «Методы и алгоритмы распознавания речи» 1.Пояснительная записка Цель курса – познакомить магистров с современными математическими методами и компьютерными алгоритмами анализа и синтеза речи. Курс «Методы и алгоритмы распознавания речи» входит в вариативную часть специализированного цикла магистерской программы «Компьютерная лингвистика». Задачи курса: по итогам изучения курса слушатели должны - понимать теоретическую базу компьютерного анализа речи - разбираться в алгоритмах распознавания и обработки речевых сигналов - уметь применять теоретические знания для решения практических задач Содержание курса:
Литература
[Электронный ресурс] / Александр Фролов, Григорий Фролов. – Электрон. журн. – 2003. – http://www.frolov-lib.ru
Аннотация курса «Академическое письмо - 2» (на немецком языке)
Целью электива «Академическое письмо 2 (Deutsch) является обучение магистров письменным формам профессионально-ориентированного общения на немецком языке. Основное внимание уделяется при этом чтению, интерпретации и созданию собственных научных текстов по компьютерной лингвистике на немецком языке. 2. Основные задачи курса:
ТЕМА 1. Понятие «дискурса». Специфика научного дискурса. ТЕМА 2. Текст (Text), типы текста (Textsorten), структура текста (Textstruktur), макро- и микроуровень текста (Makro- und Mikroebene des Textes). Новая немецкая орфография (Neue deutsche Rechtschreibung). ТЕМА 3. Жанры академического письма: резюме, реферат, рецензия, доклад, эссе, статья, отзыв на диссертацию, магистерская диссертация, монография, глава в учебнике. ТЕМА4. Специфика научного текста. Научный текст и типы контекста. Интерпретация научного текста: композиция, стиль, язык. ТЕМА 5. «Глоссарий» терминов по компьютерной лингвистике (Deusch – Englisch – Russisch). Энциклопедии, словари ТЕМА 6. «Пристальное чтение» специальных текстов по компьютерной лингвистике на немецком языке. ТЕМА 7. Технология работы над оригинальным научным текстом: определение темы, поиск литературы, работа в библиотеках, поиск источников в Интернете. Цитирование и проблема плагиата. Цитирование источников из Интернета. Интернет как источник информации по изучению компьютерной лингвистики. ТЕМА 8. Гипотеза, дефиниция, концепция, аргументация, верификация результатов в научном тексте. ТЕМА 9. Сбор материала, структура работы, введение, основная часть, структура параграфа, формулировка концепции и примеры, выводы из глав и разделов, основные выводы, заключение, список литературы. ТЕМА 10. Немецкоязычные тексты, необходимые для устройства на работу (Bewerbungsschreiben): автобиография (CV; Lebenslauf), мотивационное письмо (Motivationsbrief). Структура мотивационного письма (Einleitung, Hauptteil, Schluss), Layout, Anhang. Литература:
Аннотация курса «Многомерный анализ текстов»
Целью данного курса является обучение студентов магистратуры анализу больших объемов текстовой информации с поиском и определением главных тем, значимых сюжетных линий, частоты встречаемости в текстах слов и словосочетаний. Таким образом, предметом анализа является содержание текстовых массивов, например, совокупности газетных статей за год или несколько лет, интервью и выступления политиков, тексты художественных произведений, научные публикации по определенной тематике, правовые акты, рекламные и пропагандистские материалы, а также деловая корреспонденция. В отечественной исследовательской традиции контент-анализ определяется как количественный анализ текстов и текстовых массивов с целью последующей содержательной интерпретации выявленных числовых закономерностей. Философский смысл контент-анализа, как исследовательского метода, состоит в восхождении от многообразия текстового материала к абстрактной модели содержания текста. Круг дисциплин, в которых применяется метод многомерного статистического анализа текстов, довольно широк. Помимо социологии и политологии данная методика находит применение в антропологии, управлении персоналом, психологии, литературоведении, истории, истории философии и т.д.
1. История зарождения и совершенствования метода контент-анализа. 2. Сфера применения многомерного статистического анализа текстов. 3. Этапы применения контент-анализа. 3.1. Первый этап. Определение совокупности изучаемых источников и критериев их отбора. 3.2. Второй этап. Формирование выборочной совокупности сообщений. 3.3. Третий этап. Выявление единиц анализа (слова и/или темы). 3.4. Четвертый этап. Выделение единиц счета. 3.5. Пятый этап. Правила проведения процедуры подсчета. 3.6. Шестой этап. Интерпретация полученных результатов. 4. Работа с программой ЛЕКТА (лексико-семантическим текстовым анализатором). 4.1. Загрузка информации и создание словаря. 4.2. Создание и сортировка фильтров. 4.3. Расчет файла частот. 4.4. Расчет факторного анализа 4.5. Импорт данных в пакеты SPSS и STATISTICA. 5. Количественный и качественный контент-анализ. 3. Основная литература:
4. Дополнительная литература:
Аннотация курса «Языковая политика и языковое планирование».
Цель курса – сформировать у магистров целостное представление о современных тенденциях языковой политики, технологиях и механизмах языкового планирования. Задачи курса – анализ различных языковых ситуаций и возможных мер по урегулированию конфликтности сосуществования языков, а также рассмотрение актуальной языковой ситуации в РФ. В курсе рассматриваются актуальные вопросы языковой политики на современном этапе развития мирового сообщества, роль и место региональных языков в глобализационных процессах. Конфликтность удовлетворения потребностей идентичности и взаимопонимания приводит к возникновению различных видов социолингвистической ситуации (монолингвизм, билингвизм, полилингвизм) и к появлению разных типов языковой политики в регионах. В курсе анализируются понятия «государственный язык», «титульный язык», «язык межнационального общения», «международный язык»; развенчиваются некоторые социолингвистические стереотипы. Курс «Языковая политика и языковое планирование» входит в число специальных дисциплин (курсы по выбору). Он содержит содержательные и инструментальные аспекты, связанные с углублением общенаучных и профессиональных компетенций магистров. Студенты 1 курса магистратуры получают необходимые представления о языковом планировании и навыки анализа языковых ситуаций, умение грамотно оценить риски и предложить оптимальный сценарий языкового планирования в конкретной языковой ситуации. Различные разделы программы предполагают дифференцируемый уровень изучаемого в них материала (от ознакомительного до глубоко професионального).
Тема 1. Понятие языковой политики. Потребность идентичности и потребность взаимопонимания. Типы языковой политики vs. Виды социолингвистической ситуации в языковом сообществе. Языковая политика и языковое планирование. Типы и теории языкового планирования. Этапы и процедуры, составляющие языковое планирование. Факторы, влияющие на языковое планирование. Меньшинства как лингвистическая проблема. Способы решения проблемы языковых меньшинств в процессе языкового планирования. Преподавание языков меньшинств в школе. Тема 2. Глобализация с лингвистической точки зрения. Global English. Моно-, мульти- и глобаллингвизм как возможные социолингвистические модели языкового сосуществования. Влияние глобализации на ситуацию в различных странах и Российской Федерации. Тема 3. Региональные языки. Проблема выживания автохтонных языков. Влияние глобализации на миноритарные языки. Красная книга языков. Проекты (международные и российские) по спасению и описанию исчезающих языков. Примеры возрождения языков. Тема 4. Российская постсоветская языковая политика. Русский язык за рубежом и в бывших советских республиках. Статус русского языка. Государственная Федеральная программа «Русский язык». Проблемы и конфликты. "Коллективный выбор языка". Сохранение языка. Языковой сдвиг. Исчезающие языки. Условия сдвига. Темпы сдвига. Причины сдвига. Катастрофический сдвиг. Языковая смерть (на примере Крайнего Севера). Методика экспертной оценки. Разрыв языковой традиции: "поколение перелома". Понятие группового полуязычия. "Красная книга языков народов России". Endangered languages в масштабе планеты. Последствия сокращения числа языков. Утрата языков и утрата культур. Уникальные языки и уникальные культурные явления. Понятие языкового разнообразия. Нелинейность процессов языковой смерти. Устойчивость языков. Причины устойчивости языков. Тема 5. Законы о языке. Регулирование языковой ситуации. Правовые проблемы регулирования взаимоотношений языков на одной или смежных территориях внутри государства. Закон о государственном языке РФ. Законы о государственных языках субъектов Российской Федерации. Типы программ двуязычного образования. Языковые конфликты: причины, характеристики, способы разрешения. Языковая политика в России до революции 1917 г. Языковая политика и языковое строительство в СССР в 1920–1930-е гг. Языковая политика в СССР в конце 1930-х–1991 гг. Тема 6. Интернет как особая сфера языкового функционирования. Литература:
Аннотация курса «Интермедиальная компаративистика»
Целью курса является подготовка магистров, специализирующихся по компьютерной лингвистике, прикладной математике и бизнес-информатике, в области интермедиальной компаративистики. В курсе рассматривается соотношение бумажных и электронных средств информации в понимании канадского теоретика медиа М. МакЛюэна, проблема сопоставления текстов разных дискурсов – политического, экономического, научного, юридического, рекламного, художественного. При этом в фокусе внимания оказываются словесные, визуальные и акустические тексты разной знаковой природы. Семиотика различных искусств занимает в курсе важное место. Рассматриваются темы «Литература и кино», «Литература и фотография», «Визуальная поэзия». Специальный раздел курса посвящен «Литературе в сети «Интернет», системам поиска, сопоставлению электронных библиотек. Исследовательский проект магистров посвящен сопоставительному анализу кинофестиваля в Каннах (http://www.festival-cannes.com/ru/article/57977.html) и сайта Российского кинофестиваля «Литература и кино» (http://fest-lk.ru/2011/raspisanie.html) Прикладной аспект курса связан с применением компьютерных инструментов сравнительного анализа текстов разной природы. Особое внимание уделяется сопоставлению вербальных, визуальных и акустических составляющих рекламных текстов в Интернете и их визуальной составляющей. Специальный проект посвящен компаративному анализу символов Олимпийских игр. Курс нацелен также на углубление навыков сопоставительного анализа переводов. Междисциплинарные связи, работа в группах, разработка собственных исследовательских проектов и подготовка итоговых мультимедийных презентаций – особенность курса «Интермедиальная компаративистика». Ряд тем курса читается на английском и немецком языках. Часть лекций и семинарских занятий проводят приглашенные специалисты из университетов Европы и США, что способствует интернационализации магистерской программы. Курс «Интермедиальная компаративистика» – один из элективов, входящих в число специальных дисциплин магистерской программы. Он развивает положения обязательного общенаучного курса «Актуальные проблемы современной компаративистики. Язык и литература». При этом акцент сдвигается на сопоставление текстов различной знаковой природы. Важное место в курсе занимают визуальные тексты. Магистры получают навыки интермедиального сопоставительного анализа, интерпретации текстов разных знаковых систем. Различные разделы программы предполагают ознакомительный и творческий уровень изучаемого в них материала.
ТЕМА 1. Введение. соотношение бумажных и электронных средств информации в понимании М. МакЛюэна. ТЕМА 2. Интермедиальная компаративистика в современном информационном обществе. ТЕМА 3. Семиотика культуры. Сопоставление текстов различной знаковой природы. Сад как текст. ТЕМА 5. Литература и фотография. Визуальная поэзия. ТЕМА 6. Литература и музыка. ТЕМА 7. Литература и живопись. Литература и архитектура. Тема 8. Литература и кино. С.М. Эйзенштейн о принципе монтажа. Монтаж в литературе и кино. ТЕМА 9. Сравнительный анализ сайтов Каннского кинофестифаля и Российского кинофестиваля в Гатчине. ТЕМА 10. Литература и телевидение. ТЕМА 11. Литература в сети «Интернет». Текст и «гипертекст». Сопоставление электронных библиотек. Системы поиска. ТЕМА 12. Компаративный анализ символов зимних Олимпийских игр. Основная литература
|
Департамент научно-технологической политики и образования Утверждено решением Ученого совета Академии 27. 09. 2004 г. (протокол №1), с изменениями в соответствии с решением Ученого совета... | Протокол № Ильина О. С. Привалов Н. Т Протокол № от мбоу «Татарско Кандызская сош» /Халиуллин И. Ш | ||
Протокол № от 2011 г Зам дир по увр с. П. Хлопушина от 2012г. № протокол № | Согласовано утверждено и введено Мо протокол № педагогического совета школот 20 г протокол № от 20 | ||
Протокол от «28» 08. 2012г. №1 Рассмотрено и утверждено на заседании учёного совета факультета педагогики и психологии (протокол от 20 г. № ) | Протокол №1 от «25» августа 2011 г Обсуждена на заседании кафедры экономики производства 27 января 2009, протокол №9 | ||
Протокол заседания от «30» августа 2011г. №01 Рассмотрено и утверждено на заседании учёного совета факультета педагогики и психологии протокол от 2012 г. № | Приказ №94. 4 от 03. 09. 2012 И. В. Москаленко Протокол № от Протокол Планируемые результаты освоения обучающимися основной образовательной программы основного общего образования | ||
Протокол №3 от21. 03. 2012г. Принято на педагогическом Совете Протокол №5 от Программы отдельных учебных предметов, курсов на ступени основного общего образования по фгос | Протокол№1 Протокол №1 Приказом школы № Программа предназначена для учащихся 8 класса, изучающие предмет «немецкий язык» седьмой год и разработана на основе | ||
Протокол № от 20 г. Председатель Рабочая программа «Деловой этикет и протокол» Охватывают материал по страноведению англоязычных стран, речевому этикету и правилам написания делового письма | Протокол от 31. 08. 2011г. №1 согласована протокол заседания управляющего... До революции село Вязовое являлось крупным волостным центром Грайворонского уезда Курской губернии. Здесь до 1917 года действовали... | ||
Программа по дпи, разработана на основе базисного учебного плана... Мо протокол № педагогического совета школот 20 г протокол № от 20 | Протокол №1 от 29. 08. 2012г от 31. 08. 2012г Рассмотрено и утверждено на заседании учёного совета факультета педагогики и психологии(протокол от «29»марта 2012 г. №8) | ||
Протокол №1 от 31. 08. 2012 г Рассмотрено и утверждено на заседании учёного совета факультета экономики и управления (протокол от 2012 г. № ) | Протокол №3 от 01. 03. 2012 г Рассмотрено и утверждено на заседании учёного совета факультета экономики и управления (протокол от 2012 г. № ) |