Протокол





НазваниеПротокол
страница5/8
Дата публикации16.07.2014
Размер0.93 Mb.
ТипДокументы
100-bal.ru > Информатика > Документы
1   2   3   4   5   6   7   8
Пояснительная записка.

В курсе рассматриваются основные методы корпусной лингвистики: автоматизированное извлечение информации, обучение на основе данных, текстовые поиски в крупномасштабных корпусах с использованием методов обработки естественного языка.

При изучении курса студенты знакомятся с концепциями корпусной лингвистики и историей корпусных исследований, осваивают основы корпусных технологий, приобретают навыки работы с корпусами, получая возможность параллельно овладеть базовыми принципами корпусных методов лингвистического анализа, а также выполняют ряд практических заданий и участвуют в моно- и мультиязычных корпусных проектах.

Особенностью данного курса является рассмотрение значительного числа примеров из практики консультационной деятельности и работа студентов над кейсами.

2. Содержание курса.

1. Введение в корпусную лингвистику.

Тема 1. Основные понятия и определения. Лингвистические (языковые) и нелингвистические корпусы.

Тема 2. История лингвистических корпусов: от картотеки к корпусу. Корпусная лингвистика: современное состояние. Корпусная лингвистика в России.

Тема 3. Классификация (типология) корпусов по различным основаниям. Типы корпусов по задачам. Типы корпусов по формальным признакам.

  1. Создание корпусов.

Тема 4. Проблемы репрезентативности. Отбор источников. Внешние и внутренние критерии отбора. Нормализация файлов. Графематический анализ.

Тема 5. Разметка. Средства создания и разметки корпусов. Понятие разметки. Типы разметки. Автоматический морфологический и синтаксический анализ. Металингвистическая разметка. Параллельные корпусы. Проблема выравнивания.

Тема 6. Стандартизация в корпусной лингвистике. Языковые средства представления размеченных текстов. Международные стандарты и проекты (TEI, EAGLES, CDIF, XCES).

  1. Использование корпусов.
Тема 7. Обзор существующих корпусов различных типов. Зарубежные национальные корпусы. Корпусы русского языка. Специальные корпусы.
Тема 8. Корпусные менеджеры. Корпус как поисковая система. Языки запросов. Выходные интерфейсы. Сравнительный анализ.
Тема 9. Корпусные исследования. Лексические исследования, базирующиеся на корпусах. Грамматические исследования, базирующиеся на корпусах. Семантические исследования, базирующиеся на корпусах. Использование корпусов в социологии, исторической науке и др.
Основная литература

  1. Баранов А.Н. Корпусная лингвистика // Баранов А.Н. Введение в прикладную лингвистику. М., 2001. С.112–137.

  2. Вербицкая Л.А., Казанский Н.Н., Касевич В.Б. Некоторые проблемы создания национального корпуса русского языка // Научно-техни­ческая информация. Сер. 2. 2003. № 6. С. 2–8.

  3. Чардин И.С. Лингвистические корпуса с синтаксической разметкой и их применение // Научно-техническая информация. Сер. 2. 2003. № 6. С. 18–24.

  4. Kratochvìlová Iva, Norbert Richard Wolf (Hg). Kompendium Korpuslinguistik. Eine Bestandaufnahme aus deutsch-tschechischer Perspektive. Heidelberg, 2010.
Дополнительная литература

  1. Ball Catherine N. Tutorial: Concordances and Corpora // http://www.georgetown.edu/cball/corpora/tutorial.html.

  2. Burnard L. The Text Encoding Initiative: an Overview. // Spoken English on Computer / Leech G., Myers G., Thomas J. (eds.) New York, 1995. P. 223–235; См. также http://www-tei.uic.edu/orgs/tei/.

  3. Čermák F. Today's Corpus Linguistics: Some Open Questions // International Journal of Corpus Linguistics. 2002. Vol. 7, N 2. P. 265–282.

  4. English Corpus Linguistics: Studies in Honour of Jan Svartvik / Aijmer K., Altenberg B. (eds.). London, 1991.

  5. Fillmore C.J., Atkins B.T.S. Starting Where the Dictionaries Stop: the Challenge of Corpus Lexicography // Atkins B.T.S., Zampolli A. (eds.). Computational Approaches to the Lexicon. 1994.

  6. Francis N. W. Language Corpora B.C. // Directions in Corpus Linguistics: Proceedings of Nobel Symposium 82. Stockholm, 4.–6. August 1991. / Svartvik J. (ed.). P. 17–32.

  7. Kennedy G. An Introduction to Corpus Linguistics. London, 1998.

  8. Lee D. Genres, Registers, Text Types, Domains, and Styles: Clarifying the Concepts and Navigating a Path through the BNC Jungle // Language Learning & Technology. September 2001. Vol. 5, N. 3, P. 37–72; См. также http://llt.msu.edu/vol5num3/pdf/lee.pdf

  9. Leech G. The State of Art in Corpus Linguistics // English Corpus Linguistics / Aijmer K., Altenberg B. (eds.). London, 1991. P. 8–29.

  10. McEnery A., Wilson A. Corpus Linguistics. Edinburgh, 1996.

  11. Oakes M.P. Statistics for Corpus Linguistics. Edinburgh University Press, Edinburgh, 1998.

  12. Sharoff S. Towards Basic Categories for Describing Properties of Texts in a Corpus. In Proc. of Language Resources and Evaluation Conference (LREC04). May, 2004, Lisbon, Portugal // http://www.comp.leeds.ac.uk/
    ssharoff/texts/lrec-04.pdf.

  13. Sinclair J. Corpus, Concordance, Collocation, Oxford University Press, 1991.

  14. Sinclair J. M. The Automatic Analysis of Corpora // Directions in Corpus Linguistics. Berlin, 1992.

  15. Венцов А.В., Касевич В.Б., Ягунова Е.В. Корпус русского языка и восприятие речи // Научно-техническая информация. Сер. 2. 2003. № 6. С. 25–32.

  16. Доклады научной конференции «Корпусная лингвистика и лингвистические базы данных» / Под ред. А.С. Герда. СПб., 2002.

  17. Захаров В.П. Чешский национальный корпус текстов: организация и способы использования // Доклады научной конференции «Корпусная лингвистика и лингвистические базы данных» / Под ред. А.С. Герда. СПб., 2002. С. 72–79.

  18. Копотев М.В. Корпусная лингвистика в Финляндии (обзор ресурсов) // Научно-техническая информация. Сер. 2. 2003. № 6. С. 37–41.

  19. Копотев М.В., Мустайоки А. Принципы создания Хельсинкского аннотированного корпуса русских текстов (ХАНКО) в сети Интернет // Научно-техническая информация. Сер. 2. 2003. № 6. С. 33–36.

  20. Труды Международной научной конференции «Корпусная лингвистика 2004» / Под ред. А.С. Герда. СПб., 2004.

  21. Шаров, С.А. Представительный корпус русского языка в контексте мирового опыта // НТИ. Сер. 2. 2003. № 6. С. 9–17.


Аннотация курса «Машинное обучение»

1.Пояснительная записка

Цель курса – познакомить магистров с основными проблемами и алгоритмами машинного обучения. Курс «Машинное обучение» входит в профессиональный цикл (вариативная часть) магистерской программы «Компьютерная лингвистика» и является продолжением курса «Методы и алгоритмы интеллектуального анализа данных».

Задачи курса: по итогам изучения курса слушатели должны

- понимать теоретическую базу машинного обучения

- разбираться в алгоритмах классификации и обучения

- уметь применять теоретические знания для решения практических задач
Содержание курса:

  1. Задача обучения

Постановка задач обучения по прецедентам. Объекты и признаки. Типы шкал: бинарные, номинальные, порядковые, количественные. Типы задач: классификация, регрессия, прогнозирование, кластеризация.

Основные понятия: модель алгоритмов, метод обучения, функция потерь и функционал качества, принцип минимизации эмпирического риска, обобщающая способность, скользящий контроль.

  1. Байесовские алгоритмы классификации, непараметрические методы

Вероятностная постановка задачи классификации. Основные понятия: априорная вероятность, апостериорная вероятность, функция правдоподобия класса. Функционал среднего риска. Ошибки I и II рода.

Оптимальный байесовский классификатор.

  1. Параметрические методы, нормальный дискриминантный анализ

Многомерное нормальное распределение: геометрическая интерпретация, выборочные оценки параметров: вектора математического ожидания и ковариационной матрицы. Квадратичный дискриминант. Вид разделяющей поверхности. Подстановочный алгоритм, его недостатки и способы их устранения. Линейный дискриминант Фишера. Проблемы мультиколлинеарности и переобучения. Регуляризация ковариационной матрицы.

  1. EM-алгоритм: основная идея, понятие скрытых переменных, Е-шаг, М-шаг. Конструктивный вывод формул М-шага (без обоснования сходимости). EM-алгоритм и сеть радиальных базисных функций Критерий останова, выбор начального приближения, выбор числа компонент.

Стохастический EM-алгоритм. Смесь многомерных нормальных распределений. Сеть радиальных базисных функций (RBF) и применение EM-алгоритма для её настройки.

  1. Метрические алгоритмы классификации

Обобщённый метрический классификатор, понятие отступа.

Метод потенциальных функций, градиентный алгоритм.

Отбор эталонных объектов. Псевдокод: алгоритм СТОЛП.

Функция конкурентного сходства, алгоритм FRiS-СТОЛП.

Биологический нейрон, модель МакКаллока-Питтса.

Линейный классификатор, понятие отступа, непрерывные аппроксимации пороговой функции потерь.

  1. Линейные алгоритмы классификации

Квадратичная функция потерь, метод наименьших квадратов, связь с линейным дискриминантом Фишера. Метод стохастического градиента и частные случаи: адаптивный линейный элемент ADALINE, перcептрон Розенблатта, правило Хэбба. Недостатки метода стохастического градиента и способы их устранения. Ускорение сходимости, «выбивание» из локальных минимумов. Проблема переобучения, редукция весов (weight decay). Гипотеза экспоненциальности функций правдоподобия классов. Метод стохастического градиента, аналогия с правилом Хэбба.

  1. Метод опорных векторов (SVM)

Оптимальная разделяющая гиперплоскость. Понятие зазора между классами (margin). Случаи линейной разделимости и отсутствия линейной разделимости.

Связь с минимизацией регуляризованного эмпирического риска. Кусочно-линейная функция потерь. Задача квадратичного программирования и двойственная задача. Понятие опорных векторов. Функция ядра (kernel functions), спрямляющее пространство, теорема Мерсера. Способы конструктивного построения ядер. Примеры ядер. Сопоставление SVM с гауссовским ядром и RBF-сети.

  1. Линейные методы классификации: обобщения и обзор

Теоретические обоснования различных непрерывных функций потерь и различных регуляризаторов. Байесовский подход. Принцип максимума совместного правдоподобия данных и модели. Некоторые разновидности регуляризаторов, применяемые на практике. Квадратичный (L2) регуляризатор. L1- и L0- регуляризаторы и их связь с отбором признаков.

Метод релевантных векторов. Сложностный подход. Радемахеровская сложность и некоторые её свойства. Верхняя оценка вероятности ошибки для линейных классификаторов.

  1. Методы восстановления регрессии

Задача восстановления регрессии, метод наименьших квадратов.

Одномерная непараметрическая регрессия (сглаживание): оценка Надарая-Ватсона, выбор ядра и ширины окна сглаживания.

Многомерная линейная регрессия. Сингулярное разложение.

Регуляризация: гребневая регрессия и лассо Тибширани.

Метод главных компонент и декоррелирующее преобразование Карунена-Лоэва.

Робастная регрессия: простой алгоритм отсева выбросов LOWESS.

  1. Нейронные сети

Структура многослойной нейронной сети. Функции активации.

Проблема полноты. Задача исключающего или. Полнота двухслойных сетей в пространстве булевских функций.

Алгоритм обратного распространения ошибок. Формирование начального приближения. Проблема паралича сети.

Методы оптимизации структуры сети. Выбор числа слоёв и числа нейронов в скрытом слое. Постепенное усложнение сети. Оптимальное прореживание сети (optimal brain damage).

Литература

  1. Айвазян С. А., Енюков И. С., Мешалкин Л. Д. Прикладная статистика: основы моделирования и первичная обработка данных. — М.: Финансы и статистика, 1983.

  2. Айвазян С. А., Енюков И. С., Мешалкин Л. Д. Прикладная статистика: исследование зависимостей. — М.: Финансы и статистика, 1985.

  3. Айвазян С. А., Бухштабер В. М., Енюков И. С., Мешалкин Л. Д. Прикладная статистика: классификация и снижение размерности. — М.: Финансы и статистика, 1989.

  4. Вапник В. Н. Восстановление зависимостей по эмпирическим данным. — М.: Наука, 1979.

  5. Журавлев Ю. И., Рязанов В. В., Сенько О. В. «Распознавание». Математические методы. Программная система. Практические применения. — М.: Фазис, 2006. ISBN 5-7036-0108-8.

  6. Загоруйко Н. Г. Прикладные методы анализа данных и знаний. — Новосибирск: ИМ СО РАН, 1999. ISBN 5-86134-060-9.

  7. Шлезингер М., Главач В. Десять лекций по статистическому и структурному распознаванию. — Киев: Наукова думка, 2004. ISBN 966-00-0341-2.

  8. Hastie, T., Tibshirani R., Friedman J. The Elements of Statistical Learning: Data Mining, Inference, and Prediction. — 2nd ed. — Springer-Verlag, 2009. — 746 p. — ISBN 978-0-387-84857-0.

  9. Mitchell T. Machine Learning. — McGraw-Hill Science/Engineering/Math, 1997. ISBN 0-07-042807-7.

  10. Ryszard S. Michalski, Jaime G. Carbonell, Tom M. Mitchell (1983), Machine Learning: An Artificial Intelligence Approach, Tioga Publishing Company, ISBN 0-935382-05-4.[1]

  11. Vapnik V.N. Statistical learning theory. — N.Y.: John Wiley & Sons, Inc., 1998. [2]

  12. Bernhard Schölkopf, Alexander J. Smola Learning with Kernels. Support Vector Machines, Regularization, Optimization, and Beyond. — MIT Press, Cambridge, MA, 2002 ISBN 13-978-0-262-19475-4 [3]

  13. I.H. Witten, E. Frank Data Mining: Practical Machine Learning Tools and Techniques (Second Edition). - Morgan Kaufmann, 2005 ISBN 0-12-088407-0 [4]

  14. www.MachineLearning.ru — профессиональный вики-ресурс, посвященный машинному обучению и интеллектуальному анализу данных

  15. Распознавание, классификация, прогноз

  16. Weka: Data Mining Software in Java

  17. RapidMiner (formerly YALE) is the world-leading open-source system for knowledge discovery and data mining


Аннотация курса «Семантика»

1.Пояснительная записка

Цель курса – познакомить магистров с базовыми теоретическими положениями и современными разработками в области семантики, с особенностями содержательной стороны различных единиц.

Задачи курса:

1) определить место семантики в кругу лингвистических и иных дисциплин;

2) рассмотреть основные понятия семантики: значение, смысл, семантический метаязык;

3) сформировать представление об особенностях содержательной стороны языковых единиц разных уровней, прежде всего слова и предложения, а также о тех общих закономерностях, которые определяют правила передачи и получения информации с помощью языковых средств;

4) охарактеризовать основные направления и школы современной лингвистической семантики;

5) показать возможности метаязыкового представления значения и смысла.

Содержание курса:

  1. Семантика как лингвистическая дисциплина.

  2. Моносемия и полисемия в языке.

  3. Макро- и микроструктура словаря.

  4. Семантика слов в различных дискурсивных практиках.

  5. Семантика общественно-политического дискурса.

  6. Национально-культурный компонент в семантике слова.

  7. Концептуальные метафоры и их текстопорождающая функция.

  8. Взаимосвязь семантики с онтологическим, этическим и эстетическим измерениями коммуникации.

  9. Концептуальная и языковая картина мира.

Литература:

  1. Арнольд И.В. Семантика. Стилистика. Интертекстуальность. Изд-во: Либроком, 2010.

  2. Бах Э. Неформальные лекции по формальной семантике. Изд-во: Либроком, 2010.

  3. Бочкарев А. Е. Семантический словарь. Нижний Новгород, 2003.

  4. Болдырев Н.Н. Когнитивная семантика. Тамбов, 2001.

  5. Вежбицка А. Из книги «Семантические примитивы» // Семиотика. М., 2001.

  6. Гладкова А. Русская семантика. Эмоции, ценности, жизненные установки. Изд-во: Языки славянской культуры. 2010.

  7. Кобозева, И.М. Лингвистическая семантика. М., 2004.

  8. Кронгауз М.А. Семантика. Изд-во: Академия, 2005.

  9. Льюиз Д. Общая семантика// Семиотика. М., 2001.

  10. Льюис К.И. // Семиотика. М., 2001.

  11. Моррис Ч. Основания теории знаков // Семиотика. М., 2001.

  12. Якобсон Р. В поисках сущности языка// Семиотика. М., 2001.

  13. Логическая семантика // Новая философская энциклопедия в 4-х томах. М., 2001. Том 3. С. 433-436.

  14. Blackburn, P., and Bos, J. Representation and Inference for Natural Language : A First Course in Computational Semantics, CSLI Publications, 2005.

  15. Eijck, J. van, and C. Unger. Computational Semantics with Functional Programming. Cambridge, 2010.

  16. Karnap R. Meaning and Necessity: A Study in Semantics and Modal Logic (Midway Reprint). University of Chicago Press, 2007.


Аннотация курса «Имитационное моделирование»
1.Пояснительная записка
Цель курса – познакомить магистров с современными проблемами построения и использования имитационных моделей интеллектуального анализа данных. Курс «Поиск информации в интернет» входит в вариативную часть профессионального цикла магистерской программы «Компьютерная лингвистика».

Задачи курса: по итогам изучения курса слушатели должны

- понимать теоретическую базу имитационного моделирования

- разбираться в алгоритмах построения имитационных моделей

-уметь применять теоретические знания для решения практических задач
Содержание курса:
1. Общие вопросы имитационного моделирования. Виды моделей: Статические и динамические, непрерывные, дискретные и гибридные, детерминированные и стохастические, аналитические и имитационные.

2. Имитационное моделирование. Примеры задач решаемых с помощью имитационного моделирования. Этапы имитационного моделирования. Визуализация и анимация. Общие понятия моделирования в среде AnyLogic.

3. Бизнес-моделирование. Теоретические основы моделирования бизнес-процессов и систем. Концепция управления бизнес-процессами. Разработка простых моделей непрерывных систем. Разработка моделей дискретно-непрерывных систем.

4. Современные парадигмы в имитационном моделировании. Динамические системы, Системная динамика, Дискретно-событийное моделирование. Простая динамическая модель. Построение моделей с иерархической структурой. Нотация и основные идеи системной динамики. Концепция и терминологии системной динамики. Средства AnyLogic для построения моделей системной динамики. Парадигма блочного моделирования. Системы массового обслуживания

5. Многоагентные системы. Архитектура агентных моделей. Взаимодействие агентов со средой. Взаимодействие агентов между собой. Агенты в пространстве. Пример агентной модели.

6. Моделирование с использованием IBM WebSPhere Business Modeler. Создание процессов. Определения и Структуры модели. Элементы и атрибуты модели. Статистический анализ модели. Создание отчетов. Проверка модели, выполнение статистического анализа, формирования соответствующих отчетов
Литература

  1. Ю. Карпов Имитационное моделирование систем. Введение в моделирование с AnyLogic 5. СПб.: БХВ-Петербург, 2005.

  2. Кельтон В., Лоу А. Имитационное моделирование. Классика CS. 3-е изд. – СПб.: Питер; Киев; Издательская группа BHV, 2004. – 847 c.

  3. http://www.xjtek.com.

  4. Ули Вали, Лариса Лейбович, Эрик Превост, Рассел Шер, Андре Венансио, Саша Вайдерком, Нейл Мак-Киннон «Управление бизнес-процессами: от моделирования до мониторинга с использованием продуктов WebSphere V6». Пер. с англ. 2007 г. - 448 с.

  5. www.ibm.com/redbooks

  6. http://www.ibm.com/developerworks/ru/websphere/



Аннотация курса «Язык профессиональных коммуникаций»

  1. Пояснительная записка

Целью курса является повышение профессиональной языковой квалификации магистров, имеющих устойчивый продвинутый уровень владения иностранным языком в устной и письменной формах (Upper Intermediate English) и обучение навыкам профессионально-ориентированного общения (сферы прикладной математики, лингвистики, IT-технологий) на иностранном языке.

  1. Основные задачи курса:

  • совершенствование общего уровня владения иностранным языком;

  • выработка практических навыков профессионально ориентированного (устного и письменного) перевода;

  • повышение эффективности межкультурной коммуникации в профессиональной сфере;

  • работа со специальной терминологией в профессиональной области.

  1. Содержание курса:

Тема 1. Виды чтения текста: просмотровое чтение, чтение с извлечением специальной информации, чтение с полным пониманием прочитанного.

Тема 2. Терминологическая база профессионального общения. Профессиональная лексика прикладной математики и лингвистики. IT-терминология и ее использование. Фразеологизмы в технической литературе.

Тема 3. Словообразовательные ресурсы профессиональной коммуникации (частотные словообразовательные модели, аффиксы, словообразовательные гнезда).

Тема 4. Морфологическая база профессионального общения (номинация, атрибуция, акциональность и пр.). Знаменательные части речи, коннекторы, служебные слова.

Тема 5. Употребление глаголов в профессиональном тексте. Времена, залоги, наклонения.

Модальные глаголы. Инфинитив. Причастия, Герундий.

Тема 6. Стили профессионального общения. Формулы, принятые в научном, деловом стиле, в переписке и переговорах.

Тема 7. Фонетические ресурсы профессионального общения. Мелодика. Акцент. Паузация.

Литература

  1. Дубинина Г.А., Драчинская И.Ф.. Английский язык. Практикум для развития навыков профессионально ориентированного речевого общения. Учебное пособие для вузов. М.: Экзамен, 2002.

  2. Гольцова Е.В. Английский язык для пользователей ПК и программистов. Самоучитель.  Спб, 2002. .

  3. The English Language in Development http://www.teachingenglish.org.uk/sites/teacheng/files/UK011-English-Language-Development.pdf

  4. Young Learner English Language Policy and Implementation: International Perspectiveshttp://www.teachingenglish.org.uk/sites/teacheng/files/Garnet%20BC%20version.pdf

  5. ELT: TEACHER DEVELOPMENT BIBLIOGRAPHY PEDAGOGY, APPLIED LINGUISTICS, MANAGEMENT AND TEACHERS’REFERENCEhttp://www.teachingenglish.org.uk/sites/teacheng/files/FINAL%20for%20publication%20ELT%20big%20teacher%20development%20



Аннотация курса «Методы и алгоритмы распознавания речи»
1.Пояснительная записка
Цель курса – познакомить магистров с современными математическими методами и компьютерными алгоритмами анализа и синтеза речи. Курс «Методы и алгоритмы распознавания речи» входит в вариативную часть специализированного цикла магистерской программы «Компьютерная лингвистика».

Задачи курса: по итогам изучения курса слушатели должны

- понимать теоретическую базу компьютерного анализа речи

- разбираться в алгоритмах распознавания и обработки речевых сигналов

- уметь применять теоретические знания для решения практических задач
Содержание курса:

  1. Акустика звука и речи (распространение звука в воздухе, шумы, помехи, реверберация и т.п.). Математические модели образования и восприятия речи. Основной тон, форманты. Основы цифровой фильтрации. Спектр сигнала и преобразование Фурье. Параметризация речевого сигнала: типы параметров (БПФ, КЛП, КЕПСТР и т.п.), критерии и методы выбора оптимального набора параметров.

  2. Фонетическая теория речи. Постановка задачи распознавания речи (дискретный и слитный случаи, дикторозависимость, обучение и др.). Структурная схема распознавателя слитной речи.

  3. Задача акустического распознавания речи. Подходы: скрытых марковских моделей (СММ), динамической деформации времени (ДДВ).

  4. Методы СММ и ДДВ. Подробное описание, постановки задач и методы их решения.

  5. Монофоны, трифоны, трифонная транскрипция, внутрисловные и межсловные трифоны, гауссовы смеси. Задачи обучения параметров СММ для трифонов, синтеза СММ для слов и предложений естественного языка. Бинарные деревья решений как инструмент для связывания состояний СММ.

  6. Компьютерные математические пакеты (RPL, SPL, IPPS, HTK) и их применение для построения систем распознавания речи. Задачи оптимизации алгоритмов распознавания (по времени и памяти) на акустическом уровне и подходы к их практическому решению.

  7. Задача подбора фонетического алфавита. Метрика на множестве вероятностных автоматов.

  8. Декодирование дерева гипотез: языковые модели, их применение в системах распознавания. Обучение моделей. Коэффициент неопределенности. Статистическая языковая модель русского языка.

  9. Текстовые и речевые базы данных, задачи их обработки и обучения речевых и языковых моделей на их основе. Фонетически богатые тексты, трифонное покрытие, разметка.

  10. Русский речевой распознаватель и перспективы его создания. Другие практические задачи в области математической теории распознавания речи.


Литература

  1. Л.В. Бондарко. Звуковой строй современного русского языка. М.: Просвещение, 1997.

  2. Л. Захаров. Проблемы создания аллофонной базы автоматического синтеза речи (http://art.bdk.com.ru/govor/rasp.htm).

  3. М.В. Панов. Русский язык. История русского литературного языка. Еженедельник «Русский язык», №26, 2002.

  4. П. Хоровиц, У. Хилл. Искусство схемотехники: В 2-х т. Пер. с англ. — М: Мир, 1984.

  5. Фролов А., Фролов Г., Синтез и распознавание речи. Современные решения

[Электронный ресурс] / Александр Фролов, Григорий Фролов. – Электрон. журн. – 2003. – http://www.frolov-lib.ru

  1. Daniel Jurafsky, James H. Martin. Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition, Pearson Prentice Hall, 2009.



Аннотация курса «Академическое письмо - 2» (на немецком языке)

  1. Пояснительная записка:

Целью электива «Академическое письмо 2 (Deutsch) является обучение магистров письменным формам профессионально-ориентированного общения на немецком языке. Основное внимание уделяется при этом чтению, интерпретации и созданию собственных научных текстов по компьютерной лингвистике на немецком языке.

2. Основные задачи курса:

  • совершенствование навыков чтения научных текстов на немецком языке;

  • выработка практических навыков письменной интерпретации немецкоязычных текстов по компьютерной лингвистике;

  • создание собственного терминологического «Глоссария» по компьютерной лингвистике на трех языках: русском, немецком и английском;

  • выработка практических навыков академического письма на немецком языке в области компьютерной лингвистики;

  • создание оригинальных научных текстов небольшого объема на немецком языке.




  1. Содержание курса:

ТЕМА 1. Понятие «дискурса». Специфика научного дискурса.

ТЕМА 2. Текст (Text), типы текста (Textsorten), структура текста (Textstruktur), макро- и микроуровень текста (Makro- und Mikroebene des Textes). Новая немецкая орфография (Neue deutsche Rechtschreibung).

ТЕМА 3. Жанры академического письма: резюме, реферат, рецензия, доклад, эссе, статья, отзыв на диссертацию, магистерская диссертация, монография, глава в учебнике.

ТЕМА4. Специфика научного текста. Научный текст и типы контекста. Интерпретация научного текста: композиция, стиль, язык.

ТЕМА 5. «Глоссарий» терминов по компьютерной лингвистике (Deusch – Englisch – Russisch). Энциклопедии, словари

ТЕМА 6. «Пристальное чтение» специальных текстов по компьютерной лингвистике на немецком языке.

ТЕМА 7. Технология работы над оригинальным научным текстом: определение темы, поиск литературы, работа в библиотеках, поиск источников в Интернете. Цитирование и проблема плагиата. Цитирование источников из Интернета. Интернет как источник информации по изучению компьютерной лингвистики.

ТЕМА 8. Гипотеза, дефиниция, концепция, аргументация, верификация результатов в научном тексте.

ТЕМА 9. Сбор материала, структура работы, введение, основная часть, структура параграфа, формулировка концепции и примеры, выводы из глав и разделов, основные выводы, заключение, список литературы.

ТЕМА 10. Немецкоязычные тексты, необходимые для устройства на работу (Bewerbungsschreiben): автобиография (CV; Lebenslauf), мотивационное письмо (Motivationsbrief). Структура мотивационного письма (Einleitung, Hauptteil, Schluss), Layout, Anhang.

Литература:

  1. Бут У. К., Коломб Г. Дж., Уильямс Дж. М. Исследование: шестнадцать уроков для начинающих авторов. М., 2004.

  2. Радаев В. В. Как организовать и представить исследовательский проект (75 простых правил). М., 2001.

  3. Эко У. Как написать дипломную работу: Гуманитарные науки. Учебно-методическое пособие. М., 2001.

  4. Стратегии академического чтения и письма. Минск, 2007.

  5. Christine Öttl, Gitte Härter: Schriftliche Bewerbung. Mit Profil zum Erfolg. München, 2008,

  6. Noring, J. E. (1994). Omnimedia. A Writer Supportive Electronic Publishing Service.

  7. Bleuel Jens. Zitation von Internetquellen. In: Hug Theo, Hg.: Wie kommt Wissenschaft zu Wissen. Bd.1. Einführung in das wissenschaftliche Arbeiten. Hohengehren, 2001.

  8. Stangl, W. (2005). Die konstruktivistischen Lerntheorien. [werner werner stangl]s arbeitsblätter

  9. Gudrun Perko: "Skript. Wissenschaftliches Konzipieren & Schreiben im Studium", hg. vom Referat Frauenförderung und Gleichstellung der Univ. Wien, 2004.


Аннотация курса «Многомерный анализ текстов»


  1. Пояснительная записка:

Целью данного курса является обучение студентов магистратуры анализу больших объемов текстовой информации с поиском и определением главных тем, значимых сюжетных линий, частоты встречаемости в текстах слов и словосочетаний. Таким образом, предметом анализа является содержание текстовых массивов, например, совокупности газетных статей за год или несколько лет, интервью и выступления политиков, тексты художественных произведений, научные публикации по определенной тематике, правовые акты, рекламные и пропагандистские материалы, а также деловая корреспонденция.

В отечественной исследовательской традиции контент-анализ определяется как количественный анализ текстов и текстовых массивов с целью последующей содержательной интерпретации выявленных числовых закономерностей. Философский смысл контент-анализа, как исследовательского метода, состоит в восхождении от многообразия текстового материала к абстрактной модели содержания текста.

Круг дисциплин, в которых применяется метод многомерного статистического анализа текстов, довольно широк. Помимо социологии и политологии данная методика находит применение в антропологии, управлении персоналом, психологии, литературоведении, истории, истории философии и т.д.

  1. Содержание курса:

1. История зарождения и совершенствования метода контент-анализа.

2. Сфера применения многомерного статистического анализа текстов.

3. Этапы применения контент-анализа.

3.1. Первый этап. Определение совокупности изучаемых источников и критериев их отбора.

3.2. Второй этап. Формирование выборочной совокупности сообщений.

3.3. Третий этап. Выявление единиц анализа (слова и/или темы).

3.4. Четвертый этап. Выделение единиц счета.

3.5. Пятый этап. Правила проведения процедуры подсчета.

3.6. Шестой этап. Интерпретация полученных результатов.

4. Работа с программой ЛЕКТА (лексико-семантическим текстовым анализатором).

4.1. Загрузка информации и создание словаря.

4.2. Создание и сортировка фильтров.

4.3. Расчет файла частот.

4.4. Расчет факторного анализа

4.5. Импорт данных в пакеты SPSS и STATISTICA.

5. Количественный и качественный контент-анализ.

3. Основная литература:

  1. Иудин А.А. Бренд на основе архетипов: национальная специфика. Социальные преобразования и социальные проблемы. – Вып. 5. – Н. Новгород: НИСОЦ, 2007.

  2. Лисовский С. Ф., Евстафьев В. А. Избирательные технологии: история, теория, практика. – Коммерсантъ. – М.: 2000. – ISBN 5-86014-129-7

  3. Мангейм Дж. Б., Рич Р. К. Политология. Методы исследования: Пер. с англ. / Предисл. А.К. Соколова = Empirical Political Analysis: Research Methods in Political Science. – М.: Весь Мир, 1997.

  4. Окунь, Ян. Факторный анализ : монографія; пер. с польск. Г.З. Давидовича; науч. ред. и авт. предисл. В.М. Жуковская. М. Статистика, 1974.

  5. Почепцов Г. Г. Теория коммуникации. М.: Рефл-бук, 2001. – ISBN 5-87983-101-9.

  6. Харченко К.В. Материальная сторона жизни в зеркале субъективных смыслов: опыт контент-анализа // Социология: методология, методы, математическое моделирование. – 2009. – №1(28). – С.129-148.

  7. Holsti O. R. Content analysis for the social sciences and humanities. – Reading, Mass, etc., 1969. – ISBN 0-394-34926-1.

4. Дополнительная литература:

  1. Белокреницкий В.Я., Иудин А.А. Измерение региональной неравномерности развития Пакистана (Опыт применения факторного анализа и обработки исходных данных на ЭВМ). (статья). Экономика стран Среднего Востока. Моделирование и прогнозирование. М.: «Наука», 1982.

  2. Иудин А.А., Шпилев Д.А. Современная немецкая социология (обзор). Проблемы развития города. Н. Новгород: НИСОЦ, 2010.

  3. Иудин А.А., Шпилев Д.А. Современная немецкая социология (обзор). Образование в современной Германии. Н. Новгород: НИСОЦ, 2010.

  4. Иудин А.А., Шпилев Д.А. Современная немецкая социология (обзор). Исследования в области здравоохранения. Н. Новгород: НИСОЦ, 2010.

  5. Иудин А.А. Применение метода факторного анализа для изучения перспективности политических деятелей. (методические разработки). Специальный бюллетень ИВ АН СССР. № 1 (186). М.: «Наука», 1977.

  6. Манекин Р.В. Компьютер и история философии. Краткий обзор отечественных и зарубежных исследований. — Москва-Донецк: Донецкого отделения САМИ, 1993. – С. 68-82.

  7. Манекин Р.В. Контент-анализ, как метод исторического исследования. – Донецк: Информсервис, 1991. – ISSN 08991096.



Аннотация курса «Языковая политика и языковое планирование».

  1. Пояснительная записка

Цель курса – сформировать у магистров целостное представление о современных тенденциях языковой политики, технологиях и механизмах языкового планирования. Задачи курса – анализ различных языковых ситуаций и возможных мер по урегулированию конфликтности сосуществования языков, а также рассмотрение актуальной языковой ситуации в РФ.

В курсе рассматриваются актуальные вопросы языковой политики на современном этапе развития мирового сообщества, роль и место региональных языков в глобализационных процессах. Конфликтность удовлетворения потребностей идентичности и взаимопонимания приводит к возникновению различных видов социолингвистической ситуации (монолингвизм, билингвизм, полилингвизм) и к появлению разных типов языковой политики в регионах. В курсе анализируются понятия «государственный язык», «титульный язык», «язык межнационального общения», «международный язык»; развенчиваются некоторые социолингвистические стереотипы.

Курс «Языковая политика и языковое планирование» входит в число специальных дисциплин (курсы по выбору). Он содержит содержательные и инструментальные аспекты, связанные с углублением общенаучных и профессиональных компетенций магистров. Студенты 1 курса магистратуры получают необходимые представления о языковом планировании и навыки анализа языковых ситуаций, умение грамотно оценить риски и предложить оптимальный сценарий языкового планирования в конкретной языковой ситуации.

Различные разделы программы предполагают дифференцируемый уровень изучаемого в них материала (от ознакомительного до глубоко професионального).

  1. Содержание курса

Тема 1. Понятие языковой политики. Потребность идентичности и потребность взаимопонимания. Типы языковой политики vs. Виды социолингвистической ситуации в языковом сообществе. Языковая политика и языковое планирование. Типы и теории языкового планирования. Этапы и процедуры, составляющие языковое планирование. Факторы, влияющие на языковое планирование. Меньшинства как лингвистическая проблема. Способы решения проблемы языковых меньшинств в процессе языкового планирования. Преподавание языков меньшинств в школе.

Тема 2. Глобализация с лингвистической точки зрения. Global English. Моно-, мульти- и глобаллингвизм как возможные социолингвистические модели языкового сосуществования. Влияние глобализации на ситуацию в различных странах и Российской Федерации.

Тема 3. Региональные языки. Проблема выживания автохтонных языков. Влияние глобализации на миноритарные языки. Красная книга языков. Проекты (международные и российские) по спасению и описанию исчезающих языков. Примеры возрождения языков.

Тема 4. Российская постсоветская языковая политика. Русский язык за рубежом и в бывших советских республиках. Статус русского языка. Государственная Федеральная программа «Русский язык». Проблемы и конфликты. "Коллективный выбор языка". Сохранение языка. Языковой сдвиг. Исчезающие языки. Условия сдвига. Темпы сдвига. Причины сдвига. Катастрофический сдвиг. Языковая смерть (на примере Крайнего Севера). Методика экспертной оценки. Разрыв языковой традиции: "поколение перелома". Понятие группового полуязычия. "Красная книга языков народов России". Endangered languages в масштабе планеты. Последствия сокращения числа языков. Утрата языков и утрата культур. Уникальные языки и уникальные культурные явления. Понятие языкового разнообразия. Нелинейность процессов языковой смерти. Устойчивость языков. Причины устойчивости языков.

Тема 5. Законы о языке. Регулирование языковой ситуации. Правовые проблемы регулирования взаимоотношений языков на одной или смежных территориях внутри государства. Закон о государственном языке РФ. Законы о государственных языках субъектов Российской Федерации. Типы программ двуязычного образования. Языковые конфликты: причины, характеристики, способы разрешения. Языковая политика в России до революции 1917 г. Языковая политика и языковое строительство в СССР в 1920–1930-е гг. Языковая политика в СССР в конце 1930-х–1991 гг.

Тема 6. Интернет как особая сфера языкового функционирования.

Литература:

  1. Елистратов В.С. Словарь русского арго. М.,2001.

  2. Костомаров В.Г. Языковой вкус эпохи: Из наблюдений над речевой практикой масс-медиа. СПб., 2000.

  3. Чернов И.В. . Международная организация Франкофонии: лингвистическое измерение языковой политики. СПб., 2006.

  4. Crystal, David. English as a Global Language. Cambridge University Press, 2003.

  5. Pennycook Alastair. Critical Applied Linguistics. Lawrence Erlbaum Associates, 2001.

  6. Schiffman Harold F..Linguistic culture and language policy. London. 1996.

  7. Spichtinger Daniel. The Spread of English and its Appropriation. Vienna, 2000.


Аннотация курса «Интермедиальная компаративистика»

  1. Пояснительная записка

Целью курса является подготовка магистров, специализирующихся по компьютерной лингвистике, прикладной математике и бизнес-информатике, в области интермедиальной компаративистики. В курсе рассматривается соотношение бумажных и электронных средств информации в понимании канадского теоретика медиа М. МакЛюэна, проблема сопоставления текстов разных дискурсов – политического, экономического, научного, юридического, рекламного, художественного. При этом в фокусе внимания оказываются словесные, визуальные и акустические тексты разной знаковой природы. Семиотика различных искусств занимает в курсе важное место. Рассматриваются темы «Литература и кино», «Литература и фотография», «Визуальная поэзия». Специальный раздел курса посвящен «Литературе в сети «Интернет», системам поиска, сопоставлению электронных библиотек. Исследовательский проект магистров посвящен сопоставительному анализу кинофестиваля в Каннах (http://www.festival-cannes.com/ru/article/57977.html) и сайта Российского кинофестиваля «Литература и кино» (http://fest-lk.ru/2011/raspisanie.html)

Прикладной аспект курса связан с применением компьютерных инструментов сравнительного анализа текстов разной природы. Особое внимание уделяется сопоставлению вербальных, визуальных и акустических составляющих рекламных текстов в Интернете и их визуальной составляющей. Специальный проект посвящен компаративному анализу символов Олимпийских игр. Курс нацелен также на углубление навыков сопоставительного анализа переводов.

Междисциплинарные связи, работа в группах, разработка собственных исследовательских проектов и подготовка итоговых мультимедийных презентаций – особенность курса «Интермедиальная компаративистика». Ряд тем курса читается на английском и немецком языках. Часть лекций и семинарских занятий проводят приглашенные специалисты из университетов Европы и США, что способствует интернационализации магистерской программы.

Курс «Интермедиальная компаративистика» один из элективов, входящих в число специальных дисциплин магистерской программы. Он развивает положения обязательного общенаучного курса «Актуальные проблемы современной компаративистики. Язык и литература». При этом акцент сдвигается на сопоставление текстов различной знаковой природы. Важное место в курсе занимают визуальные тексты. Магистры получают навыки интермедиального сопоставительного анализа, интерпретации текстов разных знаковых систем. Различные разделы программы предполагают ознакомительный и творческий уровень изучаемого в них материала.

  1. Содержание курса

ТЕМА 1. Введение. соотношение бумажных и электронных средств информации в понимании М. МакЛюэна.

ТЕМА 2. Интермедиальная компаративистика в современном информационном обществе.

ТЕМА 3. Семиотика культуры. Сопоставление текстов различной знаковой природы. Сад как текст.

ТЕМА 5. Литература и фотография. Визуальная поэзия.

ТЕМА 6. Литература и музыка.

ТЕМА 7. Литература и живопись. Литература и архитектура.

Тема 8. Литература и кино. С.М. Эйзенштейн о принципе монтажа. Монтаж в литературе и кино.

ТЕМА 9. Сравнительный анализ сайтов Каннского кинофестифаля и Российского кинофестиваля в Гатчине.

ТЕМА 10. Литература и телевидение.

ТЕМА 11. Литература в сети «Интернет». Текст и «гипертекст». Сопоставление электронных библиотек. Системы поиска.

ТЕМА 12. Компаративный анализ символов зимних Олимпийских игр.

Основная литература

  1. Барт Р. Мифологии. М., 2010.

  2. Зинченко В.Г., Зусман В.Г., З.И. Кирнозе. Литература и методы ее изучения. Системно-синергетический подход. - М., 2011.

  3. Лотман Ю.М. Воспитание души. СПб, 2005.

  4. МакЛюэн М. Галактика Гутенберга. Сотворение человека печатной культуры. – Киев, 2004.

  5. Успенский Б.А Историко-филологические очерки. , М., 2004.

  6. A Companion to Literature and Film // (Editor), Alessandra Raengo (Editor). – Blackwell, 2000.

  7. Literatur- und Kulturtheorie / Hrsg. v. Ansgar Nünning. 2., überarbeitete und erweiterte Auflage. Stuttgart – Weimar, 2001.
1   2   3   4   5   6   7   8

Похожие:

Протокол iconДепартамент научно-технологической политики и образования
Утверждено решением Ученого совета Академии 27. 09. 2004 г. (протокол №1), с изменениями в соответствии с решением Ученого совета...
Протокол iconПротокол № Ильина О. С. Привалов Н. Т
Протокол № от мбоу «Татарско Кандызская сош» /Халиуллин И. Ш
Протокол iconПротокол № от 2011 г
Зам дир по увр с. П. Хлопушина от 2012г. № протокол №
Протокол iconСогласовано утверждено и введено
Мо протокол № педагогического совета школот 20 г протокол № от 20
Протокол iconПротокол от «28» 08. 2012г. №1
Рассмотрено и утверждено на заседании учёного совета факультета педагогики и психологии (протокол от 20 г. № )
Протокол iconПротокол №1 от «25» августа 2011 г
Обсуждена на заседании кафедры экономики производства 27 января 2009, протокол №9
Протокол iconПротокол заседания от «30» августа 2011г. №01
Рассмотрено и утверждено на заседании учёного совета факультета педагогики и психологии протокол от 2012 г. №
Протокол iconПриказ №94. 4 от 03. 09. 2012 И. В. Москаленко Протокол № от Протокол
Планируемые результаты освоения обучающимися основной образовательной программы основного общего образования
Протокол iconПротокол №3 от21. 03. 2012г. Принято на педагогическом Совете Протокол №5 от
Программы отдельных учебных предметов, курсов на ступени основного общего образования по фгос
Протокол iconПротокол№1 Протокол №1 Приказом школы №
Программа предназначена для учащихся 8 класса, изучающие предмет «немецкий язык» седьмой год и разработана на основе
Протокол iconПротокол № от 20 г. Председатель Рабочая программа «Деловой этикет и протокол»
Охватывают материал по страноведению англоязычных стран, речевому этикету и правилам написания делового письма
Протокол iconПротокол от 31. 08. 2011г. №1 согласована протокол заседания управляющего...
До революции село Вязовое являлось крупным волостным центром Грайворонского уезда Курской губернии. Здесь до 1917 года действовали...
Протокол iconПрограмма по дпи, разработана на основе базисного учебного плана...
Мо протокол № педагогического совета школот 20 г протокол № от 20
Протокол iconПротокол №1 от 29. 08. 2012г от 31. 08. 2012г
Рассмотрено и утверждено на заседании учёного совета факультета педагогики и психологии(протокол от «29»марта 2012 г. №8)
Протокол iconПротокол №1 от 31. 08. 2012 г
Рассмотрено и утверждено на заседании учёного совета факультета экономики и управления (протокол от 2012 г. № )
Протокол iconПротокол №3 от 01. 03. 2012 г
Рассмотрено и утверждено на заседании учёного совета факультета экономики и управления (протокол от 2012 г. № )


Школьные материалы


При копировании материала укажите ссылку © 2013
контакты
100-bal.ru
Поиск