Реферат Отчет 563 с., 2 тома., 45 рис., 34 табл., 35 источников, 9 прил





Скачать 62.08 Kb.
НазваниеРеферат Отчет 563 с., 2 тома., 45 рис., 34 табл., 35 источников, 9 прил
Дата публикации22.05.2015
Размер62.08 Kb.
ТипРеферат
100-bal.ru > Литература > Реферат

Реферат



Отчет 563 с., 2 тома., 45 рис., 34 табл., 35 источников, 9 прил.

КЛЮЧЕВЫЕ СЛОВА: звуковой корпус русского языка, грамматика речи, многоуровневая лингвистическая разметка, СПонтанная речь, ФОНЕТИКА, повседневная коммуникация, информационные и речевые технологии

Проект «Звуковое описание грамматических единиц русского языка: информационно-коммуникативный подход» направлен на решение актуальной задачи описания грамматических единиц русской звучащей речи (предложения, словоформы, морфемы) на основе звукового корпуса русского языка повседневного общения с привлечением современных информационных методик.
Объект исследования или разработки
Объектом исследования является живая спонтанная речь на русском языке, используемая в повседневном общении – ее грамматика и фонетика. Исследование предполагает анализ ряда социологических факторов (возраст, образование, профессия), психологического типа говорящего и других условий общения в реальных коммуникативных ситуациях.

Объектом разработки является речевой корпус русского языка повседневного общения, составленный из звукозаписей всей речевой деятельности информантов в течение суток («Один речевой день» или ОРД). Корпус интегрируется с информационно-исследовательской средой, состоящей из базы данных, средств лингвистического аннотирования и утилит автоматической обработки данных на фонетическом, лексическом и грамматическом уровнях.
Цели и задачи проекта
Основной целью проекта является описание реальной «грамматики речи» современного русского языка в естественных коммуникативных ситуациях. В частности, предполагается получить описание таких грамматических единиц, как предложение, словосочетание, словоформа, морфема. Осуществление этой цели стало возможно лишь в наши дни при условии привлечения последних достижений в области информационных и речевых технологий. .
Метод или методология проведения работы
- методы и подходы полевой лингвистики (интервьюирование, анкетирование и др.);
- методы речевых технологий (комплекс методов звукозаписи, обработки
и анализа речевых процессов; построение речевых баз данных);

- методы корпусной лингвистики;

- методы лингвистического аннотирования (орфографическая расшифровка, транскрибирование, паузация с дифференциацией длительности физических пауз, синтаксическое пунктирование (экспериментальная расстановка точек), частеречная и синтаксическая разметка и др.;

- статистические методы обработки данных;

- методы социологического анализа, направленные на получение сбалансированной выборки группы информантов;

- методы психологического тестирования;

- информационные методы построения мультимедийных баз данных;

- методика звукозаписи «одного речевого дня» (аудиомониторинг всей речевой деятельности информантов, принимающих участие в реализации проекта, и их коммуникантов в течение одного или нескольких дней).
Результаты работы
На первом этапе работы по проекту (1-2 кварталы 2009 г.) в соответствии с календарным планом были решены следующие задачи:

1. Разработана методика проведения звукозаписей повседневной речи (организационные, технологические, психологические, социологические, правовые аспекты). Подготовлены инструкции, социологические опросники, психологические анкеты для информантов, а также таблицы для ведения дневника речевого дня и социальных характеристик основных коммуникантов. Результаты анкетирования 30 информантов обработаны и представлены в базе данных.

2. К настоящему времени записано 280 часов звучания, полученные от 35 информантов (15 мужчин и 20 женщин). Звукозаписи переформатированы, убраны длительные (больше 5 минут) шумовые фрагменты, не содержащие речи. Звукозаписи разрезаны на эпизоды по принципу общих условий коммуникации и качества звукозаписи. В результате было получено 686 файлов-эпизодов общей продолжительностью 190 часов. Работа по сбору речевого материала продолжается.

3. Разработана структура речевого корпуса «Один речевой день» (ОРД), состоящая из разных модулей и типов данных: звуковых файлов разных форматов, файлов аннотаций, словарей (частотных, конкордансов), текстовых файлов и др.

4. Подготовлены методики многоуровневого аннотирования данных на лингвистическом и паралингвистическом уровнях. Определены основные типы данных лингвистической разметки, их структурно-системная иерархия. Определены правила членения материала на фонетическом, лексическом, грамматическом уровнях.

5. Осуществлена расшифровка 9 часов звукозаписей и их многоуровневое аннотирование в профессиональной программе ELAN.

6. Разработан действующий макет специализированной базы данных речевого корпуса в формате MS Access, объединяющей все типы релевантной информации от описания информантов до расшифровок записей. Из среды базы данных возможно прослушивание всех 190 часов звучания - отформатированных ord-файлов, а также отдельных фраз и слов для тех файлов, которые были соответствующим образом рассегментированы (381 фраза, 2509 слов).

7. Параллельно с созданием корпуса начато исследованию особенностей фонетики и грамматики повседневной речи в зависимости от таких факторов, как социально-психологические особенности говорящего. Продолжается многоуровневая разметка данных и создание комплекса утилит для обработки аннотированных данных.
Основные конструктивные, технологические и технико-эксплуатационные характеристики

Речевой материал: 190 часов звучания, 686 файлов, формат WAV, 22050 Гц, 16 бит, моно.

Файлы аннотации: 9 часов звучания, 37 файлов, формат EAF, 8 уровней сегментации, 50000 словоупотреблений.

Сегментация на слова: 40 минут звучания, 2 файла, формат EAF, 2500 слов.

База данных: формат MS Access 2003, 13 основных таблиц, возможность озвучивания как всех файлов речевого корпуса, так и изолированно отсегментированных единиц (фраз, слов, морфем).
Степень внедрения. Итоги внедрения результатов НИР

По мере обработки материал поступает в Национальный корпус русского языка, где представлен в подкорпусе "Устный корпус. Из материалов корпуса "Один речевой день", подготовленного группой А.С.Асиновского". В НКРЯ уже переданы тексты расшифровок объемом 40000 словоупотреблений.

Звуковой корпус используется как образец на занятиях по спецкурсу «Полевая лингвистика», читаемому на факультете филологии и искусств СПбГУ. На речевом материале корпуса проводятся практические занятия по фонетике и грамматике русского языка для студентов, осуществляются исследования в рамках курсовых, дипломных, кандидатских и докторских научных работ.

Область применения

Важность и актуальность реализации предлагаемого проекта определяется прежде всего высокой практической значимостью адекватного описания речевого поведения человека в реальном мире и все возрастающей востребованностью современных систем сбора, хранения и анализа речевого материала как для решения фундаментальных научных задач, так и для решения актуальных прикладных задач в области речевых технологий. Среди них:

1) собственно лингвистические исследования:

- описание звуковой формы выявляемых в речи грамматических единиц;

- создание лексикографического описания бытовой спонтанной звучащей речи;

- описание дистрибуции грамматических классов слов и их форм в устной речи разных социальных групп;

2) лингводидактика:

- обучение русскому языку нерусских;

- изучение грамматики речи в русской филологической аудитории;

3) прикладная лингвистика, речевые технологии:

- решение задач обработки естественного языка/речи;

- решение задач интегрального моделирования звуковой формы,

- синтез и распознавание речи.

Экономическая эффективность или значимость работы

. Экономическая значимость работы определяется уникальностью разрабатываемого продукта – речевого корпуса повседневной речи, использование которого может быть востребовано в самых разных областях от решения образовательных и фундаментальных научных задач до внедрения в практику (напр., для отладки телекоммуникационных систем, развития информационных и речевых технологий, решения задач судебной и криминальной фонетики и т. п.).

Прогнозные предположения о развитии объекта исследования

На втором этапе работы (3-4 кварталы 2009г.) по теме «Звуковое описание грамматических единиц русского языка: информационно-коммуникативный подход» планируется решение следующих задач:

- запись по методике ОРД как минимум 5 информантов,

- работа по расшифровке, многоуровневой разметке и аннотированию звукозаписей, получению реальной фонетической транскрипции, заполнению базы данных, созданию программ обработки аннотированного материала,

- продолжится исследование по выявлению в речи говорящих лексико-грамматических, синтаксических, прагматических особенностей в зависимости от их собственных психологических и социальных характеристик, а также от их социальной роли в коммуникации.

- будет создан и описан словарь языка повседневного общения, реализован звуковой морфемарий на 1000 морфо-употреблений.

Добавить документ в свой блог или на сайт

Похожие:

Реферат Отчет 563 с., 2 тома., 45 рис., 34 табл., 35 источников, 9 прил iconРеферат Отчет 35 с., 3 главы, 16 рис., 1 табл., 12 источников, 5 прил
Объектом разработки является программа восстановления каркасных 3D объектов по 2D проекциям
Реферат Отчет 563 с., 2 тома., 45 рис., 34 табл., 35 источников, 9 прил iconРеферат по проекту рнп 2 4186 Отчет 55 с., 8 ч., 15 рис., 2 табл., 124 источников, 1 прил
Ортологи гена sbr имеются у всех исследованных на этот предмет эукариот. Мутантные аллели гена
Реферат Отчет 563 с., 2 тома., 45 рис., 34 табл., 35 источников, 9 прил iconРеферат Отчет с., 4 ч., 38 рис., 15 табл., 28 источников, 3 прил
Малогабаритные штанговые опрыскиватели, Электрические сети, эффективность вентиляции, дефлектор, комбинезон для защиты от микроорганизмов,...
Реферат Отчет 563 с., 2 тома., 45 рис., 34 табл., 35 источников, 9 прил iconРеферат Отчет 177 с., 3 ч., 199 рис., 12 табл., 72 источников, 1 прил
Целью проекта является создание нового метода столкновительной электронной спектроскопии (ces) и связанных с ним исследований в области...
Реферат Отчет 563 с., 2 тома., 45 рис., 34 табл., 35 источников, 9 прил iconРеферат Дипломный проект с. 114, рис. 4, табл. 17, источников 15, прил. 4
Целью работы является проектирование основного электровозного депо пассажирских электровозов постоянного тока серии чс
Реферат Отчет 563 с., 2 тома., 45 рис., 34 табл., 35 источников, 9 прил iconРеферат Пояснительная записка: с., рис., табл., приложений, источников....
Пояснительная записка: с., рис., табл., приложений, источников
Реферат Отчет 563 с., 2 тома., 45 рис., 34 табл., 35 источников, 9 прил iconРеферат Отчет 50 с., 1 ч., 22 рис., 14 табл., 22 источн., 2 прил
Переработка, зерно, ферменты, ресурсосбережение, безопасность, технологии, методы, хлебобулочные, макаронные, мучные кондитерские...
Реферат Отчет 563 с., 2 тома., 45 рис., 34 табл., 35 источников, 9 прил iconРеферат Отчет 24 с., 6 рис., 10 табл., 7 источников, 1 прил. Зелёные...
Зелёные клетки, хлорофилл-комплекс, продукт «gl-грин лайт», адаптоген, протекторные свойства, оздоравливающий эффект, неспецифическая...
Реферат Отчет 563 с., 2 тома., 45 рис., 34 табл., 35 источников, 9 прил iconРеферат Отчет 118 с., 7 ч., 30 рис., 12 табл., 43 источника, 1 прил
Центральной проблемой водородной энергетики являются большие затраты на хранение и транспортировку водорода. Наиболее безопасными...
Реферат Отчет 563 с., 2 тома., 45 рис., 34 табл., 35 источников, 9 прил iconРеферат Отчет 57 с., 3 ч., 8 рис., 10 табл.,109 источников, без прил...
Рожденный иммунитет, иглокожие, асцидии, приобретенный иммунитет, стволовые клетки, регенерация, репарация, проточная цитометрия,...
Реферат Отчет 563 с., 2 тома., 45 рис., 34 табл., 35 источников, 9 прил iconРеферат Отчёт содержит: 189 с., 94 рис., 5 табл., 45 источников
Целью работы является набор экспериментальных данных в физических сеансах измерений при энергии сталкивающихся пучков протонов до...
Реферат Отчет 563 с., 2 тома., 45 рис., 34 табл., 35 источников, 9 прил iconРеферат Курсовая работа: 40 с., 5 рис., 7 табл., 21 источник, 3 прил
Анализ, динамика спроса, прогнозирование, методы прогнозирвоания, экстрополяция, тренд
Реферат Отчет 563 с., 2 тома., 45 рис., 34 табл., 35 источников, 9 прил iconРеферат Отчет 232 с., 4 ч., 53 рис., 29 табл., 197 источников
Ландшафт, динамика, факторы, высотная поясность, горы, котловины, климат, рельеф, ледник, река, сток, природопользование, освоение,...
Реферат Отчет 563 с., 2 тома., 45 рис., 34 табл., 35 источников, 9 прил iconРеферат Отчет 33 с., 2 ч., 26 рис., 2 табл., 7 источников
Ключевые слова: фазовый химический состав, эффективный заряд атомов, рентгеновская эмиссионная спектроскопия, спектроскопия отражения...
Реферат Отчет 563 с., 2 тома., 45 рис., 34 табл., 35 источников, 9 прил iconРеферат в данном дипломном проекте всего: стр. 123, рис. 29, табл....
Тяговая подстанция, распределительное устройство, трансформатор, ток короткого замыкания, преобразовательный агрегат, стуктурная...
Реферат Отчет 563 с., 2 тома., 45 рис., 34 табл., 35 источников, 9 прил iconРеферат Отчет 99 с., 7 ч., 47 рис., 28 табл., 26 источников
Проект направлен на изучение термодинамической стабильности, структуры и свойств минеральных фаз, содержащих радиоактивные и токсичные...


Школьные материалы


При копировании материала укажите ссылку © 2013
контакты
100-bal.ru
Поиск