Скачать 62.08 Kb.
|
РефератОтчет 563 с., 2 тома., 45 рис., 34 табл., 35 источников, 9 прил. КЛЮЧЕВЫЕ СЛОВА: звуковой корпус русского языка, грамматика речи, многоуровневая лингвистическая разметка, СПонтанная речь, ФОНЕТИКА, повседневная коммуникация, информационные и речевые технологии Проект «Звуковое описание грамматических единиц русского языка: информационно-коммуникативный подход» направлен на решение актуальной задачи описания грамматических единиц русской звучащей речи (предложения, словоформы, морфемы) на основе звукового корпуса русского языка повседневного общения с привлечением современных информационных методик. Объект исследования или разработки Объектом исследования является живая спонтанная речь на русском языке, используемая в повседневном общении – ее грамматика и фонетика. Исследование предполагает анализ ряда социологических факторов (возраст, образование, профессия), психологического типа говорящего и других условий общения в реальных коммуникативных ситуациях. Объектом разработки является речевой корпус русского языка повседневного общения, составленный из звукозаписей всей речевой деятельности информантов в течение суток («Один речевой день» или ОРД). Корпус интегрируется с информационно-исследовательской средой, состоящей из базы данных, средств лингвистического аннотирования и утилит автоматической обработки данных на фонетическом, лексическом и грамматическом уровнях. Цели и задачи проекта Основной целью проекта является описание реальной «грамматики речи» современного русского языка в естественных коммуникативных ситуациях. В частности, предполагается получить описание таких грамматических единиц, как предложение, словосочетание, словоформа, морфема. Осуществление этой цели стало возможно лишь в наши дни при условии привлечения последних достижений в области информационных и речевых технологий. . Метод или методология проведения работы - методы и подходы полевой лингвистики (интервьюирование, анкетирование и др.); - методы речевых технологий (комплекс методов звукозаписи, обработки и анализа речевых процессов; построение речевых баз данных); - методы корпусной лингвистики; - методы лингвистического аннотирования (орфографическая расшифровка, транскрибирование, паузация с дифференциацией длительности физических пауз, синтаксическое пунктирование (экспериментальная расстановка точек), частеречная и синтаксическая разметка и др.; - статистические методы обработки данных; - методы социологического анализа, направленные на получение сбалансированной выборки группы информантов; - методы психологического тестирования; - информационные методы построения мультимедийных баз данных; - методика звукозаписи «одного речевого дня» (аудиомониторинг всей речевой деятельности информантов, принимающих участие в реализации проекта, и их коммуникантов в течение одного или нескольких дней). Результаты работы На первом этапе работы по проекту (1-2 кварталы 2009 г.) в соответствии с календарным планом были решены следующие задачи: 1. Разработана методика проведения звукозаписей повседневной речи (организационные, технологические, психологические, социологические, правовые аспекты). Подготовлены инструкции, социологические опросники, психологические анкеты для информантов, а также таблицы для ведения дневника речевого дня и социальных характеристик основных коммуникантов. Результаты анкетирования 30 информантов обработаны и представлены в базе данных. 2. К настоящему времени записано 280 часов звучания, полученные от 35 информантов (15 мужчин и 20 женщин). Звукозаписи переформатированы, убраны длительные (больше 5 минут) шумовые фрагменты, не содержащие речи. Звукозаписи разрезаны на эпизоды по принципу общих условий коммуникации и качества звукозаписи. В результате было получено 686 файлов-эпизодов общей продолжительностью 190 часов. Работа по сбору речевого материала продолжается. 3. Разработана структура речевого корпуса «Один речевой день» (ОРД), состоящая из разных модулей и типов данных: звуковых файлов разных форматов, файлов аннотаций, словарей (частотных, конкордансов), текстовых файлов и др. 4. Подготовлены методики многоуровневого аннотирования данных на лингвистическом и паралингвистическом уровнях. Определены основные типы данных лингвистической разметки, их структурно-системная иерархия. Определены правила членения материала на фонетическом, лексическом, грамматическом уровнях. 5. Осуществлена расшифровка 9 часов звукозаписей и их многоуровневое аннотирование в профессиональной программе ELAN. 6. Разработан действующий макет специализированной базы данных речевого корпуса в формате MS Access, объединяющей все типы релевантной информации от описания информантов до расшифровок записей. Из среды базы данных возможно прослушивание всех 190 часов звучания - отформатированных ord-файлов, а также отдельных фраз и слов для тех файлов, которые были соответствующим образом рассегментированы (381 фраза, 2509 слов). 7. Параллельно с созданием корпуса начато исследованию особенностей фонетики и грамматики повседневной речи в зависимости от таких факторов, как социально-психологические особенности говорящего. Продолжается многоуровневая разметка данных и создание комплекса утилит для обработки аннотированных данных. Основные конструктивные, технологические и технико-эксплуатационные характеристики Речевой материал: 190 часов звучания, 686 файлов, формат WAV, 22050 Гц, 16 бит, моно. Файлы аннотации: 9 часов звучания, 37 файлов, формат EAF, 8 уровней сегментации, 50000 словоупотреблений. Сегментация на слова: 40 минут звучания, 2 файла, формат EAF, 2500 слов. База данных: формат MS Access 2003, 13 основных таблиц, возможность озвучивания как всех файлов речевого корпуса, так и изолированно отсегментированных единиц (фраз, слов, морфем). Степень внедрения. Итоги внедрения результатов НИР По мере обработки материал поступает в Национальный корпус русского языка, где представлен в подкорпусе "Устный корпус. Из материалов корпуса "Один речевой день", подготовленного группой А.С.Асиновского". В НКРЯ уже переданы тексты расшифровок объемом 40000 словоупотреблений. Звуковой корпус используется как образец на занятиях по спецкурсу «Полевая лингвистика», читаемому на факультете филологии и искусств СПбГУ. На речевом материале корпуса проводятся практические занятия по фонетике и грамматике русского языка для студентов, осуществляются исследования в рамках курсовых, дипломных, кандидатских и докторских научных работ. Область применения Важность и актуальность реализации предлагаемого проекта определяется прежде всего высокой практической значимостью адекватного описания речевого поведения человека в реальном мире и все возрастающей востребованностью современных систем сбора, хранения и анализа речевого материала как для решения фундаментальных научных задач, так и для решения актуальных прикладных задач в области речевых технологий. Среди них: 1) собственно лингвистические исследования: - описание звуковой формы выявляемых в речи грамматических единиц; - создание лексикографического описания бытовой спонтанной звучащей речи; - описание дистрибуции грамматических классов слов и их форм в устной речи разных социальных групп; 2) лингводидактика: - обучение русскому языку нерусских; - изучение грамматики речи в русской филологической аудитории; 3) прикладная лингвистика, речевые технологии: - решение задач обработки естественного языка/речи; - решение задач интегрального моделирования звуковой формы, - синтез и распознавание речи. Экономическая эффективность или значимость работы . Экономическая значимость работы определяется уникальностью разрабатываемого продукта – речевого корпуса повседневной речи, использование которого может быть востребовано в самых разных областях от решения образовательных и фундаментальных научных задач до внедрения в практику (напр., для отладки телекоммуникационных систем, развития информационных и речевых технологий, решения задач судебной и криминальной фонетики и т. п.). Прогнозные предположения о развитии объекта исследования На втором этапе работы (3-4 кварталы 2009г.) по теме «Звуковое описание грамматических единиц русского языка: информационно-коммуникативный подход» планируется решение следующих задач: - запись по методике ОРД как минимум 5 информантов, - работа по расшифровке, многоуровневой разметке и аннотированию звукозаписей, получению реальной фонетической транскрипции, заполнению базы данных, созданию программ обработки аннотированного материала, - продолжится исследование по выявлению в речи говорящих лексико-грамматических, синтаксических, прагматических особенностей в зависимости от их собственных психологических и социальных характеристик, а также от их социальной роли в коммуникации. - будет создан и описан словарь языка повседневного общения, реализован звуковой морфемарий на 1000 морфо-употреблений. |
Реферат Отчет 35 с., 3 главы, 16 рис., 1 табл., 12 источников, 5 прил Объектом разработки является программа восстановления каркасных 3D объектов по 2D проекциям | Реферат по проекту рнп 2 4186 Отчет 55 с., 8 ч., 15 рис., 2 табл., 124 источников, 1 прил Ортологи гена sbr имеются у всех исследованных на этот предмет эукариот. Мутантные аллели гена | ||
Реферат Отчет с., 4 ч., 38 рис., 15 табл., 28 источников, 3 прил Малогабаритные штанговые опрыскиватели, Электрические сети, эффективность вентиляции, дефлектор, комбинезон для защиты от микроорганизмов,... | Реферат Отчет 177 с., 3 ч., 199 рис., 12 табл., 72 источников, 1 прил Целью проекта является создание нового метода столкновительной электронной спектроскопии (ces) и связанных с ним исследований в области... | ||
Реферат Дипломный проект с. 114, рис. 4, табл. 17, источников 15, прил. 4 Целью работы является проектирование основного электровозного депо пассажирских электровозов постоянного тока серии чс | Реферат Пояснительная записка: с., рис., табл., приложений, источников.... Пояснительная записка: с., рис., табл., приложений, источников | ||
Реферат Отчет 50 с., 1 ч., 22 рис., 14 табл., 22 источн., 2 прил Переработка, зерно, ферменты, ресурсосбережение, безопасность, технологии, методы, хлебобулочные, макаронные, мучные кондитерские... | Реферат Отчет 24 с., 6 рис., 10 табл., 7 источников, 1 прил. Зелёные... Зелёные клетки, хлорофилл-комплекс, продукт «gl-грин лайт», адаптоген, протекторные свойства, оздоравливающий эффект, неспецифическая... | ||
Реферат Отчет 118 с., 7 ч., 30 рис., 12 табл., 43 источника, 1 прил Центральной проблемой водородной энергетики являются большие затраты на хранение и транспортировку водорода. Наиболее безопасными... | Реферат Отчет 57 с., 3 ч., 8 рис., 10 табл.,109 источников, без прил... Рожденный иммунитет, иглокожие, асцидии, приобретенный иммунитет, стволовые клетки, регенерация, репарация, проточная цитометрия,... | ||
Реферат Отчёт содержит: 189 с., 94 рис., 5 табл., 45 источников Целью работы является набор экспериментальных данных в физических сеансах измерений при энергии сталкивающихся пучков протонов до... | Реферат Курсовая работа: 40 с., 5 рис., 7 табл., 21 источник, 3 прил Анализ, динамика спроса, прогнозирование, методы прогнозирвоания, экстрополяция, тренд | ||
Реферат Отчет 232 с., 4 ч., 53 рис., 29 табл., 197 источников Ландшафт, динамика, факторы, высотная поясность, горы, котловины, климат, рельеф, ледник, река, сток, природопользование, освоение,... | Реферат Отчет 33 с., 2 ч., 26 рис., 2 табл., 7 источников Ключевые слова: фазовый химический состав, эффективный заряд атомов, рентгеновская эмиссионная спектроскопия, спектроскопия отражения... | ||
Реферат в данном дипломном проекте всего: стр. 123, рис. 29, табл.... Тяговая подстанция, распределительное устройство, трансформатор, ток короткого замыкания, преобразовательный агрегат, стуктурная... | Реферат Отчет 99 с., 7 ч., 47 рис., 28 табл., 26 источников Проект направлен на изучение термодинамической стабильности, структуры и свойств минеральных фаз, содержащих радиоактивные и токсичные... |