Система разметки звучащей речи для сравнительного анализа произношения в различных диалектах

Авторы

DOI:

https://doi.org/10.17308/sait.2020.1/2631

Ключевые слова:

распознавание речи, диалект, звучащая речь, фонема, речевая база данных, диктор, дикторозависимость

Аннотация

Статья посвящена разработке системы разметки для сравнительного анализа произношения в различных диалектах русского языка. Подчеркнуто, что в настоящее время широко используется голосовой ввод с использованием голосовых помощников, чьей основной проблемой является распознавание различных диалектов. Проанализированы наиболее распространенные системы распознавания акцентов и диалектов романо-германских языков. Выделены принципиальные различия между дикторами. Показано, что фонетические особенности несут в себе информацию, достаточную для различения диалектов. Обосновано, что наличие в языке большого количества диалектов, требует создания акустических моделей для каждого из них. Поставлен акцент на анализ и моделирование просодической структуры диалектов русского языка, при этом просодический подход основан на учении об ударении, занимающийся слогами с точки зрения их ударности и протяженности. Отмечено, что диалекты русского языка проявляют существенные отличия друг от друга с точки зрения особенностей их просодической структуры, включая различия в их ритмической структуре, темпе речи и длительности гласных звуков. Описано разработанное программное обеспечение для разметки звучащей речи, позволяющее пользователю взаимодействовать с речевой базой данных. Показан интерфейс разработанной системы. Визуализация аудиозаписи представляет собой осциллограмму. Выделены основные и второстепенные сущности, использованные в базе данных. Отмечено, каждая из сущностей хранит определенную информацию, касающуюся фонем и диктора. На основе разработанной системы распознавания диалектов русского языка предполагается создание речевого корпуса, который позволит получать информацию о произношениях фонем по различным заданным параметрам.

Биографии авторов

  • Юлия Ивановна Бутенко, Московский государственный технический университет имени Н. Э. Баумана

    канд. тех. наук, доцент кафедры «Романо-германские языки», Московский государственный технический университет им. Н. Э. Баумана

  • Юрий Владимирович Строганов, Московский государственный технический университет имени Н. Э. Баумана

    старший преподаватель кафедры «Программное обеспечение ЭВМ и информационные технологии», Московский государственный технический университет им. Н. Э. Баумана

  • Валерия Игоревна Шевченко

    магистрант факультета «Лингвистика», Московский государственный технический университет им. Н. Э. Баумана

  • Николай Вадимович Славнов, Московский государственный технический университет имени Н. Э. Баумана

    магистрант факультета «Информатика и управление», Московский государственный технический университет им. Н. Э. Баумана

  • Александр Владимирович Квасников, Московский государственный технический университет имени Н. Э. Баумана

    магистрант факультета «Информатика и управление», Московский государственный технический университет им. Н. Э. Баумана

Библиографические ссылки

Загрузки

Опубликован

2020-03-24

Выпуск

Раздел

Компьютерная лингвистика и обработка естественного языка

Как цитировать

Система разметки звучащей речи для сравнительного анализа произношения в различных диалектах. (2020). Вестник ВГУ. Серия: Системный анализ и информационные технологии, 1, 168-176. https://doi.org/10.17308/sait.2020.1/2631