Система разметки звучащей речи для сравнительного анализа произношения в различных диалектах

Ключевые слова: распознавание речи, диалект, звучащая речь, фонема, речевая база данных, диктор, дикторозависимость

Аннотация

Статья посвящена разработке системы разметки для сравнительного анализа произношения в различных диалектах русского языка. Подчеркнуто, что в настоящее время широко используется голосовой ввод с использованием голосовых помощников, чьей основной проблемой является распознавание различных диалектов. Проанализированы наиболее распространенные системы распознавания акцентов и диалектов романо-германских языков. Выделены принципиальные различия между дикторами. Показано, что фонетические особенности несут в себе информацию, достаточную для различения диалектов. Обосновано, что наличие в языке большого количества диалектов, требует создания акустических моделей для каждого из них. Поставлен акцент на анализ и моделирование просодической структуры диалектов русского языка, при этом просодический подход основан на учении об ударении, занимающийся слогами с точки зрения их ударности и протяженности. Отмечено, что диалекты русского языка проявляют существенные отличия друг от друга с точки зрения особенностей их просодической структуры, включая различия в их ритмической структуре, темпе речи и длительности гласных звуков. Описано разработанное программное обеспечение для разметки звучащей речи, позволяющее пользователю взаимодействовать с речевой базой данных. Показан интерфейс разработанной системы. Визуализация аудиозаписи представляет собой осциллограмму. Выделены основные и второстепенные сущности, использованные в базе данных. Отмечено, каждая из сущностей хранит определенную информацию, касающуюся фонем и диктора. На основе разработанной системы распознавания диалектов русского языка предполагается создание речевого корпуса, который позволит получать информацию о произношениях фонем по различным заданным параметрам.

Скачивания

Данные скачивания пока не доступны.

Биографии авторов

Юлия Ивановна Бутенко, Московский государственный технический университет им. Н. Э. Баумана

канд. тех. наук, доцент кафедры «Романо-германские языки», Московский государственный технический университет им. Н. Э. Баумана

Юрий Владимирович Строганов, Московский государственный технический университет им. Н. Э. Баумана

старший преподаватель кафедры «Программное обеспечение ЭВМ и информационные технологии», Московский государственный технический университет им. Н. Э. Баумана

Валерия Игоревна Шевченко

магистрант факультета «Лингвистика», Московский государственный технический университет им. Н. Э. Баумана

Николай Вадимович Славнов, Московский государственный технический университет им. Н. Э. Баумана

магистрант факультета «Информатика и управление», Московский государственный технический университет им. Н. Э. Баумана

Александр Владимирович Квасников, Московский государственный технический университет им. Н. Э. Баумана

магистрант факультета «Информатика и управление», Московский государственный технический университет им. Н. Э. Баумана

Литература

1. Voloshin V. G. Computer Linguistics. Sumy. University Book. 2004. 382 p.
2. Butenko Iu. I, Shostak I. V. Methodological Aspects of Speech Recognition on the basis of the Multidimensional Statistical Theory. Neurocomputers: Development, Application. 2018. No2. P. 23–33.
3. Potapova R. K., Potapov V. V. Speech Communication: from Sound to Statement. Moscow: Languages of Slavic cultures. 2012. 416 p.
4. An Exclusive Look at How AI and Machine Learning Work at Apple. – Pre-step mode: Available at URL. (date of access: 01.11.2019).
5. Let’s Talk Microsoft, Neural Networks and Natural Language Processing for AI. Avail- able at: URL (date of access: 25.10.2019).
6. How “Yandex” Created “Alice”. – Available at: URL (date of access: 01.11.2019).
7. Research Fears Technology Could Eradicate Regional Accents. – Available at: URL (date of access: 15.10.2019).
9. How does it work? Speech Recognition. – Available at: URL (date of access: 20.10.2019).
10. The Accent Gap // The Washington Post. – Available at: URL (date of access: 17.10.2019).
11. Kardava I., Antidze J., Gulua N. Solving the Problem of the Accents for Speech Recognition Systems. International Journal of Signal Processing Systems. 2016. 4(3). P. 235–238. DOI
12. Huang X., Acero A., Hon H. W., Foreword By-Reddy, R. Spoken Language Processing: A Guide to Theory, Algorithm, and System Development. New Jersey. PrenticeHall PTR. 2001. 960 p.
13. Frolov A. V. Synthesis and Speech Recognition. Up-to-date Solutions. Moscow. Svyaz. 2003. 216 p.
14. Izrailova E. S. On Creating Phonetic-acoustic Base for Chechen Speech Synthesis. Vestnik VSU, series: System analysis and information technologies. 2017. 2. P. 111–115.
15. Politsyn S. A., Politsyna E. V. Application of the Text Body Control Tools Complex for the Computer Linguistics Problems Solution (in Russian). Vestnik VSU, series: System analysis and information technologies. 2019. No 2. P. 134–142.
Опубликован
2020-03-24
Как цитировать
Бутенко, Ю. И., Строганов, Ю. В., Шевченко, В. И., Славнов, Н. В., & Квасников, А. В. (2020). Система разметки звучащей речи для сравнительного анализа произношения в различных диалектах. Вестник ВГУ. Серия: Системный анализ и информационные технологии, (1), 168-176. https://doi.org/10.17308/sait.2020.1/2631
Раздел
Компьютерная лингвистика и обработка естественного языка