Система разметки звучащей речи для сравнительного анализа произношения в различных диалектах
Аннотация
Статья посвящена разработке системы разметки для сравнительного анализа произношения в различных диалектах русского языка. Подчеркнуто, что в настоящее время широко используется голосовой ввод с использованием голосовых помощников, чьей основной проблемой является распознавание различных диалектов. Проанализированы наиболее распространенные системы распознавания акцентов и диалектов романо-германских языков. Выделены принципиальные различия между дикторами. Показано, что фонетические особенности несут в себе информацию, достаточную для различения диалектов. Обосновано, что наличие в языке большого количества диалектов, требует создания акустических моделей для каждого из них. Поставлен акцент на анализ и моделирование просодической структуры диалектов русского языка, при этом просодический подход основан на учении об ударении, занимающийся слогами с точки зрения их ударности и протяженности. Отмечено, что диалекты русского языка проявляют существенные отличия друг от друга с точки зрения особенностей их просодической структуры, включая различия в их ритмической структуре, темпе речи и длительности гласных звуков. Описано разработанное программное обеспечение для разметки звучащей речи, позволяющее пользователю взаимодействовать с речевой базой данных. Показан интерфейс разработанной системы. Визуализация аудиозаписи представляет собой осциллограмму. Выделены основные и второстепенные сущности, использованные в базе данных. Отмечено, каждая из сущностей хранит определенную информацию, касающуюся фонем и диктора. На основе разработанной системы распознавания диалектов русского языка предполагается создание речевого корпуса, который позволит получать информацию о произношениях фонем по различным заданным параметрам.
Скачивания
Литература
2. Butenko Iu. I, Shostak I. V. Methodological Aspects of Speech Recognition on the basis of the Multidimensional Statistical Theory. Neurocomputers: Development, Application. 2018. No2. P. 23–33.
3. Potapova R. K., Potapov V. V. Speech Communication: from Sound to Statement. Moscow: Languages of Slavic cultures. 2012. 416 p.
4. An Exclusive Look at How AI and Machine Learning Work at Apple. – Pre-step mode: Available at URL. (date of access: 01.11.2019).
5. Let’s Talk Microsoft, Neural Networks and Natural Language Processing for AI. Avail- able at: URL (date of access: 25.10.2019).
6. How “Yandex” Created “Alice”. – Available at: URL (date of access: 01.11.2019).
7. Research Fears Technology Could Eradicate Regional Accents. – Available at: URL (date of access: 15.10.2019).
9. How does it work? Speech Recognition. – Available at: URL (date of access: 20.10.2019).
10. The Accent Gap // The Washington Post. – Available at: URL (date of access: 17.10.2019).
11. Kardava I., Antidze J., Gulua N. Solving the Problem of the Accents for Speech Recognition Systems. International Journal of Signal Processing Systems. 2016. 4(3). P. 235–238. DOI
12. Huang X., Acero A., Hon H. W., Foreword By-Reddy, R. Spoken Language Processing: A Guide to Theory, Algorithm, and System Development. New Jersey. PrenticeHall PTR. 2001. 960 p.
13. Frolov A. V. Synthesis and Speech Recognition. Up-to-date Solutions. Moscow. Svyaz. 2003. 216 p.
14. Izrailova E. S. On Creating Phonetic-acoustic Base for Chechen Speech Synthesis. Vestnik VSU, series: System analysis and information technologies. 2017. 2. P. 111–115.
15. Politsyn S. A., Politsyna E. V. Application of the Text Body Control Tools Complex for the Computer Linguistics Problems Solution (in Russian). Vestnik VSU, series: System analysis and information technologies. 2019. No 2. P. 134–142.
- Авторы сохраняют за собой авторские права и предоставляют журналу право первой публикации работы, которая по истечении 6 месяцев после публикации автоматически лицензируется на условиях Creative Commons Attribution License , которая позволяет другим распространять данную работу с обязательным сохранением ссылок на авторов оригинальной работы и оригинальную публикацию в этом журнале.
- Авторы имеют право размещать их работу в сети Интернет (например в институтском хранилище или персональном сайте) до и во время процесса рассмотрения ее данным журналом, так как это может привести к продуктивному обсуждению и большему количеству ссылок на данную работу (См. The Effect of Open Access).