Исследование признакового пространства для описания отрезков речевых сигналов в задачах распознавания устной речи

Ключевые слова: речевой сигнал, признаки, субполосный метод, мел шкала, частотная ось, доли энергии, энтропия

Аннотация

В данной работе рассматривается набор признаков для описания отрезков речевых сигналов с точки зрения их информативности. Наборы признаков используются в задачах распознавания. От информативности набора признаков во многом зависит успех решения задач распознавания. Информативность набора признаков оценивается с помощью информационной энтропии. В данной работе производится сравнение информационной энтропии для наборов признаков, полученных с помощью метода Фурье и субполосного метода. Также рассматриваются модификации этих методов для анализа речевых сигналов, а именно переход к мел шкале. Кроме мел шкалы, для субполосного метода рассматриваются и другие искажения частотной оси. В работе приводятся результаты вычисления информационной энтропии для разных способов получения набора признаков, описывающих отрезки речевых сигналов. В результате делается вывод о повышении информативности набора признаков при использовании субполосного метода с нелинейным разбиением частотной оси на полосы анализа.

Скачивания

Данные скачивания пока не доступны.

Биографии авторов

Евгений Георгиевич Жиляков, Белгородский государственный национальный исследовательский университет

д-p техн. наук, проф., заведующий кафедрой информационно-телекоммуникационных систем и технологий, Белгородский государственный национальный исследовательский университет

Алексей Владимирович Болдышев, Белгородский филиал ПАО «Ростелеком»

канд. техн. наук, начальник участка систем коммутаций No1 Белгородского филиала ПАО «Ростелеком»

Сергей Вячеславович Уманец, Белгородский филиал ПАО «Ростелеком»

ведущий инженер участка систем коммутаций No1 Белгородского филиала ПАО «Ростелеком»

Литература

1. Boldyshev A. V., Medvedeva A. A., Prokhorenko E. I. Parametric description of speech sounds in the recognition problem // Scientific Bulletin of Belgorod State University Economics, Informatics. 2017. No 23 (272). V. 44. P. 159–169.
2. Zhilyakov E. G., Boldyshev A. V., Trubitsy­na D. I., Prokhorenko E. I. On the use of subband analysis and synthesis of signals in the field of determining the cosine transform when solving problems of compression of speech signals // Scientific Bulletin of Belgorod State University Economics, Informatics. 2019. V. 46. No 4(44). P. 700–710.
3. Shannon C. E. A mathematical theory of communication // Bell System Technical Journal. 1948. (27) P. 379–423, 623–656.
4. Zhilyakov E. G. Optimal sub-band methods for analysis and synthesis of finite-duration signals // Automation and Remote Control. 2015. No 4. P. 51–66. DOI
5. Sergienko A. B. Cifrovaya obrabotka signalov [Digital signal processing] St. Petersburg : Piter publ, 2005 (in Russian).
6. Il’in V. A., Sadovnichiy V. A., Sendov B. H. Matematicheskiy analiz. Prodolzenie kursa [Mathematical analysis. Continuation of the course]. Moscow : MSU publ. 1985 (in Russian).
7. Ruchai A. N. Biometricheskaya autentifikatsiya dictora v Matlab: uchebnoe posobie [Biometric Speaker Authentication in Matlab: A Tutorial] Moscow : Rusains publ. 2017 (in Russian).
8. Tsviker E., Feldkeller E. Ukho kak priemnik informatsii [The ear as a receiver of information] Moscow : Svyaz publ. 1971.
9. Aldoshina I. A. Basics of psychoacoustics. Book archive Klex.ru. 2018. Available at: URL
10. Vologdin E. I. Slukh i vospriyatie zvuka: uchebnoe posobie [Hearing and Sound Perception: A Study Guide] St. Petersburg : Facultet DVO publ. 2004 (in Russian)
11. Burtsev N. N. About full scale note frequencies Oberton Pro forum. 2011. Available at: URL
Опубликован
2021-02-02
Как цитировать
Жиляков, Е. Г., Болдышев, А. В., & Уманец, С. В. (2021). Исследование признакового пространства для описания отрезков речевых сигналов в задачах распознавания устной речи. Вестник ВГУ. Серия: Системный анализ и информационные технологии, (4), 111-120. https://doi.org/10.17308/sait.2020.4/3208
Раздел
Компьютерная лингвистика и обработка естественного языка

Наиболее читаемые статьи этого автора (авторов)