Сжатие аудиоданных на основе психоакустических принципов восприятия звука человеком
DOI:
https://doi.org/10.17308/sait/1995-5499/2024/3/127-137Ключевые слова:
аудиоданные, сжатие аудиоданных, психоакустическая модель, спектр, квантование по уровнюАннотация
В статье представлен новый метод сжатия аудиоданных с потерями. Метод базируется на психоакустических принципах восприятия звука человеком. Учет данных принципов позволяет получить метод сжатия аудиоданных различной природы: музыкальных композиций, речевого сигнала, различных звуков другого происхождения. Стоит отметить, что каждый из них имеет свои особенности. Речевые сигналы содержат паузы и имеют менее разнообразный частотный диапазон по отношению к музыке, что приводит к разработке специфических методов их компрессии. Целью построения представленной теории сжатия аудиоданных с потерями является достижение равенства исходного и восстановленного сигналов в перцептуальном смысле. Именно такой подход позволяет получить метод сжатия аудиоданных, который позволяет в значительной степени уменьшить битовое представление аудиосигнала, оставляя его на слух очень близким к оригиналу. Большое внимание при разработке метода уделено квантованию по уровню, причем при квантовании спектральных составляющих сигнала используется теория едва заметных изменений звука. Представляется целесообразным учет этой теории, поскольку она является значимой при обработке аудиосигналов, однако, до сих пор не была использована при разработке методов сжатия аудиоданных. Предлагаемая в статье процедура квантования по уровню сочетает в себе преимущества как адаптивного, так и равномерного квантования. Для адаптивного квантования основное преимущество это значительно меньшее число уровней квантования, которое необходимо для достижения сопоставимого с равномерным квантованием уровня шума квантования. Представленный метод квантования, который являясь по сути неравномерным (адаптивным) не требует передачи значения каждого из уровней квантования (или шага квантования). Кроме того, ошибка квантования в разработанном методе не превышает 1 дБ, что является порогом едваразличимых изменений звука.
Библиографические ссылки
Загрузки
Опубликован
Выпуск
Раздел
Лицензия
- Авторы сохраняют за собой авторские права и предоставляют журналу право первой публикации работы, которая по истечении 6 месяцев после публикации автоматически лицензируется на условиях Creative Commons Attribution License , которая позволяет другим распространять данную работу с обязательным сохранением ссылок на авторов оригинальной работы и оригинальную публикацию в этом журнале.
- Авторы имеют право размещать их работу в сети Интернет (например в институтском хранилище или персональном сайте) до и во время процесса рассмотрения ее данным журналом, так как это может привести к продуктивному обсуждению и большему количеству ссылок на данную работу (См. The Effect of Open Access).













