Российский фонд
фундаментальных
исследований

Физический факультет
МГУ им. М.В.Ломоносова
 

12.01 Компьютерная обработка результатов эксперимента

 

Рыжков А.П., Катков О.Н., Сафронова Н.А. «Алгоритмы кодирования и декодирования речевого сигнала на основе взаимозависимых кодовых книг» Нелинейный мир, 21, № 3, с. 5-15 (2023)

Постановка проблемы. На сегодняшний день совершенствование систем кодирования/декодирования (кодеки) речевого сигнала (РС), основанных на методе предсказания с возбуждением от кода, является актуальной задачей, что обусловлено их активным использованием в сфере инфокоммуникаций, в частности, для низкоскоростной передачи речи. Характерные особенности таких кодеков – кодовые книги, содержащие элементы декомпозиции РС на этапе анализа. Поскольку существующий уровень развития систем не предполагает кодирования речи с учетом взаимной связи указанных элементов, это, в свою очередь, не позволяет реализовать преимущества векторного квантования при кодировании РС. Цель. Разработать систему и алгоритмы кодирования/декодирования РС, учитывающие взаимозависимости сигналов возбуждения и параметров, описывающих передаточную функцию голосового тракта, а также представить реализацию кодовых книг на основе нейросетевых технологий с предварительной классификацией сегментов РС. Результаты. Разработан алгоритм классификации сегментов активной речи, который обеспечивает возможность использования нейросетевого векторного квантования элементов декомпозиции при кодировании РС. Для обеспечения высокой скорости обучения и поиска в кодовых книгах элементов декомпозиции использованы нейронные сети радиальных базисных функций. Представлены алгоритмы кодирования/декодирования для постоянной скорости передачи уменьшение числа бит, назначаемых для представления вектора сигнала возбуждения, и снижение скорости передачи, что обуславливается учетом взаимосвязей элементов декомпозиции. Проверка разработанных алгоритмов подтвердила их соответствие предъявляемым к ним требованиям и возможность реализации на современной элементной базе при модернизации и разработке перспективных комплексов обработки РС. Практическая значимость. Предложенные алгоритмы можно использовать в системах низкоскоростной передачи и обработки РС при достаточном качестве синтезированной речи.

Нелинейный мир, 21, № 3, с. 5-15 (2023) | Рубрики: 12.01 13.05