Волченков В.А., Витязев В.В. «Методы и алгоритмы детектирования активности речи» Цифровая обработка сигналов, № 1, с. 54-60 (2013)
Проводится сравнительный анализ эффективности методов и алгоритмов детектирования участков активности речи и пауз между ними. Приведена общая информация о стандартизированных методах детектирования активности речи и оценка их производительности. Представлен новый способ обнаружения пауз в речи.
Цифровая обработка сигналов, № 1, с. 54-60 (2013) | Рубрика: 13.05
Леднов Д.А. «Анализ скрытых траекторных моделей резонаторов речевого тракта для систем распознавания фонем» Цифровая обработка сигналов, № 1, с. 2-8 (2013)
Приводится перевод и анализ оригинальных работ Li Deng и его коллег (компания Microsoft), появившихся в период с 2000 по 2010 год в области фонетического распознавания речи. Основное направление этих публикаций связано с разработкой модели скрытых траекторий параметров резонаторов вокального тракта. В ходе разработки было показано, как функционально зависит динамика коэффициентов линейного предсказания от параметров резонаторов вокального тракта, которые предварительно сглаживаются КИХ-фильтром. Затем, для этой зависимости введена статистическая модель, для которой поставлена и решена оптимизационная задача. Автор настоящей работы дополнил развитую модель уравнением непрерывности, которое позволяет определить характеристики КИХ-фильтров для каждого фонетического состояния и ввел альтернативную оптимизационную схему, позволяющую определять параметры статистической модели.
Цифровая обработка сигналов, № 1, с. 2-8 (2013) | Рубрика: 13.05

