Российский фонд
фундаментальных
исследований

Физический факультет
МГУ им. М.В.Ломоносова
 

Информационные технологии и вычислительные системы. 2022, № 1

 

Жиляков Е.Г., Белов С.П., Белов А.С., Медведева А.А. «Обнаружение пауз между словными фрагментами записей речевых сигналов» Информационные технологии и вычислительные системы, № 1, с. 40-46 (2022)

Рассматривается задача сегментации записей речевых сигналов на отрезки, порождаемые в присутствии речи (словные отрезки), и паузы между ними. Такая сегментация является важным этапом идентификации речевых компонент на основе некоторых признаков. Предполагается, что отрезки речевого сигнала в паузах речи являются выборками из стационарной последовательности отсчетов, (шумы в паузах). В качестве основной характеристики шумов в паузах предлагается использовать оценки по обучающей выборке математических ожиданий частей энергий их отрезков некоторой конечной длительности в заранее определенных частотных полосах (субполосный анализ).Показано, что использование максимального из отношений частей энергий текущего анализируемого отрезка к соответствующим математическим ожиданиям частей энергий отрезков шумов позволяет в максимальной степени учесть возможное присутствие речевой компоненты. Этот эффект равносилен максимизации отношения сигнал/шум, то есть предлагаемая решающая функция в этом смысле является оптимальной.

Информационные технологии и вычислительные системы, № 1, с. 40-46 (2022) | Рубрика: 13.05