Российский фонд
фундаментальных
исследований

Физический факультет
МГУ им. М.В.Ломоносова
 

Известия высших учебных заведений. Поволжский регион. Технические науки. 2015, № 2

 

Алимурадов А.К., Чураков П.П. «Помехоустойчивый адаптивный алгоритм сегментации "сигнал/пауза" для систем распознавания речи» Известия высших учебных заведений. Поволжский регион. Технические науки, № 2, с. 82-94 (2015)

Актуальность и цели. Объектом исследования являются этапы обработки речевых сигналов, применяемые в системах распознавания речи. Предметом исследования является задача сегментации «сигнал/пауза», представляющая собой обнаружение границ участков сигнала и пауз в общем потоке речевых сигналов. Цель работы – разработка и исследование помехоустойчивого алгоритма сегментации «сигнал/пауза», адаптивного к агрессивно зашумленной среде Материалы и методы. В разработке алгоритма использовались: метод адаптивной обработки нелинейных и нестационарных сигналов – комплементарная множественная декомпозиция на эмпирические моды; метод обработки статистических данных – независимый компонентный анализ; метод разграничения с использованием понятий нормального распределения и одномерного расстояния Махаланобиса. Результаты. Разработан и исследован помехоустойчивый адаптивный алгоритм сегментации «сигнал/пауза» для систем распознавания речи. Представлена блок-схема алгоритма с подробным математическим описанием. Указаны преимущества по сравнению с известными алгоритмами сегментации «сигнал/пауза», применяемыми в системах распознания речи. Разработанный алгоритм обеспечивает повышение коэффициента действительного обнаружения в среднем на 13%. Выводы. Сопоставление результатов исследований позволяет сделать вывод, что разработанный помехоустойчивый адаптивный алгоритм сегментации «сигнал/пауза» рекомендуется для практического применения в системах распознавания речи, используемых в агрессивно зашумленной среде.

Известия высших учебных заведений. Поволжский регион. Технические науки, № 2, с. 82-94 (2015) | Рубрика: 13.05