Российский фонд
фундаментальных
исследований

Физический факультет
МГУ им. М.В.Ломоносова
 

Известия высших учебных заведений. Радиоэлектроника. 2020. 63, № 1

 

Савченко В.В. «Критерий минимума информационного расхождения сигналов с настройкой на голос диктора в задаче автоматического распознавания речи» Известия высших учебных заведений. Радиоэлектроника, 63, № 1, с. 55-68 (2020)

Рассмотрена задача автоматического распознавания речи на базовом, фонетическом уровне обработки речевого сигнала. Исследована проблема повышения помехоустойчивости. Для ее решения предложен критерий минимума информационного расхождения сигналов с настройкой на голос диктора и с автоматическим масштабированием речевых эталонов под тонкую структуру наблюдаемого (текущего) речевого фрейма. Рассмотрен пример его практической реализации, исследованы характеристики эффективности. С использованием авторского программного обеспечения поставлен и проведен эксперимент, получены количественные оценки выигрыша в пороговых сигналах. Показано, что при определенных условиях он может достигать 10 дБ и более. Полученные результаты и сделанные по ним выводы предназначены для использования при разработке новых и модернизации существующих систем и технологий автоматической обработки и распознавания речи, рассчитанных на работу в условиях действия интенсивных внешних помех.

Известия высших учебных заведений. Радиоэлектроника, 63, № 1, с. 55-68 (2020) | Рубрика: 13.05