Российский фонд
фундаментальных
исследований

Физический факультет
МГУ им. М.В.Ломоносова
 

Радиотехника. 2019, № 6

 

Миронов Н.А. «Моделирование реальных условий выделения речевого сообщения из голосовой смеси» Радиотехника, № 6, с. 81-86 (2019)

Постановка проблемы. Работа посвящена актуальной проблеме выделения одного речевого сообщения из голосовой смеси, более известной как «the Cocktail Party Problem». Современные решения в данной области связаны с применением массива микрофонов для выделения речи определенного человека. Особую ценность представляют исследования по выделению речи в условиях, максимально приближенных к реальным. Цель. Исследовать устойчивость работы алгоритма обработки речевого сигнала микрофонной решеткой в реальных условиях. Алгоритм заключается во введении временных задержек, зависящих от пространственных координат полезного источника, в каждый канал обработки сигналов и дальнейшем определении оптимального весового вектора микрофонной решетки. Результаты. В реальных условиях звук многократно отражается, поэтому при проведении расчетов был учтен эффект реверберации. Энергия речевого сообщения полезного сигнала может значительно отличаться от энергии сигнала помехи, поэтому была проанализирована работа алгоритма по выделению «тихого» голоса. При разговоре человек может перемещаться в пространстве, поэтому был проведен эксперимент по выделению голоса движущегося диктора. В ходе исследования доказано, что предложенный алгоритм устойчив к эффекту реверберации звука. Определен минимально возможный уровень полезного сигнала по отношению к уровню сигналов источников помех (–20,5 Дб), при котором сохраняется удовлетворительный уровень разборчивости речи. При использовании информации о траектории движения диктора от независимых каналов определения местоположения удалось выделить голос движущегося источника из помех с уровнем словесной разборчивости в 93,23%. Практическая значимость. Результаты данной работы могут быть полезны специалистам, занимающимся разработкой акустических систем наблюдения и обеспечением безопасности в местах массового скопления граждан.

Радиотехника, № 6, с. 81-86 (2019) | Рубрика: 13.05