Российский фонд
фундаментальных
исследований

Физический факультет
МГУ им. М.В.Ломоносова
 

Информационные процессы. 2006. 6, № 4

 

Сорокин В.Н., Макаров И.С. «Обратная задача для голосового источника» Информационные процессы, 6, № 4, с. 375-395 (2006)

Исследовалась обратная задача относительно формы голосового источника. Входными параметрами для этой задачи служили либо сигнал-остаток, получаемый после обратной фильтрации речевого сигнала, либо текущий интеграл от этого остатка. Сам сигнал-остаток интерпретируется как производная от объемной скорости воздушного потока через голосовую щель, а его интеграл – как объемная скорость потока. Рассматривалось несколько способов решения обратной задачи. В одном из них обратная задача решалась вариационным методом с регуляризацией по Тихонову. В этом методе параметры модели колебаний голосовых складок варьировались с целью минимизации целевого функционала, включающего в себя невязку между вычисленной по модели производной от объемной скорости и сигналом, полученным после обратной фильтрации. В другом методе сначала выполнялась оценка объемной скорости по сигналу обратной фильтрации, а затем эта объемная скорость использовалась для решения инвертированного уравнения динамики потока в голосовом источнике. Полученная оценка изменения площади голосовой щели на каждом периоде голосового источника аппроксимировалась по методу среднеквадратического минимума функцией, порождаемой моделью голосового источника. Этот метод оказался наиболее точным и устойчивым. Ошибки аппроксимации известной площади голосовой щели в этом методе находились в пределах до 0.1% (синтетические гласные), 10–12% (натуральные гласные с измеренной площадью голосовой щели). Установлено, что правдоподобные оценки площади голосовой щели достигаются на близко расположенных микрофонах.

Информационные процессы, 6, № 4, с. 375-395 (2006) | Рубрика: 13.05