Российский фонд
фундаментальных
исследований

Физический факультет
МГУ им. М.В.Ломоносова
 

Информационные процессы. 2013. 13, № 2

 

Сорокин В.Н., Гераськин И.В. «Оценка длины речевого тракта» Информационные процессы, 13, № 2, с. 35-47 (2013)

Исследовались два способа оценки длины речевого тракта, эквивалентной длине однородной акустической трубы. Один способ был основан на вычислении длины тракта по разности частот ближайших локальных максимумов спектра, находящихся выше 4 кГц. В другом способе длина тракта вычислялась по средней частоте второй форманты, определенной по частотам первых трех формант. Также рассматривались варианты анализа независимо от контекста и в зависимости от известных гласных звуков. Вероятность правильного распознавания пола диктора обоими способами составила около 13%, и практически не зависит от знания контекста. Вероятность правильного распознавания мужских голосов по разности высших формант независимо от контекста составила около 31%, а женских голосов – около 25.5%, а в зависимости от контекста – 37% и 31%, соответственно. При контекстно-независимом распознавании по средней частоте второй форманты вероятность правильного распознавания мужских голосов близка к 27%, а женских – к 21.5%, тогда как при контекстно-зависимом распознавании с известным типом гласного вероятность правильного распознавания мужских голосов повышается до 43%, а женских – до 35.5%.

Информационные процессы, 13, № 2, с. 35-47 (2013) | Рубрики: 13.05 13.06