Российский фонд
фундаментальных
исследований

Физический факультет
МГУ им. М.В.Ломоносова
 

Информационные процессы. 2010. 10, № 2

 

Сорокин В.Н., Цыплихин А.И. «Верификация диктора по спектрально-временным параметрам речевого сигнала» Информационные процессы, 10, № 2, с. 87-104 (2010)

Верификация диктора выполняется на основе измерения формантных частот на стационарных участках и переходных процессах гласных звуков, спектральных признаков фрикативных звуков, а также длительности речевых сегментов. Для каждого слова из фиксированного словаря русских числительных от 0 до 9 были отобраны наилучшие признаки. Парольная фраза генерируется системой в случайном порядке при каждом новом акте верификации. Компенсация динамических помех и противодействие вторжению с помощью воспроизведения подслушанных и записанных слов диктора осуществляется с помощью требования повторного произнесения некоторых слов. В результате более чем 30 миллионов тестов на базе данных для 429 дикторов для максимальной длины парольной фразы в 10 слов получены суммарные вероятности ошибки 0.006% для мужских голосов и 0.025% – для женских, причем вероятности пропуска самозванца и ложного отказа в этом случае примерно равны.

Информационные процессы, 10, № 2, с. 87-104 (2010) | Рубрика: 13.05