Российский фонд
фундаментальных
исследований

Физический факультет
МГУ им. М.В.Ломоносова
 

Научно-технический вестник информационных технологий, механики и оптики. 2012. 12, № 6

 

Столбов М.Б. «Алгоритм оценки отношения сигнал/шум речевых сигналов» Научно-технический вестник информационных технологий, механики и оптики, 12, № 6, с. 67-72 (2012)

Предложен алгоритм оценки интегрального значения отношения сигнал/шум и его значений в частотных полосах для определения качества фонограмм в системе верификации дикторов. Особенность разработанного алгоритма состоит в робастности по отношению к большой вариативности условий записи и качества фонограмм, а также возможности выполнения оценки в режиме реального времени, т.е. в темпе поступления речевого сигнала. В основу алгоритма положены новые способы оценки спектра шума и детектирования речи. Эксперименты показали достаточную для практических применений достоверность оценок отношения сигнал/шум в диапазоне от 6 до 26 дБ на записях длительностью от 10 с и более.

Научно-технический вестник информационных технологий, механики и оптики, 12, № 6, с. 67-72 (2012) | Рубрики: 12.01 13.05

 

Матвеев Ю.Н., Шулипа А.К. «Гистограммная нормализация речевых признаков в задаче верификации дикторов» Научно-технический вестник информационных технологий, механики и оптики, 12, № 6, с. 85-88 (2012)

Содержится краткое описание алгоритма гистограммной нормализации речевых признаков применительно к задаче верификации дикторов. Приведены результаты верификационных тестов при различных параметрах и режимах нормализации. На основании полученных данных сделаны выводы об эффективности использования нормализации речевых признаков для улучшения качества верификации дикторов и найдены оптимальные условия использования алгоритма нормализации. Ключевые слова: верификация дикторов, речевые признаки, гистограммная нормализация.

Научно-технический вестник информационных технологий, механики и оптики, 12, № 6, с. 85-88 (2012) | Рубрики: 12.01 13.05

 

Симончик К.К. «Система идентификации возрастной группы говорящего по записям спонтанной речи» Научно-технический вестник информационных технологий, механики и оптики, 12, № 6, с. 89-93 (2012)

Предлагается использовать популярный в текстонезависимой идентификации диктора метод выделения i-векторов для решения задачи идентификации возрастной группы говорящего. Исследуется две реализации системы идентификации возрастной группы говорящего: предложен подход на базе машины опорных векторов, а также подход на основе линейной регрессионной модели. В обоих случаях была достигнута хорошая надежность детектирования возрастной группы диктора по записям фонограмм устной речи. Средний процент правильной идентификации возрастной группы диктора составил 61% и 65% соответственно на речевой базе NIST SRE 2008.

Научно-технический вестник информационных технологий, механики и оптики, 12, № 6, с. 89-93 (2012) | Рубрики: 12.01 13.05