Столбов М.Б. «Алгоритм оценки отношения сигнал/шум речевых сигналов» Научно-технический вестник информационных технологий, механики и оптики, 12, № 6, с. 67-72 (2012)
Предложен алгоритм оценки интегрального значения отношения сигнал/шум и его значений в частотных полосах для определения качества фонограмм в системе верификации дикторов. Особенность разработанного алгоритма состоит в робастности по отношению к большой вариативности условий записи и качества фонограмм, а также возможности выполнения оценки в режиме реального времени, т.е. в темпе поступления речевого сигнала. В основу алгоритма положены новые способы оценки спектра шума и детектирования речи. Эксперименты показали достаточную для практических применений достоверность оценок отношения сигнал/шум в диапазоне от 6 до 26 дБ на записях длительностью от 10 с и более.
Научно-технический вестник информационных технологий, механики и оптики, 12, № 6, с. 67-72 (2012) | Рубрики: 12.01 13.05
Матвеев Ю.Н., Шулипа А.К. «Гистограммная нормализация речевых признаков в задаче верификации дикторов» Научно-технический вестник информационных технологий, механики и оптики, 12, № 6, с. 85-88 (2012)
Содержится краткое описание алгоритма гистограммной нормализации речевых признаков применительно к задаче верификации дикторов. Приведены результаты верификационных тестов при различных параметрах и режимах нормализации. На основании полученных данных сделаны выводы об эффективности использования нормализации речевых признаков для улучшения качества верификации дикторов и найдены оптимальные условия использования алгоритма нормализации. Ключевые слова: верификация дикторов, речевые признаки, гистограммная нормализация.
Научно-технический вестник информационных технологий, механики и оптики, 12, № 6, с. 85-88 (2012) | Рубрики: 12.01 13.05
Симончик К.К. «Система идентификации возрастной группы говорящего по записям спонтанной речи» Научно-технический вестник информационных технологий, механики и оптики, 12, № 6, с. 89-93 (2012)
Предлагается использовать популярный в текстонезависимой идентификации диктора метод выделения i-векторов для решения задачи идентификации возрастной группы говорящего. Исследуется две реализации системы идентификации возрастной группы говорящего: предложен подход на базе машины опорных векторов, а также подход на основе линейной регрессионной модели. В обоих случаях была достигнута хорошая надежность детектирования возрастной группы диктора по записям фонограмм устной речи. Средний процент правильной идентификации возрастной группы диктора составил 61% и 65% соответственно на речевой базе NIST SRE 2008.
Научно-технический вестник информационных технологий, механики и оптики, 12, № 6, с. 89-93 (2012) | Рубрики: 12.01 13.05

