Гришунов С.С., Белов Ю.С. «Основные математические методы выделения речевых особенностей в системах распознавания диктора» Электронный журнал: наука, техника и образование, № 3, с. 53-58 (2015)
Приведен обзор основных математических методов выделения речевых особенностей человека. Описаны алгоритмы получения коэффициентов линейного предсказания; фазы остатка линейного предсказания; мел-кепстральных коэффициентов; связанных параметров Херста; неискаженного отклика с минимальной дисперсией; характеристик, основанных на дробном преобразовании Фурье; а так же кратковременная энергия и кратковременная средняя скорость пересечения нуля. Данные характеристики используются в различных системах распознавания диктора для уменьшения объемов обрабатываемых данных.
Электронный журнал: наука, техника и образование, № 3, с. 53-58 (2015) | Рубрика: 13.05
Белов Ю.С., Либеров Р.В. «Подходы и проблемы распознавания личности по голосу» Электронный журнал: наука, техника и образование, № 3, с. 68-77 (2015)
Приведен аналитический обзор основных результатов работ в области распознавания дикторов за последнее время. Дано описание области применения: в зависимости от конкретной задачи различают верификацию и идентификацию диктора. В первом случае пользователь указывает свой идентификатор, и требуется либо подтвердить его или отказать в подтверждении. Во втором случае необходимо идентифицировать диктора среди множества других дикторов. Приведена оценка показателей эффективности систем верификации, используются такие показатели как: среднегеометрическое, взвешенная сумма стоимости отказа и пропуска, функция минимальной стоимости детектирования ошибки, однако установлено, что наиболее популярна оценка в виде равной вероятности пропуска и отказа (ERR – Equal Error Rate). Выделены ключевые особенности при разработке систем голосовой идентификации: вторжение в систему верификации, субъективная эффективность распознавания диктора, изменчивость.
Электронный журнал: наука, техника и образование, № 3, с. 68-77 (2015) | Рубрика: 13.05

