Ермилов А.В., Гостев И.М. «Об обучении системы верификации диктора на неразмеченных данных» Математическое моделирование, 27, № 7, с. 51-57 (2015)
Исследуются способы получения автоматической разметки речевых данных по дикторам с помощью алгоритмов кластеризации с последующим получением смеси моделей, используемых для распознавания диктора. Такая задача возникает, например, в случае необходимости использования данных из новых каналов, например, данных, полученных с мобильных устройств. Для таких каналов, как правило, отсутствует большая размеченная база по дикторам, которая в дальнейшем может быть использована для построения системы верификации диктора. Кроме того, рассматривается задача верификации диктора и способы её решения на основе моделей GMM-UBM, приведен обзор методов нормализации влияния канала, используемых для увеличения точности распознавания. Изложен обзор современных методов верификации диктора, таких как супервекторы и PLDA. Также в статье исследуется качество разметки, полученной методом иерархической кластеризации с различными метриками, и приводятся результаты численных экспериментов по верификации диктора на базе i-векторов из NIST i-vector Machine Learning Challenge 2014 с помощью модели, обученной на полученной разметке.
Математическое моделирование, 27, № 7, с. 51-57 (2015) | Рубрика: 13.05

