Российский фонд
фундаментальных
исследований

Физический факультет
МГУ им. М.В.Ломоносова
 

Вопросы радиоэлектроники. 2019, № 4

 

Белоруцкий Р.Ю., Житник С.В. «Распознавание речи на основе сверточных нейронных сетей» Вопросы радиоэлектроники, № 4, с. 47-52 (2019)

Рассматривается задача распознавания речи человека в виде записанных на диктофон сигналов произнесенных цифр от 1 до 10. Использован метод распознавания спектрограммы звукового сигнала с помощью сверточных нейронных сетей. Реализованы алгоритмы для предварительной обработки входных данных – изображений спектрограмм, а также алгоритмы для обучения сети и распознавания произнесенных слов. Оценено качество распознавания для разного количества сверточных слоев. Исходя из этого, выбрано их число, предложена структура нейронной сети. Произведено сравнение качества распознавания в случаях, когда входными данными для сети являются спектрограмма звукового сигнала или выделенные из нее первые две форманты. Тестирование алгоритма распознавания произведено на примерах мужского и женского голосов с разной длительностью произношения.

Вопросы радиоэлектроники, № 4, с. 47-52 (2019) | Рубрика: 13.05