Российский фонд
фундаментальных
исследований

Физический факультет
МГУ им. М.В.Ломоносова
 

13.05 Речеобразование и восприятие речи

 

Махешвари Н.У., Кабилан А.П., Венкатеш Р. «Независимая система распознавания речи с использованием нейронных сетей» Журнал радиоэлектроники, № 7, http://jre.cplire.ru/iso/jul09/1/text.html (2009)

Независимая от говорящего система распознования речи важна для успешной разработки устройств распознавания речи для большинства реальных приложений. В то время как зависящие от говорящего распознаватели речи достигли точности 100%, системы распознавания, независящие от говорящего, имеют низкую точность, не превышающую 75%. В работе описывается двухмодульная независящая от говорящего система распознавания речи для англоязычной речи. Первый модуль выполняет распознавание фонем, используя двухслойную нейронную сеть. Второй модуль выполняет распознавание слов, исходя из строки фонем, используя скрытую марковскую модель. Система была протестирована англоязычной речью, состоящей из 2000 слов, произнесенных 100 говорящими. Точность распознавания составила 92%, что намного выше результатов предыдущих работ.

Журнал радиоэлектроники, № 7, http://jre.cplire.ru/iso/jul09/1/text.html (2009) | Рубрика: 13.05

 

Хитров М.В., Васильев А.Ю. «Статистические языковые особенности и их гендерные различия на примере литовского языка» Известия высших учебных заведений. Приборостроение, 57, № 2, с. 7-11 (2014)

Выявлены речевые особенности, позволяющие решать задачи автоматической идентификации языка и идентификации диктора. Предложен метод, использующий статистические параметры, характеризующие мелодический контур фраз исследуемого языка.

Известия высших учебных заведений. Приборостроение, 57, № 2, с. 7-11 (2014) | Рубрика: 13.05

 

Киселёв В.В., Ткаченя А.В., Хитров М.В. «Исследование каналонезависимых информативных признаков» Известия высших учебных заведений. Приборостроение, 57, № 2, с. 12-17 (2014)

Исследованы информативные признаки речи с целью формирования каналонезависимого пространства признаков для повышения эффективности функционирования системы распознавания дикторов. Экспериментально определен оптимальный набор каналонезависимых информативных признаков для решения задачи выявления сходства между фонограммами на основе метода динамического программирования.

Известия высших учебных заведений. Приборостроение, 57, № 2, с. 12-17 (2014) | Рубрика: 13.05

 

Томашенко Н.А., Хохлов Ю.Ю. «Исследование проблемы сбалансированности данных при построении акустических моделей систем автоматического распознавания речи» Известия высших учебных заведений. Приборостроение, 57, № 2, с. 17-22 (2014)

Исследована проблема сбалансированности данных при обучении акустических моделей для автоматического распознавания речи. Предложена метрика, позволяющая при кластеризации состояний трифонов явно учитывать влияние количества данных в кластере. Экспериментально доказано, что использование такого подхода позволяет повысить качество распознавания речи.

Известия высших учебных заведений. Приборостроение, 57, № 2, с. 17-22 (2014) | Рубрика: 13.05

 

Черных Г.А., Кореневский М.Л., Левин К.Е., Пономарева И.А., Томашенко Н.А. «Кроссвалидационный контроль состояний при обучении акустических моделей систем автоматического распознавания речи» Известия высших учебных заведений. Приборостроение, 57, № 2, с. 23-28 (2014)

Предложен метод, позволяющий при обучении скрытых марковских моделей, входящих в состав систем автоматического распознавания речи, оптимизировать число компонентов в гауссовых смесях состояний. Применение метода повышает качество и скорость распознавания речи системой.

Известия высших учебных заведений. Приборостроение, 57, № 2, с. 23-28 (2014) | Рубрика: 13.05

 

Чистиков П.Г., Хомицевич О.Г., Рыбин С.В. «Статистические методы автоматического определения мест и длительности пауз в системах синтеза речи» Известия высших учебных заведений. Приборостроение, 57, № 2, с. 28-32 (2014)

Рассмотрены статистические методы определения местоположения и длительности пауз в системе синтеза речи. Применение таких методов позволяет добиться лучших результатов по сравнению с использованием алгоритмов, основанных на правилах.

Известия высших учебных заведений. Приборостроение, 57, № 2, с. 28-32 (2014) | Рубрика: 13.05

 

Столбов М.Б., Татарникова М.Ю. «Разделение речи целевого и сторонних дикторов с использованием двухмикрофонной системы» Известия высших учебных заведений. Приборостроение, 57, № 2, с. 53-57 (2014)

Рассмотрен метод разделения речи целевого и сторонних дикторов с помощью обработки сигналов двух симметричных микрофонов, ориентированных в противоположных направлениях. Алгоритм обработки обеспечивает пространственное разделение дикторов.

Известия высших учебных заведений. Приборостроение, 57, № 2, с. 53-57 (2014) | Рубрика: 13.05

 

Булгакова Е.В., Краснова Е.В. «Экспертные системы и методы идентификации диктора» Известия высших учебных заведений. Приборостроение, 57, № 2, с. 58-63 (2014)

Проанализированы методы проведения фонографической экспертизы. Рассмотрено используемое в целях идентификации диктора программное обеспечение. Описывается звуковой редактор SIS II.

Известия высших учебных заведений. Приборостроение, 57, № 2, с. 58-63 (2014) | Рубрика: 13.05

 

Дырмовский Д.В., Коваль С.Л., Хитров М.В. «Концепция системы национального фоноучета и голосового биометрического поиска» Известия высших учебных заведений. Приборостроение, 57, № 2, с. 63-70 (2014)

Представлена концепция системы национального фоноучета и голосового биометрического поиска.

Известия высших учебных заведений. Приборостроение, 57, № 2, с. 63-70 (2014) | Рубрика: 13.05

 

Матвеев Ю.Н., Шулипа А.К. «Анализ возможности применения методов машинного обучения на основе многообразий в задачах распознавания дикторов» Известия высших учебных заведений. Приборостроение, 57, № 2, с. 70-76 (2014)

Исследованы особенности применения методов обучения на основе многообразий, широко используемых в приложениях по распознаванию изображений, для решения задач распознавания личностей по голосу (дикторов). Проанализированы результаты экспериментов по использованию таких методов.

Известия высших учебных заведений. Приборостроение, 57, № 2, с. 70-76 (2014) | Рубрика: 13.05

 

Новосёлов С.А., Сухмель В.А., Шолохов А.В., Пеховский Т.С. «Применение dtw-метода для мультисессионного обучения скрытых марковских моделей в задаче текстозависимой верификации диктора» Известия высших учебных заведений. Приборостроение, 57, № 2, с. 77-84 (2014)

Представлен метод обучения скрытых марковских моделей по нескольким вариантам произнесения парольной фразы с помощью алгоритма динамического временного выравнивания сигналов. Метод позволяет создавать точные статистические модели речевых сигналов и снижать вероятность возникновения ошибок верификации.

Известия высших учебных заведений. Приборостроение, 57, № 2, с. 77-84 (2014) | Рубрика: 13.05

 

Щемелинин В.Л., Симончик К.К. «Исследование устойчивости голосовой верификации к атакам, использующим систему синтеза» Известия высших учебных заведений. Приборостроение, 57, № 2, с. 84-88 (2014)

Проанализирована устойчивость современных методов верификации к взлому при помощи гибридной системы синтеза речи на основе технологий Unit Selection и скрытых марковских моделей. Представлен метод взлома, обеспечивающий достижение ошибки ложного пропуска в 98–100 % случаев при большом объеме обучающей базы; метод может быть автоматизирован при сопряжении с автоматической системой распознавания речи.

Известия высших учебных заведений. Приборостроение, 57, № 2, с. 84-88 (2014) | Рубрика: 13.05

 

Паненко М.В., Миронов В.И., Эскин И.Ю. «Типовые наборы управляющих речевых команд для швейного оборудования» Швейная промышленность, № 3, http://www.legprominfo.ru/1_zur/2_sp/2013-3/ (2013)

Рассматривается вопрос о составлении краткого набора голосовых команд для швейного оборудования в случае управления этим оборудованием оператором-инвалидом.

Швейная промышленность, № 3, http://www.legprominfo.ru/1_zur/2_sp/2013-3/ (2013) | Рубрика: 13.05