Российский фонд
фундаментальных
исследований

Физический факультет
МГУ им. М.В.Ломоносова
 

13.05 Речеобразование и восприятие речи

 

Ладошко О.Н. «Исследование характеристик вокализованных пауз спонтанной украинской речи» КОНСОНАНС-2011. Акустический симпозиум (27–29 сентября 2011 г.), с. 182-187 (2011)

Показано, что закономерности изменения траектории частоты основного тона можно использовать в качестве классификационных признаков при обнаружении вокализованных пауз в спонтанной речи. Полученные результаты могут быть использованы при построении детекторов вокализованных пауз для систем автоматического стенографирования.

КОНСОНАНС-2011. Акустический симпозиум (27–29 сентября 2011 г.), с. 182-187 (2011) | Рубрика: 13.05

 

Продеус А.Н. «Формантно-модуляционный метод оценки разборчивости речи: точность и скорость измерений» КОНСОНАНС-2011. Акустический симпозиум (27–29 сентября 2011 г.), с. 224-229 (2011)

Произведено сопоставление, по точности и скорости измерений, формантного и формантно-модуляционного методов измерений разборчивости речи. Полученные результаты позволяют обоснованно выбирать метод измерений, учитывая условия измерений.

КОНСОНАНС-2011. Акустический симпозиум (27–29 сентября 2011 г.), с. 224-229 (2011) | Рубрика: 13.05

 

Гай В.Е., Утробин В.А. «Методика выделения в звуковом сигнале участков речевой активности» Известия высших учебных заведений. Поволжский регион. Технические науки, № 3, с. 85-94 (2012)

Рассматривается алгоритм выделения пауз в речевом сигнале. Разработанный алгоритм основан на использовании теории активного восприятия, адаптированной к анализу речевых сигналов. Результаты проведенных экспериментов подтверждают возможность использования предложенного алгоритма для решения поставленной задачи.

Известия высших учебных заведений. Поволжский регион. Технические науки, № 3, с. 85-94 (2012) | Рубрика: 13.05

 

Карпов А.А., Кипяткова И.С. «Методология оценивания работы систем автоматического распознавания речи» Известия высших учебных заведений. Приборостроение, 55, № 11, с. 38-43 (2012)

Представлена современная методология количественного оценивания результатов работы автоматических систем распознавания и диаризации речи. Приведены различные показатели и методы оценивания по критериям точности распознавания речи и скорости обработки речевого сигнала.

Известия высших учебных заведений. Приборостроение, 55, № 11, с. 38-43 (2012) | Рубрика: 13.05

 

Ронжин А.Л., Будков В.Ю. «Анализ современных методов и систем диаризации дикторов» Известия высших учебных заведений. Приборостроение, 55, № 11, с. 43-46 (2012)

Рассматривается проблема диаризации (протоколирования) речи нескольких дикторов, записанной одно- или многоканальными аудиосистемами. Проанализированы современные подходы к решению проблемы и приведены методики оценивания эффективности работы систем диаризации.

Известия высших учебных заведений. Приборостроение, 55, № 11, с. 43-46 (2012) | Рубрика: 13.05

 

Смирнова Н.С., Хитров М.В. «Фонетически представительный текст для фундаментальных и прикладных исследований русской речи» Известия высших учебных заведений. Приборостроение, 56, № 2, с. 5-10 (2013)

Приведен фонетически представительный текст, разработанный с применением новейших достижений в области лингвистических технологий. Полнота покрытия текстом фонетических единиц русской речи позволяет использовать его при формировании речевых корпусов для разработки и оценки экспертных и автоматических речевых систем различного назначения.

Известия высших учебных заведений. Приборостроение, 56, № 2, с. 5-10 (2013) | Рубрика: 13.05

 

Алейник С.В., Симончик К.К. «Алгоритмы выделения типовых помех и искажений в речевых сигналах» Известия высших учебных заведений. Приборостроение, 56, № 2, с. 18-24 (2013)

Исследованы способы выделения типовых аддитивных помех в системах обработки речевых сигналов. Проведена экспериментальная оценка влияния того или иного детектора помех на эффективность системы верификации диктора. Предложены усовершенствованные алгоритмы выделения помех.

Известия высших учебных заведений. Приборостроение, 56, № 2, с. 18-24 (2013) | Рубрика: 13.05

 

Соломенник А.И., Чистиков П.Г., Рыбин С.В., Таланов А.О., Томашенко Н.А. «Автоматизация процедуры подготовки нового голоса для системы синтеза русской речи» Известия высших учебных заведений. Приборостроение, 56, № 2, с. 29-32 (2013)

Предложены методика и средства автоматизации процедуры создания голоса заданного диктора для работы в системе синтеза речи VitalVoice. Реализованный алгоритм автоматизированной подготовки голоса включает несколько этапов: выбор текстового материала, запись речи с оперативным контролем параметров записи, создание размеченной звуковой базы, настройка параметров подбора элементов.

Известия высших учебных заведений. Приборостроение, 56, № 2, с. 29-32 (2013) | Рубрика: 13.05

 

Чистиков П.Г., Корольков Е.А., Таланов А.О., Соломенник А.И. «Гибридная технология синтеза речи на основе скрытых марковских моделей и алгоритма Unit Selection» Известия высших учебных заведений. Приборостроение, 56, № 2, с. 33-38 (2013)

Рассматриваются особенности построения системы синтеза русской речи с использованием двух наиболее распространенных подходов – статистического, на основе скрытых марковских моделей, и конкатенативного, на основе алгоритма Unit Selection. Для решения задачи моделирования интонации разработана методика создания модели голоса русскоязычного диктора. Эксперименты показывают повышение естественности звучания синтезируемой речи.

Известия высших учебных заведений. Приборостроение, 56, № 2, с. 33-38 (2013) | Рубрика: 13.05

 

Соломенник А.И., Таланов А.О., Соломенник М.В., Хомицевич О.Г., Чистиков П.Г. «Оценка качества синтезированной речи: проблемы и решения» Известия высших учебных заведений. Приборостроение, 56, № 2, с. 38-42 (2013)

Рассмотрены различные аспекты проблемы оценки результатов работы систем синтеза речи. Приведен краткий обзор существующих методик оценки качества.

Известия высших учебных заведений. Приборостроение, 56, № 2, с. 38-42 (2013) | Рубрика: 13.05

 

Хомицевич О.Г., Рыбин С.В., Аничкин И.М. «Использование лингвистического анализа для нормализации текста и снятия омонимии в системе синтеза русской речи» Известия высших учебных заведений. Приборостроение, 56, № 2, с. 42-46 (2013)

Исследована проблема разрешения неоднозначности прочтения различных элементов при работе системы синтеза русской речи по тексту VitalVoice. Описываются особенности использования морфологического и синтаксического анализа при расшифровке сокращений и специальных знаков, а также снятии омонимии (омографии). Данные экспериментов свидетельствуют о том, что выбранные методы позволяют правильно прочесть более 95% сложных элементов естественного текста.

Известия высших учебных заведений. Приборостроение, 56, № 2, с. 42-46 (2013) | Рубрика: 13.05

 

Матвеев Ю.Н. «Исследование информативности признаков речи для систем автоматической идентификации дикторов» Известия высших учебных заведений. Приборостроение, 56, № 2, с. 47-51 (2013)

Исследуется информативность речевых признаков наиболее популярных при создании автоматических систем идентификации дикторов. Эксперименты проводились на речевой базе данных, собранной в различных акустических условиях (широком диапазоне отношений сигнал/шум и уровней реверберации) и с использованием различных каналов записи.

Известия высших учебных заведений. Приборостроение, 56, № 2, с. 47-51 (2013) | Рубрика: 13.05

 

Пеховский Т.С., Сизов А.Ю. «Сравнение различных смесей гауссовых PLDA -моделей в задаче текстонезависимого распознавания диктора» Известия высших учебных заведений. Приборостроение, 56, № 2, с. 51-61 (2013)

Исследуется актуальность использования классической смеси PLDA-моделей c распределением Гаусса в качестве априорного в пространстве i-векторов для задачи верификации диктора. Исследуются условия эксперимента, в которых это использование выгодно при существующих ограничениях размеров обучающих баз. Показано, что в рамках кроссканальной задачи использование смеси двух PLDA-моделей эффективнее, чем традиционная схема с использованием одной PLDA-модели.

Известия высших учебных заведений. Приборостроение, 56, № 2, с. 51-61 (2013) | Рубрика: 13.05

 

Ткаченя А.В., Давыдов А.Г., Киселёв В.В., Хитров М.В. «Классификация эмоционального состояния диктора с использованием метода опорных векторов и критерия Джини» Известия высших учебных заведений. Приборостроение, 56, № 2, с. 61-66 (2013)

Исследована эффективность применения критерия Джини для формирования пространства признаков SVM-классификатора. Приведены результаты экспериментального определения оптимального набора информативных признаков и построения классификатора.

Известия высших учебных заведений. Приборостроение, 56, № 2, с. 61-66 (2013) | Рубрика: 13.05

 

Дырмовский Д.В., Коваль С.Л. «Особенности человеко-машинного интерфейса современных систем биометрической идентификации» Известия высших учебных заведений. Приборостроение, 56, № 2, с. 66-74 (2013)

Обоснованы требования к организации человеко-машинного интерфейса для современных систем автоматической и автоматизированной идентификации личности, основанных на анализе биометрических признаков.

Известия высших учебных заведений. Приборостроение, 56, № 2, с. 66-74 (2013) | Рубрика: 13.05

 

Матвеев Ю.Н. «Оценка доверительного интервала общего решения ансамбля классификаторов» Известия высших учебных заведений. Приборостроение, 56, № 2, с. 74-79 (2013)

Предложен алгоритм оценки доверительного интервала общего решения ансамбля классификаторов, выходом каждого из которых является логарифмическое отношение правдоподобия.

Известия высших учебных заведений. Приборостроение, 56, № 2, с. 74-79 (2013) | Рубрика: 13.05

 

Колоколов А.С., Любинский И.А., Мещеряков А.Ю. «Измерение основного тона речевого сигнала на основе его автокорреляционной функции» Наукоемкие технологии, 13, № 5, с. 26-29 (2012)

Предложен модифицированный способ измерения частоты основного тона речи, основанный на клиппировании автокорреляционной функции вокализованного сегмента речевого сигнала. Проведенное исследование метода продемонстрировало его преимущество по сравнении со способами, основанными как на оценке автокорреляционной функции речевой волны, так и на получении автокорреляционной функции центрально-клиппированного речевого сигнала.

Наукоемкие технологии, 13, № 5, с. 26-29 (2012) | Рубрика: 13.05

 

Чубатый Д.Н. «Эталонная модель источника речевых сообщений на основе гауссовских смесей» Наукоемкие технологии, 13, № 8, с. 23-27 (2012)

Предложена эталонная модель источника речевых сообщений на основе Гауссовых смесей для идентификации личности в сетях сотовой связи стандарта GSM. Показано, что особенностью этой модели является использование вектора различительных признаков, сформированного из параметров, передаваемых в кадре низкоскоростного кодера речи RPE-LTP. Determine the personality of the speaker system on the individual characteristics of the speech developing very actively. This is due to the presence of a wide range of practical problems which can be used in these systems: verification of access rights, forensic examination, remote access to databases and the bank accounts. Recently, large distribution network were using low speed speech coding: satellite, trunking, cellular communications systems, as well as IP-telephony network. The application of existing method of identification person by voice in these networks is not possible. This requires the development of new models, method sand algorithms for speech signal processing, low-speed converted speech coder. Presented in the paper reference model of the source voice messages based on Gaussian mixtures confirmed the possibility of using parameters that are passed within the frame coder RPE-LTP as a vector of distinctive features and identity of the caller without decoding the signal.

Наукоемкие технологии, 13, № 8, с. 23-27 (2012) | Рубрика: 13.05

 

Архипов И.А., Гитлин В.Б., Лузин Д.А. «Синхронный с основным тоном двухпроходный алгоритм принятия решения тон–не тон» Вестник Ижевского государственного технического университета (ИжГТУ), № 4, с. 150-153 (2008)

Дано описание двухпроходного алгоритма классификации речи на вокализированные и невокализированные интервалы, работающего совместно с алгоритмом выделения основного тона речи по методу GS. Приведены результаты испытаний предложенного алгоритма классификации.

Вестник Ижевского государственного технического университета (ИжГТУ), № 4, с. 150-153 (2008) | Рубрика: 13.05

 

Гитлин В.Б., Лузин Д.А. «Автоматический алгоритм выделения основного тона речи по методу GS» Вестник Ижевского государственного технического университета (ИжГТУ), № 4, с. 157-160 (2008)

Дано описание структурной схемы автоматического выделителя основного тона речи по методу GS. Приведены результаты сопоставительных испытаний работы предложенного в работе алгоритма с работой пикового, фильтрового, кепстрального, автокорреляционного методов и методов Голда–Рабинера и ЛЛК.

Вестник Ижевского государственного технического университета (ИжГТУ), № 4, с. 157-160 (2008) | Рубрика: 13.05