Российский фонд
фундаментальных
исследований

Физический факультет
МГУ им. М.В.Ломоносова
 

13.05 Речеобразование и восприятие речи

 

Савин А.Н., Тимофеева Н.Е., Гераськин А.С., Мавлютова Ю.А. «Разработка компонентов программного комплекса для потоковой фильтрации аудиоконтента на основе использования скрытых марковских моделей» Известия Саратовского университета. Новая серия. Серия: Математика. Механика. Информатика, 15, № 3, с. 340-350 (2015)

Приведены результаты разработки эффективных алгоритмов потокового распознавания речи с помощью стохастических моделей, основанных на использовании скрытых марковских моделях. В статье приводятся основные теоретические сведения для скрытой марковской модели дискретной системы, выделяются параметры, необходимые для ее определения, также рассмотрены три основные задачи, которые должны быть решены для успешного применения скрытой марковской модели в системах распознавания речи. Приводятся алгоритмы метода Баума–Велша, направленного на уточнение параметров модели и метода Витерби, подбора наиболее вероятной последовательности состояний системы. Эти два метода реализованы в среде графического программирования LabVIEW в виде программных модулей, реализующих построение скрытых марковских моделей отдельных слов с использованием метода Баума–Велша и распознавание этих слов на основе метода Витерби. Предполагается использование данных модулей для реализации потоковой фильтрации аудиоконтента в цифровых системах связи.

Известия Саратовского университета. Новая серия. Серия: Математика. Механика. Информатика, 15, № 3, с. 340-350 (2015) | Рубрики: 04.17 13.05

 

Сагдеев К.М., Сагдеева Е.К. «Рекомендации по оценке защищенности выделенных помещений от утечки речевой информации по акустическим и виброакустическим каналам» Международный журнал прикладных и фундаментальных исследований, № 8-3, с. 466-471 (2015)

Рассматривается задача, связанная с проблемой предотвращения утечки конфиденциальной речевой информации из защищаемых помещений по акустическим и виброакустическим каналам. Решать данную задачу предлагается путем оценки защищенности речевой информации. С этой целью в работе предлагается усовершенствованная методика, позволяющая количественно оценить величину угрозу утечки речевой информации и уровень ее защищенности по акустическим и виброакустическим каналам. Для выбора автоматизированного комплекса, обеспечивающего инструментальный контроль и оценку защищенности, предлагается использовать введенный в работе показатель эффективности. Для оценки защищенности речевой информации с помощью предлагаемой автоматизированной системы целесообразно применять приведенные в статье практические рекомендации.

Международный журнал прикладных и фундаментальных исследований, № 8-3, с. 466-471 (2015) | Рубрики: 10.08 13.05

 

Сафронова М.А., Коренбаум В.И., Почекутова И.А. «Применение методов аэроакустики для моделирования шумообразования свистящих звуков форсироваенного [форсированного] выдоха» Тезисы докладов Четвертой открытой Всероссийской конференции по аэроакустике. (29 сентября –1 октября 2015 г.), с. 177-178 (2015)

Цель работы – расширить представления об акустико-биомеханических взаимосвязях шумообразования при маневре форсированного выдоха.

Тезисы докладов Четвертой открытой Всероссийской конференции по аэроакустике. (29 сентября –1 октября 2015 г.), с. 177-178 (2015) | Рубрики: 13.02 13.05

 

Силькис И.Г. «О роли базальных ганглиев в обработке сложных звуковых стимулов и слуховом внимании» Успехи физиологических наук, 46, № 3, с. 76-92 (2015)

Успехи физиологических наук, 46, № 3, с. 76-92 (2015) | Рубрики: 13.05 13.06

 

Газин А.И. «Прогноз вероятности появления групп звуков речи на малой обучающей выборке с использованием распределения значений мер Хэмминга» Труды международного симпозиума "Надежность и качество", № 2, с. 244-245 (2010)

Труды международного симпозиума "Надежность и качество", № 2, с. 244-245 (2010) | Рубрика: 13.05

 

Дворянкин С.В., Дворянкин Н.С. «Способ установления подлинности речевых сообщений, передаваемых по каналам сотовой связи» Специальная техника и связь, № 4, с. 32-39 (2015)

Описывается способ скрытного встраивания идентификационного кода и связанного с ним цифрового водяного знака в виде некоего образа – аудиомаркера в спектрально-временные характеристики речевого сообщения для установления его целостности и авторства после передачи по GSM-каналам сотовой связи без потери качества звучания. Подтверждением подлинности служит результат аудиовизуального сравнения образов принятого аудиомаркера с его эталоном из кодовой книги, адрес которого в ней соответствует скрытно полученному и выделенному идентификатору.

Специальная техника и связь, № 4, с. 32-39 (2015) | Рубрика: 13.05

 

Стас Т.Т., Щербаков М.А., Сазонов В.В. «Метод получения векторов акустических признаков для распознавания последовательности фразы в условиях шумовых помех» Известия высших учебных заведений. Поволжский регион. Технические науки, № 2, с. 95-103 (2015)

Актуальность и цели. Повышение точности распознавания речи в условиях наличия шумовых помех представляет собой важную задачу, поскольку существуют области применения систем распознавания речи, где, несмотря на растущую актуальность, существует проблема достижения высокой точности распознавания при наличии различных шумовых воздействий. Объектом исследования являются бортовые системы автоматического распознавания речи. Предметом исследования являются повышение вероятности распознавания речи в условиях шумовых помех. Цель исследования – разработка методов и алгоритмов повышения точности распознавания в условиях наличия шумовых помех. Материалы и методы. Исследование методов распознавания речи в условиях шумовых помех выполнено с использованием нейронных сетей и скрытых марковских моделей. Результаты. Разработан метод получения вектора акустических признаков на основе применения мел-частотных кепстральных коэффициентов (Mel Frequency Cepstral Coefficients (MFCC)). Основу разработанного метода составила новая формула обучения линейных однослойных нейронных сетей (ЛОНС), полученная с помощью применения двух целевых функций. Первая целевая функция – это вероятностная функция нормального гауссовского многомерного распределения, вторая целевая функция – это функция вычисления кепстральных коэффициентов на основе применения линейных однослойных нейронных сетей для вычисления средней спектральной мощности. Выводы. Предложен метод получения вектора акустических признаков на основе применения мел-частотных кепстральных коэффициентов. Алгоритм обучения ЛОНС, основу которого составляет формула обучения, полученная на основе применения двух целевых функций, позволил повысить вероятность распознавания речи в условиях шумовых помех.

Известия высших учебных заведений. Поволжский регион. Технические науки, № 2, с. 95-103 (2015) | Рубрика: 13.05