13.05 Речеобразование и восприятие речи

Иваненков А.С., Родионов А.А. «Адаптивное выделение сигналов с помощью решёток микрофонов на фоне набора источников интенсивных помех» Известия высших учебных заведений. Радиофизика, 61, № 3, с. 216-229 (2018)

Рассмотрена задача выделения звукового сигнала отдельного источника при наличии совокупности пространственно разделённых источников при приёме с помощью решётки микрофонов. При этом считается, что источник выделяемого сигнала находится в заранее известной ограниченной области пространства. Такая задача имеет практическое значение, например для прослушивания речи в местах большого скопления людей, для выделения сигналов отдельных источников в задачах акустической диагностики различных механических систем и др. Для её решения независимо для каждой узкой полосы принимаемого сигнала предложен адаптивный алгоритм пространственной обработки, основанный на использовании модели помехи в виде набора источников с произвольными неизвестными векторами направлений. Достоинством предложенного метода является его устойчивость по отношению к несоответствиям используемой модели реальным условиям. Такого рода устойчивость достигается без привлечения каких-либо априорных сведений о характере ошибок в используемой модели. В работе приводятся результаты выделения речевого сигнала с использованием численного моделирования и данных эксперимента для сценариев, включающих наличие мощных источников помехи, а также ошибок в задании вектора направлений. Полученные результаты демонстрируют более высокую эффективность применения предложенного метода в реальных условиях по сравнению с другими известными методами.

Известия высших учебных заведений. Радиофизика, 61, № 3, с. 216-229 (2018) | Рубрики: 04.14 13.05

Жуманиязов Д.М., Кострова В.Н., Коростелева Н.А. «Способ сжатия речевого сигнала в системах идентификации источников звука» Вестник Воронежского института высоких технологий, № 2, с. 60-65 (2018)

Представлена методика повышения эффективности алгоритма сжатия речевых сигналов, без большой потери качества. Сжатие в этом случае означает удаление из цифрового сигнала тех шагов квантования, которые можно спрогнозировать. Авторы предлагают уменьшить число этих шагов квантования, используя модифицированный алгоритм линейной предикации с переменным порядком. Это позволяет сократить время сжатия.

Вестник Воронежского института высоких технологий, № 2, с. 60-65 (2018) | Рубрика: 13.05

Михайлов А.П., Петров А.П., Прончева О.Г. «Модель информационного противоборства в социуме с кусочно-постоянной функцией дестабилизирующего воздействия» Математическое моделирование, 30, № 7, с. 47-60 (2018)

Рассматривается модель информационного противоборства в социуме при отсутствии забывания информации индивидами в случае, когда одна из сторон периодически дестабилизирует систему путем кратковременного скачкообразного повышения интенсивности вещания средств массовой информации. Модель имеет вид системы двух нелинейных обыкновенных дифференциальных уравнений с периодической разрывной правой частью. Построена асимптотика первого порядка по малому параметру, приведен численный пример, иллюстрирующий качественное поведение решения и близость построенной асимптотики к точному решению

Математическое моделирование, 30, № 7, с. 47-60 (2018) | Рубрика: 13.05

Жуков Р.А., Суворов Д.А., Тетерюков Д.О., Осеков С.С., Мозговой М.В., Волков А.В. «Конструирование подсистемы ввода сигнала на основе массива микрофонов с цифровым интерфейсом» Вестник Московского государственного технического университета имени Н.Э. Баумана (МГТУ). Серия: Приборостроение, № 3, с. 70-82 (2018)

Рассмотрены вопросы создания системы захвата многоканального звука для дальнейшего использования в системе распознавания речи на расстоянии на примере разработки массива из восьми MEMS-микрофонов. Проведен сравнительный анализ подходов к решению задачи захвата звука, в которых применяют массивы аналоговых и цифровых микрофонов. Разработана и изготовлена система захвата звука, основанная на PDM-to-DFSDM-преобразовании, решетке цифровых MEMS-микрофонов с PDM-интерфейсом и новейшей линейке контроллеров фирмы ST архитектуры ARM Cortex-M. Экспериментально проверена работоспособность созданной системы аппаратно-синхронизированного захвата звука с восьмиканального массива микрофонов и ее пригодность для локализации источников звука и формирования диаграммы направленности перед распознаванием речи.

Вестник Московского государственного технического университета имени Н.Э. Баумана (МГТУ). Серия: Приборостроение, № 3, с. 70-82 (2018) | Рубрика: 13.05

Конев А.А., Мещеряков Р.В., Костюченко Е.Ю. «Сегментация речевых сигналов на вокализованные и невокализованные участки на основе одновременной маскировки» Автометрия, 54, № 4, с. 51-57 (2018)

Рассмотрена модель одновременной тональной маскировки, выделяющая компоненты речевого сигнала, воспринимаемые слуховой системой человека. Предложен алгоритм одновременной маскировки на основе этой модели. Показано, что сигнал после одновременной маскировки представляется бинарной структурой, отражающей гармоническую структуру вокализованной последовательности. Экспериментально доказано, что данная структура может быть использована для выделения ключевых (с точки зрения восприятия слуховой системой) участков речи. На базе этой структуры создан алгоритм высококачественной сегментации речевого сигнала на вокализованные и невокализованные участки, не требующий обучения перед применением. По результатам тестирования совместного использования алгоритмов одновременной маскировки и сегментации речевого сигнала получены оценки качества их работы. DOI: 10.15372/AUT20180407

Автометрия, 54, № 4, с. 51-57 (2018) | Рубрика: 13.05

Железняк В.К., Бураченок И.Б., Рябенко Д.С. «Критерии оценки защищенности от утечки речевых сигналов» Известия Национальной академии наук Беларуси. Серия физико-технических наук (Весцi НАН Беларусi. Сер. фiз.-тэхн. навук), 62, № 1, с. 122-128 (2017)

Обоснован метод оценки нормативного показателя защищенности речевого сигнала по критерию разборчивости речи в полосах равной разборчивости речи в шумах высокого уровня сложным измерительным сигналом с большой базой. Показано преимущество сложного измерительного сигнала с большой базой перед гармоническим измерительным сигналом при оценке защищенности каналов утечки речевой информации. Наряду с аналоговой формой речевого сигнала широко используются речевые сигналы в цифровой форме. Для речевых сигналов в цифровой форме необходимо установить математическую зависимость между вероятностью ошибочного приема бита и величиной разборчивости речи. Для сложных сигналов с большой базой по аналогии с речевыми сигналами в цифровой форме необходимо установить математическую зависимость с гармоническим измерительным сигналом. Целью работы является определение нормативного показателя защищенности речевых сигналов в каналах утечки информации на основании установленных математических зависимостей. Данные математические зависимости позволят реализовать автоматизированную измерительную систему для комплексной оценки защищенности конфиденциальной информации, обрабатываемой в аналоговой и цифровой форме, в технических каналах ее утечки.

Известия Национальной академии наук Беларуси. Серия физико-технических наук (Весцi НАН Беларусi. Сер. фiз.-тэхн. навук), 62, № 1, с. 122-128 (2017) | Рубрика: 13.05

Акустика

сигнальная информация

№4, 2018 год

13.05 Речеобразование и восприятие речи