Российский фонд
фундаментальных
исследований

Физический факультет
МГУ им. М.В.Ломоносова
 

13.05 Речеобразование и восприятие речи

 

Савельев И.А., Антипенко А.О. «Фазовые характеристики голосовых вокализмов как следующий возможный этап развития систем защиты речевой связи» Вестник УрФО. Безопасность в информационной сфере, № 4, с. 5-14 (2021)

Отмечается, что экспоненциальное увеличение мощности вычислительных систем, в том числе домашнего использования, а также стремительное развитие алгоритмов машинного обучения, особенно в части анализа и синтеза речи, уже привели к появлению новых относительно доступных видов угроз обеспечению конфиденциальности и целостности системам речевой связи. Вместе с тем использование удобных речевых технологий в некоторых специфических задачах, например, биометрической аутентификации говорящего, сильно ограничено из-за возникающих проблем безопасности. В статье подробно рассмотрены характеристики речевых сигналов и приведены их основные модели (Гильбертовская модель, а также модель синусоидального описания речевого сигнала МакАуэля и Куатьери). Автор предлагает обратить внимание на фазовые характеристики голосовых вокализмов как на один из возможных путей купирования новых угроз системам речевой связи. Внимание при написании статьи уделено их практическому использованию – описаны основные области применения, а также представлено программное обеспечение, позволяющее анализировать и использовать фазовые характеристики во многих задачах защиты речевой информации. В выводах автор подчёркивает необходимость продолжения исследования возможной области применения фазовых характеристик, в том числе для надёжной аутентификации диктора. Ключевые слова: голосовые вокализмы, защита речевой информации, разборчивость, речевой сигнал, фазовые характеристики, синусоидальная модель.

Вестник УрФО. Безопасность в информационной сфере, № 4, с. 5-14 (2021) | Рубрики: 11.08 12.01 13.05

 

Савченко В.В. «Метод редукции авторегрессионной модели речевого сигнала для систем передачи речи по низкоскоростным каналам связи» Известия высших учебных заведений. Радиоэлектроника, 64, № 11, с. 682-695 (2021)

Рассмотрена задача редукции, или сокращения порядка p>>1 авторегрессионной модели (АР-модель) речевого сигнала по критерию минимума потерь полезной информации. Задача сформулирована как оптимизационная в терминах дискретного спектрального моделирования. Указано, что наиболее острой проблемой при ее решении является необходимость масштабирования параметров АР-модели под моделируемый сигнал на каждом шаге итеративных вычислений. Для преодоления указанной проблемы предложено использовать в качестве целевого функционала оптимизационной задачи меру информационного рассогласования сигналов в частотной области со свойством масштабной инвариантности. На ее основе разработан новый метод редукции АР-модели, в котором операция масштабирования вынесена за рамки итеративной процедуры оптимизации. Эффективность предложенного метода обоснована теоретически и исследована экспериментально. Показано, что основным эффектом его применения по сравнению с методом Берга, является выигрыш по точности редуцированной АР-модели в информационной метрике Кульбака–Лейблера. Полученные результаты адресованы исследователям и разработчикам систем и технологий цифровой передачи речи по низкоскоростным каналам связи.

Известия высших учебных заведений. Радиоэлектроника, 64, № 11, с. 682-695 (2021) | Рубрика: 13.05