Российский фонд
фундаментальных
исследований

Физический факультет
МГУ им. М.В.Ломоносова
 

13.05 Речеобразование и восприятие речи

 

Никитин О.Р., Левин Е.К., Лабзина Е.А. «Использование фильтра Винера для подавления помех в речевом сигнале» Методы и устройства передачи и обработки информации, № 20, с. 21-27 (2018)

Рассматривалась задача шумоподавления с помощью фильтра Винера, который обеспечивает наилучшую по критерию минимума среднеквадратичную ошибку фильтрации полезного сигнала. Как известно, оптимальным подходом к осуществлению поставленной задачи является «метод прямого решения» или DD-метод (decision-directed approach), направленный на уменьшение уровня музыкального шума. Однако, здесь проявляется нежелательный эффект реверберации (процесс постепенного уменьшения интенсивности звука при его многократных отражениях), который обуславливается тем, что фильтр Винера относится к предыдущему фрейму, в то время как корректируется текущий. Чтобы этого избежать, применяется двухэтапный алгоритм определения частотной характеристики TSNR (two-step noise reduction), который имеет свои недостатки: проявление гармонических искажений в речевом сигнале, обусловленных маленькой величиной оценки отношения С/Ш; непростая задача определения оценки спектральной плотности мощности шума. Наилучшие параметры достигаются методом гармонической генерации HRNR (harmonic regeneration noise reduction), с помощью которого осуществляется уточнение отношения С/Ш. Результатом данной работы является определение МЧКК чистого и пораженного помехой сигнала, максимального значения относительной разности МЧКК с помощью указанных методов и анализ полученных экспериментальных данных.

Методы и устройства передачи и обработки информации, № 20, с. 21-27 (2018) | Рубрика: 13.05

 

Rogozinsky G.G., Fadeyev D.R., Fadeyev A.A., Smirnov A.V., Ivanova Yu.I. «The method of psychoacoustic model adaptation to wavelet domain based on quantization matrix» T-Comm: Телекоммуникации и транспорт, 13, № 4, с. 64-69 (2019)

The paper presents the authors' recent research in adaptation of the psychoacoustic model of ISO MPEG AAC to the Discrete Wavelet Packet algorithm of lossy audio coding. Wavelet Transform-based digital audio compression possesses several advances in the context of compact representation of transients and non-harmonic components. Meanwhile, one of the well-known issues of application of wavelets for the audio compression is poor accuracy of existing psychoacoustic models obtained for wavelet domain. The authors discovered the complex distribution of wavelet coefficients quantization noise across the spectrum due to significant cross-band aliasing between wavelet decomposition tree subbands. The authors also obtained the wavelet quantization noise function related to the analysis bands of MPEG AAC Psychoacoustic Model. The described approach provided the method of quantization matrix calculation, which is useful for exact estimation of masking threshold during lossy wavelet coefficients coding. The obtained results allow increasing the accuracy of existing compression models based on wavelet transform, therefore gaining the efficiency of digital audio compression with reviewed transforms. Ключевые слова: цифровая компрессия звука с потерями, вейвлеты, квантование, психоакустическая модель.

T-Comm: Телекоммуникации и транспорт, 13, № 4, с. 64-69 (2019) | Рубрика: 13.05

 

Петров А.П., Прончева О.Г. «Моделирование выбора позиций индивидами при информационном противоборстве с двухкомпонентной повесткой» Математическое моделирование, 31, № 7, с. 91-108 (2019)

Статья посвящена разработке и анализу модели выбора позиций индивидами при информационном противоборстве по двум темам. Рассматривается общество, в котором конкурируют две партии, занимающие по этим темам противоположные позиции. Противоборство состоит в том, что в каждой из этих тем каждая из партий распространяет свои информационные потоки через аффилированные средства массовой информации. Индивиды воспринимают эти потоки, становятся сторонниками той или иной партии по каждому из вопросов и агитируют других индивидов в соответствии со своими политическими предпочтениями. Относительная значимость тем определяется на основе теории установления повестки дня. Именно, дебатируемая тема считается тем более значимой, чем выше суммарная интенсивность вещания обеих партий по этой теме. Математическая модель построена в двух вариантах. Один из них предполагает межличностные коммуникации однородно распределенными по социуму; для него рассматривается вопрос о том, как параметры системы влияют на устойчивость решений. Второй вариант предполагает, что в социуме имеются две группы (этнические общины, социальные классы и т.д.), члены каждой из которых больше коммуницируют друг с другом, чем с другой группой. Для этого варианта рассмотрена простейшая теоретико-игровая постановка: каждая из партий распределяет доступное ей медийное вещание на две темы, стремясь максимизировать превосходство в количестве сторонников над другой партией в конце противоборства.

Математическое моделирование, 31, № 7, с. 91-108 (2019) | Рубрика: 13.05

 

Полякова А.С., Липинский Л.В. «Формирование коллектива решающих правил многокритериальным эволюционным алгоритмом в задаче анализа эмоций человека по аудиоданным» Вестник Московского государственного технического университета имени Н.Э. Баумана (МГТУ). Серия: Приборостроение, № 4, с. 45-61 (2019)

Одной из важнейших задач современного этапа информатизации общества является развитие систем человеко-машинного интерфейса, в том числе систем автоматизированного распознавания эмоций человека. Эмоции человека выражены в виде комбинации двух показателей: Valence – направленность эмоции (отрицательные или положительные) и Arousal – выраженность эмоции (степень возбужденности). Эти показатели представлены вещественными числами. Для точности прогнозирования предложено использовать методы коллективного вывода. Точность коллективного решения оценена коэффициентом корреляции согласованности. Агенты (алгоритмы) в коллектив отобраны с помощью многокритериального эволюционного алгоритма. Применение многокритериального эволюционного алгоритма дало возможность автоматизировать процесс формирования коллектива, что позволило снизить затраты временных и материальных ресурсов. Коллектив построен на основе двух критериев: максимизации точности и минимизации числа агентов в коллективе. Для принятия решения коллективом применены такие способы, как простое голосование, взвешенное среднее, взвешенное среднее с учетом степени доверия к агенту, а также система на основе нечеткой логики. Для повышения эффективности решения задачи интеллектуального анализа данных предложена модификация системы на основе нечеткой логики. Проведены анализ и исследование эффективности многокритериального эволюционного алгоритма при решении задачи прогнозирования эмоционального поведения человека. Экспериментально выявлено, что применение многокритериального эволюционного алгоритма для автоматизированного формирования состава коллектива приводит к более точному решению задачи.

Вестник Московского государственного технического университета имени Н.Э. Баумана (МГТУ). Серия: Приборостроение, № 4, с. 45-61 (2019) | Рубрика: 13.05

 

Лыков Ю.В., Преснякова А.Д., Лыкова А.А. «Исследование потенциальных возможностей восстановления аудиоинформации из видеозаписи без звуковой дорожки» Известия высших учебных заведений. Радиоэлектроника, 62, № 6, с. 366-376 (2019)

Проведен анализ возможности появления канала утечки акустической информации, посредством анализа видеопотока на видеозаписи. Исследованы возможности восстановления речи при очень низком качестве записи, определяемом отношением сигнал–шум (ОСШ), частотой дискретизации, количеством уровней квантования, и уровнем клиппирования, с учетом особенностей исследуемого канала утечки. В результате определены необходимая частота кадров видеоизображения, минимальное ОСШ, количество уровней квантования, и достаточный динамический диапазон смещения колеблющегося объекта. Также исследованы требования к параметрам канала утечки и возможные пути повышения его качества злоумышленником. Рассчитаны требования к смещению колеблющегося под действием акустических волн объекта на видеозаписи. Обоснованы потенциальные возможности уменьшения требований к смещению объекта, путем применения усреднения большого числа различных точек на объекте. Проведена оценка существующего программного обеспечения шумоочистки звукозаписей для повышения разборчивости перехваченного сообщения злоумышленником в рассмотренном канале утечки информации. Полученные результаты позволяют сделать вывод о том, что существуют потенциальные предпосылки утечки акустической информации путем анализа видеопотока на видеозаписи. Условия возникновения такого канала не являются чрезмерно жесткими, поэтому нельзя пренебрегать возможностью его появления и необходимо предусматривать превентивные меры по его предотвращению/разрушению на объекте информационной деятельности.

Известия высших учебных заведений. Радиоэлектроника, 62, № 6, с. 366-376 (2019) | Рубрики: 13.05 14.01