Российский фонд
фундаментальных
исследований

Физический факультет
МГУ им. М.В.Ломоносова
 

Известия высших учебных заведений. Поволжский регион. Технические науки. 2017, № 3

 

Алимурадов А.К., Тычков А.Ю., Чураков П.П., Торгашин С.И. «Способ сегментации речевого сигнала для систем оценки психогенных состояний» Известия высших учебных заведений. Поволжский регион. Технические науки, № 3, с. 81-93 (2017)

Актуальность и цели. Низкая точность распознавания речевых сигналов в условиях психических отклонений у человека является одной из главных причин практической реализации систем оценки психогенных состояний. Это связано с использованием неустойчивых к шумам и неадаптивных методов обработки сложных нестационарных сигналов. В статье предложен способ сегментации сигнал/пауза, работающих в условиях зашумленной обстановки. Материалы и методы. В разработке способа сегментации речевого сигнала для систем оценки психического здоровья использовались: комплементарная множественная декомпозиция на эмпирические моды (КМДЭМ) и метод разграничения на основе физиологического аспекта формирования речи и функционала слухового аппарата человека. Результаты. Представлена структурная схема способа. Указаны преимущества разрабатываемого решения в сравнении с известными способами сегментации сигнал/пауза STE+ZCR, IE и MFCC. Выводы. Представленный способ обеспечивает повышение коэффициента действительного обнаружения речевого сигнал до 6%. Сравнение результатов исследований позволяет сделать вывод, что разработанный способ сегментации сигнал/пауза может быть применен для практического применения в системах оценки психогенных состояний. DOI 10.21685/2072-3059-2017-3-7

Известия высших учебных заведений. Поволжский регион. Технические науки, № 3, с. 81-93 (2017) | Рубрика: 13.05