Российский фонд
фундаментальных
исследований

Физический факультет
МГУ им. М.В.Ломоносова
 

Вестник Воронежского государственного ун-та инженерных технологий. 2015, № 2

 

Абрамов Г.В., Коробова Л.А., Ивашин А.Л., Матыцина И.А. «Анализ и использование математических методов для распознавания звуковых сигналов» Вестник Воронежского государственного университета инженерных технологий, № 2, с. 61-65 (2015)

Распознавание голоса – широко изучаемая и изученная в науке тема, а распознавание звуковых сигналов, в том числе кашлей пациентов в длительной звуковой записи – практически не изученная. Для распознавания звуковых сигналов и их подсчета были проанализированы и использованы математические методы, такие как корреляционный анализ, быстрое преобразование Фурье, нечеткая логика. Рассматривая каждый метод по очереди, подбирались параметры дающие наилучшие результаты распознавания при использовании того или иного метода. Корреляционный анализ позволяет сделать выводы о количестве кашлевых моментов для выбранного эталона. Быстрое преобразование Фурье позволило выделить такие частотные диапазоны, в которые попадают только кашли и не попадают шумы, экспериментальным путем было выявлено 6 таких диапазонов. Использование нечеткой логики улучшило анализ звуковой записи и позволило производить выбор кашлевых моментов с большей степенью уверенности, но однозначности результатов выбора достичь так и не удалось. Использовалась нечеткая логика, позволяющая расширить границы распознавания, позволяя градировать результат на кашель, возможно кашель и шум. При анализе полученных данных по каждому математическому методу пришли к выводу, что по отдельности их использование невозможно. Для достижения поставленной цели необходимо составить комплекс математических правил вывода, которые позволят распознавать звуковые сигналы с более высокой точностью. Рассмотрев спектрограмму звукового фрагмента, выделить зоны, в которых необходимо производить анализ для выявления похожести звуковых записей. Выделенные зоны кашля имеют четкие значения по каждой из координат спектрограммы. Это позволило в дальнейшем при синтезировании правил вывода использовать точные значения для границ параметров этих правил. Под полученный комплекс правил модифицировали разработанный программный продукт. Протестировали запись и получили результаты.

Вестник Воронежского государственного университета инженерных технологий, № 2, с. 61-65 (2015) | Рубрика: 13.05