13.05 Речеобразование и восприятие речи

Желтов П.В., Семенов В.И. «Вейвлет-анализ акустического сигнала» Вестник Казанского государственного технического университета им. А. Н. Туполева, № 4, с. 68-71 (2008)

Приводится алгоритм выделения границ между гласными и согласными фонемами с использованием быстрого непрерывного вейвлет-преобразования речевого сигнала. Предложен алгоритм формирования слова по распознанным фонемам.

Вестник Казанского государственного технического университета им. А. Н. Туполева, № 4, с. 68-71 (2008) | Рубрики: 04.12 13.05

Казарян А.А., Сенцов А.Э., Хоречко У.В. «Звукоподражание в китайском языке. К постановке вопроса» Молодой ученый, № 7, с. 955-958 (2015)

Молодой ученый, № 7, с. 955-958 (2015) | Рубрика: 13.05

Калюжный А.Я., Семенов В.Ю. «Экономичный метод очистки речи от шума, основанный на блочном представлении сигнала в пространстве состояний и векторном квантовании» Акустический вестник (Акустичний вiсник, укр.), 5, № 3, с. 28-34 (2002)

Предложен новый экономичный метод очистки речевых сигналов от шума. Сокращение вычислений основано на свойствах блочной модели авторегрессионного сигнала, развитой в работе. Показано уменьшение ошибки по сравнению с традиционным фильтром Калмана. Рассмотрена задача оценивания авторегрессионных параметров речи в присутствии шума. Предложена экономичная двухэтапная процедура оценивания, основанная на векторном квантовании авторегрессионных параметров. На первом этапе начальное приближение для оптимального набора авторегрессионных параметров определяется на небольшом количестве квантов. Затем значение оценки улучшается с помощью эффективной итерационной процедуры. Эффективность результирующего метода проверена на реальных речевых сигналах.

Акустический вестник (Акустичний вiсник, укр.), 5, № 3, с. 28-34 (2002) | Рубрика: 13.05

Семенов В.Ю. «Новый метод вычисления линейных спектральных частот речевых сигналов, основанный на универсальном алгоритме решения трансцендентных уравнений» Акустический вестник (Акустичний вiсник, укр.), 5, № 4, с. 38-50 (2002)

Предложен новый эффективный метод вычисления линейных спектральных частот (ЛСЧ) речевых сигналов, который основан на разработанном алгоритме полного численного решения трансцендентных уравнений, не имеющих кратных корней. Принципиально алгоритм состоит из двух частей – выделения отрезков, содержащих единственный корень, и последующего нахождения корней с помощью одной из стандартных итерационных процедур. Эффективность различных модификаций предложенного метода поиска ЛСЧ проверена на реальных речевых сигналах. Исследованы два подхода к нахождению ЛСЧ – прямое решение трансцендентных уравнений относительно тригонометрических функций и решение полиномиальных уравнений, полученных в результате разложения по чебышевским полиномам. Свойство упорядоченности ЛСЧ использовано для снижения вычислительных затрат. В отличие от большинства существующих методов определения ЛСЧ, предложенный метод обладает произвольно высокой точностью вычислений и гарантирует устойчивость соответствующего авторегрессионного фильтра. Показано, что данный метод может быть применен в системах реального времени.

Акустический вестник (Акустичний вiсник, укр.), 5, № 4, с. 38-50 (2002) | Рубрика: 13.05

Калюжный А.Я., Семенов В.Ю. «Метод слепой деконволюции речевых сигналов основанный на анализе линейных спектральных частот» Акустический вестник (Акустичний вiсник, укр.), 6, № 3, с. 34-43 (2003)

Рассмотрена задача слепой деконволюции речевых сигналов при наличии фоновых шумов. Предложен эффективный метод детектирования и устранения влияния передаточной функции среды, основанный на анализе линейных спектральных частот искаженного сигнала. Его принципиальное преимущество перед существующими подходами состоит в адаптивном учете помехи в структуре алгоритма. Разработана эффективная процедура локализации посторонних резонансов, основанная на анализе разностей линейных спектральных частот. С целью устранения эффекта «усиления шума» использован алгоритм блочной калмановской фильтрации. Эффективность результирующего метода проверена на искусственных и реальных искажениях речевых сигналов. Предлагаемый подход характеризуется более низкими вычислительными затратами по сравнению с рядом современных методов слепой деконволюции речевых сигналов.

Акустический вестник (Акустичний вiсник, укр.), 6, № 3, с. 34-43 (2003) | Рубрика: 13.05

Семенов В.Ю. «Новый подход к вычислению линейных спектральных частот речевых сигналов, основанный на свойстве межфреймовой упорядоченности» Акустический вестник (Акустичний вiсник, укр.), 7, № 3, с. 55-64 (2004)

Рассмотрена актуальная задача поиска линейных спектральных частот (ЛСЧ), являющихся альтернативной формой представления полюсной модели голосового тракта. Проведено исследование взаимного расположения ЛСЧ на смежных квазистационарных временных интервалах (фреймах). На основании этого предложен новый подход к вычислению ЛСЧ, состоящий из двух этапов – локализации ЛСЧ и их точного вычисления. Показано, что этап локализации эффективно сводится к проверке свойства межфреймовой упорядоченности ЛСЧ. Продемонстрировано, как для ускорения стадии точного вычисления ЛСЧ могут быть использованы их значения, найденные на предыдущем фрейме. В результате тестирования различных речевых сигналах продемонстрировано сокращение количества операций до 2.5 раз по сравнению с версией метода, не использующей априорную информацию о взаимном расположении ЛСЧ на смежных фреймах, и до 3.4 раз по сравнению с широко используемым методом Кабала. Кроме того, показано, что максимальные (пиковые) вычислительные затраты предложенного метода меньше не только минимальных затрат метода Кабала, но и минимальных затрат ускоренной комбинации метода Кабала с методом Ньютона. Это свидетельствует о предпочтительности использования разработанного метода в системах реального времени.

Акустический вестник (Акустичний вiсник, укр.), 7, № 3, с. 55-64 (2004) | Рубрика: 13.05

Латыпов Р.Х., Нигматуллин Р.Р., Столов Е.Л. «Классификация речевых файлов по форме сигнала» Ученые записки Казанского государственного университета. Серия Физико-математические науки, 156, № 4, с. 39-46 (2014)

Предложены параметры, характеризующие форму отдельных сигналов речевого файла: положение квантилей в выделенном фрагменте и параметры парабол, аппроксимирующих площадь под кривой. Показана возможность автоматического различения файлов, содержащих речь на татарском и русском языках, с помощью распределения указанных параметров.

Ученые записки Казанского государственного университета. Серия Физико-математические науки, 156, № 4, с. 39-46 (2014) | Рубрика: 13.05

Акустика

сигнальная информация

№4, 2015 год

13.05 Речеобразование и восприятие речи