Российский фонд
фундаментальных
исследований

Физический факультет
МГУ им. М.В.Ломоносова
 

13.06 Физиологическая и психологическая акустика

 

Леонов А.С., Макаров И.С., Сорокин В.Н., Цыплихин А.И. «Артикуляторный ресинтез фрикативных» Информационные процессы, 4, № 2, с. 117-126 (2004)

Решались две обратные задачи восстановления формы речевого тракта для фрикативных согласных звуков английского языка (s, sh, f, θ, ∂, h, z, zh).В одной задаче входными данными служили только акустические параметры речевого сигнала, а в другой – вместе с акустическими параметрами использовались и траектории движений 8 точек на внутренних поверхностях речевого тракта, измеренные на микролучевом рентгеноскопе. В обеих задачах погрешность оценки измеренных координат точек составляла, в среднем, меньше 3%, причем разница между решениями в пространстве артикуляторных параметров была меньше 4%, за одним исключением. Перцептивный контроль качества решения обратной задачи выполнялся путем синтеза слогов "гласный–фрикативный–гласный" артикуляторным синтезатором. Исходными данными для синтеза служили форма речевого тракта и площади его поперечного сечения, вычисленные в результате решения обратной задачи. Звучание синтезированных слогов оказалось весьма близко к оригинальным слогам.

Информационные процессы, 4, № 2, с. 117-126 (2004) | Рубрики: 13.05 13.06

 

Леонов А.С., Сорокин В.Н. «К анализу резонансных частот речевого тракта» Информационные процессы, 7, № 4, с. 386-400 (2007)

Предложен метод мгновенной оценки резонансных частот речевого тракта на каждом периоде основного тона. Метод основан на нахождении интервалов времени между моментами обращения в нуль первой производной сигнала, который подвергнут фильтрации в некоторой частотной полосе, где ожидается присутствие колебаний только одного резонанса тракта. Проведены численные эксперименты, показывающие, что получаемые по этому методу оценки частот достаточно близки к истинным резонансным частотам тракта. Применение метода к речевым сигналам для мужского голоса при многократном произнесении как изолированных гласных с различной частотой основного тона, так и гласных в симметричных слогах ГСГ с согласными (Б, Г), показало существование частотных модуляций, доходящих до ±18%, причем фаза этих модуляций относительно момента возбуждения акустических колебаний голосовым источником изменяется в значительных пределах.

Информационные процессы, 7, № 4, с. 386-400 (2007) | Рубрики: 13.05 13.06

 

Горбунов К.С., Макаров И.С. «Модель акустического взаимодействия речевого тракта, подсвязочной области и голосового источника» Информационные процессы, 9, № 2, с. 68-82 (2009)

Статья посвящена построению математической модели акустического взаимодействия объемной скорости, протекающей через голосовую щель, речевого тракта и подсвязочной области (трахея, бронхи, легкие). Модель основана на аппроксимации акустических импедансов авторегрессионными моделями с подвижным средним. Результаты экспериментов хорошо согласуются с данными других работ по изучению взаимодействия голосового источника и тракта.

Информационные процессы, 9, № 2, с. 68-82 (2009) | Рубрики: 13.05 13.06