Российский фонд
фундаментальных
исследований

Физический факультет
МГУ им. М.В.Ломоносова
 

13.05 Речеобразование и восприятие речи

 

Ананьева Е.А., Ананьев А.Б. «Компьютерный анализ певческого голоса» КОНСОНАНС-2005. Акустический симпозиум (27–29 сентября 2005 г.), с. 8-13 (2005)

Рассматривается методика выделения вибрато из фрагментов певческого голоса, и обсуждаются вопросы его исследования. Рассмотрены вопросы выделения отдельной гармонической компоненты из многокомпонентного музыкального звука с учетом амплитудной и частотной модуляции (вибрато) этого звука. Приводятся характеристики вибрато, выделенного из фрагментов голосов ряда известных певцов.

КОНСОНАНС-2005. Акустический симпозиум (27–29 сентября 2005 г.), с. 8-13 (2005) | Рубрика: 13.05

 

Гавриленко А.В., Дидковский В.С., Продеус А.Н. «Сравнительный анализ некоторых методов оценки разборчивости речи» КОНСОНАНС-2007. Акустический симпозиум (25–27 сентября 2007 г.), с. 54-65 (2007)

A brief review of the objective methods of speech intelligibility estimation is realized. It’s shown that the most of formant methods are close in the region of middle values of signal-to-noise ratio (SNR). But it’s difficult to take into account the reverberation interference when formant methods are used. The concept of Modulation Transfer Function (MTF) is more powerful in this sense because it permits to take into account the reverberation interference. Empirical method ALcons accounts the reverberation interference, but it doesn’t consider noise. The most complicated task for all above mentioned methods is to determine speech privacy.

КОНСОНАНС-2007. Акустический симпозиум (25–27 сентября 2007 г.), с. 54-65 (2007) | Рубрика: 13.05

 

Ананьев А.Б., Авраменко М.Э. «Акустические аспекты интонационного поведения в дикторской речи» КОНСОНАНС-2009. Акустический симпозиум (29 сентября–01 октября 2009 г.), с. 32-37 (2009)

This study is devoted to objective analysis of acoustic parameters inherent to intonation in human speech. Within the study we introduced graphic descriptions of speech intonation patterns. Using correlation analysis we examined relation between pitch and sound energy in spoken phrases. A technique developed in this project allows us to relate intonation in the spoken phrase to the logical stresses within not only this phrase, but also within a contextually linked sequence of phrases.

КОНСОНАНС-2009. Акустический симпозиум (29 сентября–01 октября 2009 г.), с. 32-37 (2009) | Рубрика: 13.05

 

Продеус А.Н. «Об измерениях вероятностных характеристик формант украинской и русской речи» КОНСОНАНС-2009. Акустический симпозиум (29 сентября–01 октября 2009 г.), с. 285-291 (2009)

КОНСОНАНС-2009. Акустический симпозиум (29 сентября–01 октября 2009 г.), с. 285-291 (2009) | Рубрика: 13.05

 

Ладошко О.Н. «Исследование влияния параметризации речевого сигнала и характеристик каналов связи на надежность автоматического распознавания фонем» КОНСОНАНС-2013. Акустический симпозиум (1–2 октября 2013 г.), с. 169-174 (2013)

Задача робастного распознавания спонтанной речи в условиях различия характеристик каналов записи обучающей и тестовой выборок весьма актуальна. К таковым относятся различие передаточных характеристик каналов связи, различие микрофонов, различие расстояний от рта до микрофона. В данной работе исследовалось влияние характеристик телефонного канала связи на точность распознавания фонем. Для построения акустических моделей контекстно-независимых фонем (трифонов) использовались скрытые Марковские модели (HMM – Hidden Markov Models). Распознавание проводилось для дикторонезависимого режима работы системы автоматического распознавания фонем слитной речи. Исследования проводились при MFCC и PLP параметризации речевых сигналов. Для обучения использовалась речевая база, записанная с высоким качеством (отношение сигнал-шум не менее 40 дБ). Для распознавания использовались различные виды искаженной речи: естественная речь на выходе одноканального телефонного канала связи; синтетическая речь на выходе телефонного канала связи, сформированная с использованием системы «искусственный рот».

КОНСОНАНС-2013. Акустический симпозиум (1–2 октября 2013 г.), с. 169-174 (2013) | Рубрика: 13.05

 

Продеус А.Н. «О выборе метода акустической экспертизы и вида тестового сигнала при оценивании разборчивости речи» КОНСОНАНС-2013. Акустический симпозиум (1–2 октября 2013 г.), с. 244-249 (2013)

Предложены решающие правила, необходимые для автоматизации акустической экспертизы. Экспериментально оценены погрешности акустической экспертизы, обусловленные использованием естественной речи в качестве тестового сигнала. В последние десятилетия широкое распространение получил модуляционный метод акустической экспертизы, универсальность которого обусловлена способностью учитывать влияние на разборчивость речи как шума, так и реверберации. Между тем, в условиях преобладания шумовой помехи предпочтительным, как по скорости, так и по точности измерений, является формантный метод. Отсюда следует, что выбор рационального метода акустической экспертизы целесообразно производить с учетом оценки соотношения влияния шума и реверберации. Поэтому одна из целей данной работы состоит в разработке вариантов решающего правила о виде помехи. Другим важным вопросом акустической экспертизы является выбор тестового сигнала. При экспертизе помещений принято использовать тестовые сигналы в виде стационарного или нестационарного шумов, свип-сигналы или сигналы в виде MLS-последовательностей. Однако специфика цифровых линий связи приводит к необходимости использовать естественную речь в качестве тестовых сигналов. До настоящего времени вопрос точности таких измерений исследован недостаточно, поэтому другой целью данной работы является оценка погрешностей акустической экспертизы, производимой с использованием речевых тестовых сигналов.

КОНСОНАНС-2013. Акустический симпозиум (1–2 октября 2013 г.), с. 244-249 (2013) | Рубрика: 13.05

 

Савченко В.В. «Метод измерений показателя акустического качества речи на основе теоретико-информационного подхода» Измерительная техника, № 1, с. 60-64 (2018)

Предложен новый метод измерений показателя акустического качества речи по информационной метрике Кульбака–Лейблера. Основное преимущество данного метода заключается в его высоких динамических свойствах, рассчитанных на устранение проблемы малых выборок наблюдений. Проведено теоретическое исследование эффективности метода, его выводы подтверждены экспериментально. Установлено, что для обеспечения достаточно точной оценки качества речи диктора требуется речевой сигнал длительностью 2–3 минуты.

Измерительная техника, № 1, с. 60-64 (2018) | Рубрика: 13.05