Российский фонд
фундаментальных
исследований

Физический факультет
МГУ им. М.В.Ломоносова
 

13.05 Речеобразование и восприятие речи

 

Дидковский В.С., Дидковская М.В., Продеус А.Н. Акустическая экспертиза каналов речевой коммуникации (2008). 420 с.

Акустическая экспертиза каналов речевой коммуникации (2008). 420 с. | Рубрики: 02 13.05

 

Харченко А.Н. «Адаптивный алгоритм сжатия речевых сигналов» Электроника и связь (Електроніка та звязок, укр.), № 1, с. 24-28 (2009)

Предложен новый алгоритм сжатия речевых сигналов на основе одномерного адаптивного вейвлет-преобразования. Эффективность алгоритма по сравнению с неадаптивными алгоритмами подтверждена результатами моделирования.

Электроника и связь (Електроніка та звязок, укр.), № 1, с. 24-28 (2009) | Рубрики: 12.01 13.05

 

Климков В.А. «Особенности измерения коэффициента модуляции шумового сигнала» IV Мiжнародна науково-технiчна конференцiя молодих вчених "Електронiка-201". Збірник статей. Частина 1, с. 59-62 (2011)

Рассмотрены особенности определения коэффициента модуляции шумового сигнала. Данная задача характерна для оценивания разборчивости речи с помощью объективного метода STI (Speech transmission index). Результатом работы является алгоритм обработки тестового сигнала указанного метода.

IV Мiжнародна науково-технiчна конференцiя молодих вчених "Електронiка-201". Збірник статей. Частина 1, с. 59-62 (2011) | Рубрика: 13.05

 

Ананьева Е.А., Ананьев А.Б. «Выделение гармонической составляющей из многокомпонентного звука» Электроника и связь (Електроніка та звязок, укр.), № 24, с. 72-76 (2004)

Рассмотрены аспекты выделения гармонической компоненты из многокомпонентного звука на примере выделения гармоники из спектра певческого голоса. Целью выделения такой компоненты является получение ее модуляционных характеристик, в данном случае вибрато. Серия расчетов на тестовых сигналах позволила исследовать влияние различных параметров выделяемой гармоники и используемого фильтра на качество получаемых функций модуляции.

Электроника и связь (Електроніка та звязок, укр.), № 24, с. 72-76 (2004) | Рубрика: 13.05

 

Ананьева Е.А. «Удаление модуляции из гармонических составляющих многокомпонентного звука» Электроника и связь (Електроніка та звязок, укр.), № 1(30), с. 21-25 (2006)

В музыкальной акустике при исследовании певческих голосов возникает задача разделения тембральных характеристик, присущих вокалисту от природы, и сформированной в процессе обучения пению модуляционной характеристики – вибрато. В статье рассмотрен алгоритм удаления модуляции из многокомпонентых звуков, представляющих собой сумму гармонических компонент и межгармонических шумовых составляющих. Работа алгоритма основывается на выделении огибающей и мгновенной фазы гармонических компонент с помощью преобразования Гильберта. Приведенные результаты проверки работы алгоритма на тестовом сигнале и реальном вокальном фрагменте показывают его эффективность.

Электроника и связь (Електроніка та звязок, укр.), № 1(30), с. 21-25 (2006) | Рубрика: 13.05

 

Гавриленко А.В., Дидковский В.С., Продеус А.Н. «Парциальные отношения сигнал–шум в роли критерия, альтернативного разборчивости речи» Электроника и связь (Електроніка та звязок, укр.), № 4(33), с. 48-53 (2006)

Рассмотрены некоторые особенности применения парциальных отношений сигнал–шум в роли критерия, альтернативного разборчивости речи.

Электроника и связь (Електроніка та звязок, укр.), № 4(33), с. 48-53 (2006) | Рубрика: 13.05

 

Гавриленко А.В., Дидковский В.С., Продеус А.Н. «Комплекс вычислительных программ для моделирования измерений разборчивости речи» Электроника и связь (Електроніка та звязок, укр.), № 6(35), с. 16-24 (2006)

Приведены методические рекомендации и вычислительные программы, позволяющие повысить уровень автоматизации модельных исследований измерений разборчивости речи.

Электроника и связь (Електроніка та звязок, укр.), № 6(35), с. 16-24 (2006) | Рубрика: 13.05

 

Ладошко О.Н., Продеус А.Н. «Оптимизация алгоритмов системы распознавания речи с использованием инструментария HTK» Электроника и связь (Електроніка та звязок, укр.), № 4, с. 53-60 (2007)

Продемонстрирована возможность оптимизации алгоритмов системы распознавания речи с помощью программного инструментария НТК.

Электроника и связь (Електроніка та звязок, укр.), № 4, с. 53-60 (2007) | Рубрика: 13.05

 

Гавриленко А.В., Дидковский В.С., Продеус А.Н., Самойленко Н.А. «Формантный метод оценки разборчивости речи» Электроника и связь (Електроніка та звязок, укр.), № 5, с. 44-53 (2007)

Произведен краткий аналитический обзор версий формантного метода расчета и измерений разборчивости речи.

Электроника и связь (Електроніка та звязок, укр.), № 5, с. 44-53 (2007) | Рубрика: 13.05

 

Дидковский В.С., Продеус А.Н. «Сопоставление версий формантного метода оценки разборчивости речи» Электроника и связь (Електроніка та звязок, укр.), № 1-2, с. 227-230 (2008)

Сопоставлены основные версии формантного метода оценки разборчивости речи. Различие рассмотренных версий формантного метода главным образом обусловлено различием определений понятия «формантный спектр». Кроме того, в зарубежных версиях формантного метода вместо эффективного уровня речевого сигнала используют пиковый уровень. Для корректного сопоставления коэффициентов восприятия различных версия формантного метода необходимо учитывать оба этих обстоятельства. Наиболее вероятной причиной разительного отличия графиков коэффициента восприятия Быкова от аналогичных графиков других отечественных версий формантного метода является использование таблиц звукосочетаний, а не таблиц слогов, как это делали Покровский и Сапожков, при оценивании функции распределения уровня речевого сигнала. В каждой из трех рассмотренных отечественных версий формантного метода формантный спектр определяется по-иному, причем в версии Сапожкова вместо формантного спектра фактически используется долговременный спектр речевого сигнала, а в современных зарубежных версиях формантного метода понятие формантного спектра вообще отсутствует. Это дает основание заключить, что формантный спектр – понятие вспомогательное и необязательное. Сопоставление версий Покровского и Сапожкова по критерию словесной разборчивости W привело к новым результатам. Так, по версии Покровского, при малых интегральных отношениях сигнал-шум белый шум лишь ненамного уступает розовому шуму по маскирующим свойствам. Между тем, по версии Сапожкова, белый шум обладает наихудшими маскирующими свойствами при малых интегральных отношениях сигнал–шум.

Электроника и связь (Електроніка та звязок, укр.), № 1-2, с. 227-230 (2008) | Рубрика: 13.05

 

Литвинов С.В., Продеус А.Н. «Моделирование системы распознавания украинской речи с применением инструментария НТК.» Электроника и связь (Електроніка та звязок, укр.), № 1, с. 15-23 (2009)

Сформирован речевой корпус украинской речи, с использованием которого произведено моделирование системы распознавания украинской речи. Выработаны рекомендации по оптимизации фонемного словаря украинской речи и по оптимизации состава и размера вектора параметров речевого сигнала.

Электроника и связь (Електроніка та звязок, укр.), № 1, с. 15-23 (2009) | Рубрика: 13.05

 

Продеус А.Н. «Частотное распределение формант украинской и русской речи» Электроника и связь (Електроніка та звязок, укр.), № 6, с. 18-25 (2009)

Произведено оценивание и сопоставление плотностей распределения формант по частоте для украинской и русской речи.

Электроника и связь (Електроніка та звязок, укр.), № 6, с. 18-25 (2009) | Рубрика: 13.05

 

Продеус А.Н. «О некоторых особенностях развития объективных методов измерений разборчивости речи.» Электроника и связь (Електроніка та звязок, укр.), № 2, с. 217-223 (2010)

Сопоставлены три объективных метода оценки разборчивости речи: метод парциальных отношений сигнал-шум, формантный метод и модуляционный метод. Показана возможность объединения достоинств формантного и модуляционного методов.

Электроника и связь (Електроніка та звязок, укр.), № 2, с. 217-223 (2010) | Рубрика: 13.05

 

Дідковський В.С., Заєць В.П., Рудь Д.П., Самійленко Н.О. «Зв’язок між розбірливістю мови та звукоізоляці∈ю» Электроника и связь (Електроніка та звязок, укр.), № 3, с. 131-134 (2010)

Метою роботи ∈ дослідження зв’язку розбірливості мови та звукоізоляційних властивостей огороджуючих конструкцій.

Электроника и связь (Електроніка та звязок, укр.), № 3, с. 131-134 (2010) | Рубрика: 13.05

 

Дидковский В.С., Продеус А.Н., Рудь Д.П. «О точности измерений функции распределения уровней речевого сигнала» Электроника и связь (Електроніка та звязок, укр.), № 3, с. 152-159 (2010)

Произведены аналитические, модельные и экспериментальные исследования влияния шумовой и реверберационной помех на точность измерений функции распределения уровней речевого сигнала. Показано, что аналитически влияние помех обоих типов можно описать с помощью сходных соотношений свертки функции распределения речевого сигнала с плотностью распределения помехи. Модельные исследования свидетельствуют, что погрешность измерений функции распределения уровней речевого сигнала не превышает 1–2%, если уровень речевого сигнала превышает уровень шумовой помехи не менее чем на 10 дБ. Аналогичные количественные характеристики реверберационной помехи еще предстоит получить. Полученные результаты весьма важны как для теории, так и для практики акустической экспертизы помещений и каналов связи, поскольку в отечественных версиях формантного метода требуется знание коэффициентов восприятия с предельно достижимой точностью.

Электроника и связь (Електроніка та звязок, укр.), № 3, с. 152-159 (2010) | Рубрика: 13.05

 

Ладошко О.Н., Продеус А.Н. «Разметка спонтанной украинской речи» Электроника и связь (Електроніка та звязок, укр.), № 1, с. 97-103 (2011)

Электроника и связь (Електроніка та звязок, укр.), № 1, с. 97-103 (2011) | Рубрика: 13.05

 

Продеус А.Н., Дронжевская Л.Б., Климков В.А., Шагитова Д.А. «Моделирование алгоритмов формантно-модуляционного метода оценивания разборчивости речи» Электроника и связь (Електроніка та звязок, укр.), № 2, с. 79-85 (2011)

Описана процедура оценивания разборчивости речи формантно-модуляционным методом. Получены аналитические выражения для погрешности измерений. Произведено компьютерное моделирование соответствующей измерительной системы. Показано, что результаты измерений хорошо согласуются с результатами артикуляционных испытаний.

Электроника и связь (Електроніка та звязок, укр.), № 2, с. 79-85 (2011) | Рубрика: 13.05

 

Дрожневская Л.Б., Климков В.А., Продеус А.Н., Шагитова Д.А. «Формантный и формантно-модуляционный методы оценивания разборчивости речи. Часть 2. Точность и скорость измерений» Электроника и связь (Електроніка та звязок, укр.), № 6, с. 16-24 (2011)

Сопоставлены, по точности и скорости измерений, формантный и формантно-модуляционный методы измерений разборчивости речи.

Электроника и связь (Електроніка та звязок, укр.), № 6, с. 16-24 (2011) | Рубрика: 13.05

 

Пилипенко К.П., Продеус А.Н. «Использование кумулянтных коэффициентов для определения пола диктора» Электроника и связь (Електроніка та звязок, укр.), № 1, с. 13-17 (2012)

Рассмотрена возможность использования кумулянтных коэффициентов в качестве классификационных признаков для определения пола диктора. Построены классификаторы с помощью логистической регрессии и линейного разделения. Показано, что анализируя параметры плотности вероятностей сигнала в октавной полосе частот со среднегеометрической частотой, раной 125 Гц, можно решать задачу классификации пола диктора. В качестве классификационных признаков были выбраны кумулянтные коэффициенты γ4 и γ6 , с их использованием были построены классификаторы. Результаты тестирования показали, что классификатор, построенный с помощью линейного разделения дал лучший результат.

Электроника и связь (Електроніка та звязок, укр.), № 1, с. 13-17 (2012) | Рубрика: 13.05

 

Найда С.А. «Принципы построения пьезоэлектрических преобразователей акустотермометра» Электроника и связь (Електроніка та звязок, укр.), № 1, с. 25-30 (2012)

Рассмотрены конструктивные особенности пьезопреобразователей для акустотермометрии. Рассчитана пассивная фокусирующая система для акустотермометра. Оценены основные характеристики качества фокусировки. Получены значения напряжений шумов на выходе пьезопреобразователя фокусируемого акустотермометра.

Электроника и связь (Електроніка та звязок, укр.), № 1, с. 25-30 (2012) | Рубрика: 13.05

 

Зубченко О.А., Найда С.А. «Спектрально-временной анализ гласных звуков и сигналов вызванной отоакустической эмиссии уха человека» Электроника и связь (Електроніка та звязок, укр.), № 5, с. 66-71 (2012)

Описана математическая модель среднего уха человека на основе связанных контуров. С ее помощью вычислены значения парциальных частот среднего уха. Исследована взаимосвязь парциальных частот среднего уха человека с формантными частотами гласных звуков и резонансными частотами сигналов задержанной вызванной отоакустической эмиссии уха человека в норме.

Электроника и связь (Електроніка та звязок, укр.), № 5, с. 66-71 (2012) | Рубрика: 13.05

 

Бондаренко И.Ю., Ладошко О.Н. «Нейросетевой алгоритм выделения тональных, шумовых и паузных участков устной речи» Электроника и связь (Електроніка та звязок, укр.), № 6, с. 19-25 (2012)

Рассматривается проблема автоматического выделения тональных, шумовых и паузных участков устной речи. Для решения этой проблемы предлагается нейросетевой алгоритм, выполняющий классификацию последовательности фреймов, на которые разбивается речевой сигнал. На материале речевых корпусов TIMIT и NTIMIT проведены эксперименты по оценке качества, надежности и скорости работы алгоритма в независимом от диктора режиме, в том числе в условиях нестационарного шума, вызванного влиянием телефонного канала.

Электроника и связь (Електроніка та звязок, укр.), № 6, с. 19-25 (2012) | Рубрика: 13.05

 

Елкин С.А., Ляшенко А.Г., Овсяник В.П., Продеус А.Н. «О влиянии помех и параметров настройки на качество функционирования системы автоматического распознавания речи» Электроника и связь (Електроніка та звязок, укр.), № 1, с. 94-101 (2013)

Экспериментально исследовано влияние помех и некоторых характеристик системы автоматического распознавания речи на качество распознавания. Получены рекомендации по оптимизации параметров системы автоматического распознавания речи для нескольких сценариев ее использования.

Электроника и связь (Електроніка та звязок, укр.), № 1, с. 94-101 (2013) | Рубрика: 13.05

 

Продеус А.Н. «Программный инструментарий для тестирования систем обработки речевых сигналов. Часть 1. Моделирование сигналов» Электроника и связь (Електроніка та звязок, укр.), № 2, с. 30-38 (2013)

Предложен состав программного инструментария для исследований и оптимизации алгоритмов систем коррекции и кодирования речевых сигналов, подверженных различного рода искажениям, таким как шумовая и реверберационная помехи, ошибки кодирования. В первой части данной работы рассмотрен инструментарий, позволяющий решать такие задачи как создание корпусов зашумленной речи и коррекция зашумленных речевых сигналов. Произведен анализ достоинств и недостатков инструментариев FaNT и VoiceBox, выработаны рекомендации по компенсации указанных недостатков средствами Matlab. Показана целесообразность создания обобщенного инструментария, путем объединения инструментариев FaNT и VoiceBox. Кроме того, показана целесообразность дополнения такого инструментария программными модулями, обеспечивающими моделирование оценивания качества систем обработки речевых сигналов. Рассмотренные примеры свидетельствуют о работоспособности и правильности функционирования данного инструментария.

Электроника и связь (Електроніка та звязок, укр.), № 2, с. 30-38 (2013) | Рубрика: 13.05

 

Продеус А.Н. «Программный инструментарий для тестирования систем обработки речевых сигналов. Часть 2. Оценка эффективности.» Электроника и связь (Електроніка та звязок, укр.), № 3, с. 31-37 (2013)

Предложен состав программного инструментария для исследований и оптимизации алгоритмов систем коррекции и кодирования речевых сигналов, подверженных различного рода искажениям, таким как шумовая и реверберационная помехи, ошибки кодирования. Рассмотрен инструментарий, позволяющий решать такие задачи как создание корпусов зашумленной речи и коррекция зашумленных речевых сигналов. Предложен программный инструментарий для аттестации тестируемых систем обработки речевых сигналов по таким критериям как качество и разборчивость речи, достоверность автоматического распознавания речи. Разработанный инструментарий является неоднородным: часть вычислений производится в среде Matlab, а часть – вне этой среды. Несмотря на указанную особенность, данный инструментарий позволяет совместно использовать все необходимые программные компоненты, что обеспечивает сквозную автоматизацию обработки речевых сигналов, начиная от их намеренного искажения, последующей коррекции – и заканчивая оценкой качества восстановленных речевых сигналов.

Электроника и связь (Електроніка та звязок, укр.), № 3, с. 31-37 (2013) | Рубрика: 13.05

 

Леонов А.С., Сорокин В.Н. «Две параметрические модели голосового источника и их асимптотический анализ» Акустический журнал, 60, № 3, с. 300-311 (2014)

Исследуется асимптотическое поведение функции площади голосовой щели вблизи моментов ее открытия и закрытия для двух математических моделей голосового источника. Показано, что в первой модели асимптотики функции площади подчиняются степенному закону с показателем не меньшим 1. Детальный анализ позволяет уточнить эти пределы в зависимости от относительных величин интервалов открытой и закрытой голосовой щели. В работе исследуется и другая параметрическая модель площади голосовой щели, которая основана на упрощенном физико-геометрическом представлении процессов колебаний голосовых складок. Она является специальным вариантом известной двухмассовой модели и содержит пять параметров: период основного тона, эквивалентные массы нижней и верхней кромки голосовых складок, коэффициент упругого сопротивления нижней складки и время задержки между раскрытиями верхней и нижней складок. Установлено, что асимптотики получаемой функции площади голосовой щели подчиняются степенному закону с показателем 1 как при ее открытии, так и при закрытии. DOI: 10.7868/S0320791914030125

Акустический журнал, 60, № 3, с. 300-311 (2014) | Рубрика: 13.05

 

Ермилов А.В. «Моделирование речевых признаков с помощью алгоритма симуляции отжига» Вестник Российского университета дружбы народов (РУДН). Серии Математика. Информатика. Физика, № 2, с. 354-358 (2014)

Мел-частотные кепстральные коэффициенты до сих пор являются наиболее популярными речевыми признаками. Однако в зависимости от длины речевого тракта (стоит отметить, что длина речевого тракта зависит от пола и других физиологических параметров, таких как рост, и может меняться в пределах от 13 до 18 см) частоты центральных формант оказываются смещёнными. Величина смещения может достигать 25%. Такие большие различия могут вести к неправильному распознаванию высказывания предварительно хорошо обученной модели в случае, если высказывание было произнесено новым диктором, то есть система становится дикторозависимой. Альтернативой является применение признаков, которые не зависят от диктора, например, полученные с помощью аудиовизуальных моделей (Auditory Image Model). В данной статье описываются признаки, основанные на аудиовизуальных моделях, которые могут быть вычислены при помощи алгоритма симуляции отжига. На основе Монте-Карло-симуляций исследованы статистические свойства оценок параметров расширения Грам–Шарлье нормального распределения, полученных применением метода симуляции отжига к решению задачи максимизации правдоподобия, а также проведено сравнение точности решения данной задачи максимизации правдоподобия при помощи различных методов.

Вестник Российского университета дружбы народов (РУДН). Серии Математика. Информатика. Физика, № 2, с. 354-358 (2014) | Рубрика: 13.05