Российский фонд
фундаментальных
исследований

Физический факультет
МГУ им. М.В.Ломоносова
 

13.05 Речеобразование и восприятие речи

 

Давиденкова-Хмара Е.Ш. «Акустика певческого голоса: сравнительный анализ отечественных исследований, опыт их практического применения» Акустический журнал, 71, № 5S, с. 42 (2025)

Доклад посвящен сравнительному анализу ведущих отечественных исследований акустики певческого голоса, начиная с XVIII века и заканчивая современностью. Изучение законов постановки и раскрытия певческого голоса издавна интересовало российских ученых и музыкантов-практиков. Вопросы о том, как правильно организовать дыхание и работать с голосовым аппаратом поднимались в отдельных научно-практических работах, а также рассматривались в отечественных школах пения. В XX веке ведущей отечественной теорией, посвященной певческому голосу, стала «резонансная теория пения», автором которой является В.П. Морозов. В Санкт-Петербургской Консерватории в эти же годы была разработана еще одна теория акустики пения, автор ее В.И. Юшманов. Раскрытию этой теории посвящена его книга «Вокальная техника и ее парадоксы». В докладе также рассматривается практическое применение основных идей, сформулированных на базе данных теорий. Ключевые слова: акустика певческого голоса, академическое пение

Акустический журнал, 71, № 5S, с. 42 (2025) | Рубрики: 11.08 13.05

 

Мещеряков Р.В. «Оценивание шумовой составляющей речевого сигнала» Акустический журнал, 71, № 5S, с. 28 (2025)

Развитие современных технологий в обработке и генерации речевого сигнала решает множество проблем и позволяет повысить эффективность работы с ним. Вместе с тем остаются вопросы по обработке в условиях сложных шумов. Очевидно, что элементы технологий искусственного интеллекта позволяют проводить шумоочистку и выделять необходимые признаки, однако в ряде случаев требуется оценивать сам шум (или шумоподобный сигнал). В докладе предлагается классификация шумов и подходы к их использованию для решения некоторых задач. Ключевые слова: речевой сигнал, шум, акустика речи, естественная информация, энтропия

Акустический журнал, 71, № 5S, с. 28 (2025) | Рубрики: 13 13.05

 

Потапова Р.К., Потапов В.В., Померанцев Н.Д. «Цветовые ассоциации звучащих гласных русского языка: фоносемантический анализ с учетом гендерных различий» Акустический журнал, 71, № 5S, с. 29 (2025)

Изучаются цветовые ассоциации звучащих гласных русского языка в контексте фоносемантики. Экспериментальная база включала 200 звуковых стимулов, представляющих 10 гласных фонем, произнесенных 10 мужчинами и 10 женщинами. Эксперимент завершили 92 испытуемых (58 женщин и 34 мужчины), которые посредством специально разработанного веб-приложения прослушивали гласные и выбирали ассоциируемый с ними цвет. Результаты показали наличие гендерных различий в цветовых ассоциациях гласных. Кроме того, поднимается вопрос о влиянии акустических характеристик, таких как частота основного тона, формантные частоты и длительность звука, на формирование цветовых ассоциаций. Данное исследование расширяет понимание фоносемантических связей и подчеркивает значимость акустических параметров в формировании сенсорных ассоциаций. Ключевые слова: фоносемантика, звуко-цветовые ассоциации, акустика речи, перцептивный эксперимент, веб-приложение

Акустический журнал, 71, № 5S, с. 29 (2025) | Рубрика: 13.05

 

Ильяс А.Б., Фролова О.В. «Работа голосовых складок при чтении слогов взрослыми: оценка методом электроглоттографии» Акустический журнал, 71, № 5S, с. 29 (2025)

Электроглоттография – неинвазивный метод оценки работы голосовых складок во время фонации. Метод используется во многих работах, которые исследуют влияние различных факторов на голос испытуемых. Цель исследования – определить и сравнить параметры электроглоттограммы взрослых мужчин и женщин. В исследовании приняли участие 5 мужчин и 5 женщин в возрасте от 19 до 24 лет. Осуществлена регистрация электроглоттограммы при прочтении специального речевого материала, состоящего из слогов и гласных. Проведен анализ электроглоттограмм и описаны следующие параметры: коэффициент CQ (the contact quotient – коэффициент, указывающий на долю времени смыкания голосовых складок в одном глоттальном цикле), форма глоттографической волны и значения частоты основного тона гласных. Получены данные о характеристиках работы голосового источника мужчин и женщин при прочтении изолированных гласных и слогов, осуществлено их сравнение. Результаты исследования могут быть использованы для сравнения с пациентами с нарушениями работы голосовых складок. Работа выполнена при финансовой поддержке Российского Научного Фонда (проект № 22-45-02007). Ключевые слова: электроглоттограмма, голосовые складки, частота основного тона

Акустический журнал, 71, № 5S, с. 29 (2025) | Рубрика: 13.05

 

Кедрова Г.Е., Проничева А.Ю., Чучупал В.Я. «Фонетическая интерференция в русской речи китайцев: автоматизация диагностики и анализ типичного устойчивого акцента» Акустический журнал, 71, № 5S, с. 30 (2025)

Цель данного исследования – разработка механизмов автоматической идентификации произносительных трудностей китайских студентов, обучающихся русскому языку, и выявление устойчивых проявлений иноязычного акцента, сохраняющихся на продвинутом уровне владения русским языком. Объектом анализа стали аудиозаписи чтения 1428 слов из сбалансированного фонетического словаря русских ритмических структур, прочитанные китайскими и русскими студентами и аспирантами. Аудиоматериал включал запись 15 китайских дикторов разного уровня владения русским языком (от ТРКИ B1-B2 до C1-C2). Акустическому анализу подверглись аудиозаписи китайских дикторов с низким уровнем владения языком и дикторов-китайцев с максимально высоким уровнем общей длительностью 10 часов

Акустический журнал, 71, № 5S, с. 30 (2025) | Рубрика: 13.05

 

Ганбаатар Цэнд-Аюуш «Фоносемантический подход к изучению перцепции и акустики монгольских гласных» Акустический журнал, 71, № 5S, с. 30 (2025)

Настоящее исследование посвящено слуховому и зрительному восприятию гласных современного монгольского языка. В работе рассматривается вопрос о звуко-цветовых ассоциациях и их связи с акустическими характеристиками гласных. Экспериментальное исследование включало участие 700 носителей литературного монгольского языка, распределенных по признаку «пол» и «возраст» с применением перцептивно-слуховых и перцептивно-зрительных тестов. Анализ полученных данных позволил выявить закономерности восприятия монгольских гласных, а также определить влияние акустических параметров на их цветовые корреляции.

Акустический журнал, 71, № 5S, с. 30 (2025) | Рубрика: 13.05

 

Ляксо Е.Е., Фролова О.В., Матвеев А.Ю., Николаев А.С., Клешнев Е.А., Граве П.И., Ильяс А.Б. «Распознавание эмоциональных состояний по мимической экспрессии, голосу и речи детьми, взрослыми и автоматически» Акустический журнал, 71, № 5S, с. 31 (2025)

Представлены результаты трех экспериментальных исследований по распознаванию детьми (исследование 1), взрослыми (исследование 2) и автоматически (исследование 3) эмоциональных состояний «радость–нейтральное (спокойное)–печаль–гнев» по мимической экспрессии, голосу и речи. В исследовании приняли участие 260 детей с типичным развитием (ТР), расстройствами аутистического спектра (РАС), синдромом Дауна (СД), интеллектуальными нарушениями (ИН) и 40 взрослых. Материалом послужили аудио и видеозаписи выполнения детьми тестовых заданий по методике оценки сформированности эмоциональной сферы – CEDM. Результаты показали большую точность распознавания эмоциональных состояний ТР детьми по сравнению с детьми с РАС и ИН и особенности распознавания эмоциональных состояний детьми с РАС и ИН. Эксперты распознавали эмоции детей всех групп по мимической экспрессии и речи точнее, чем автоматически, с более высокими значениями UAR (полнота распознавания) для ТР детей по аудио и видео в перцептивном эксперименте и по аудио при автоматической классификации эмоций. Выявлены различия по точности классификации эмоций детей с РАС, ИН и СД. Серия экспериментов с использованием методов искусственного интеллекта проведена для возможности создания автоматической системы экспресс-диагностики сформированности или нарушений эмоциональной сферы детей. Работа выполнена при финансовой поддержке Российского Научного Фонда (проект № 22-45-02007). Ключевые слова: эмоциональное состояние, перцептивный эксперимент, автоматическое распознавание, мимическая экспрессия, речь

Акустический журнал, 71, № 5S, с. 31 (2025) | Рубрики: 13.05 13.06

 

Куражова А.В. «Распознавание эмоционального состояния близнецов по характеристикам речи» Акустический журнал, 71, № 5S, с. 31 (2025)

Цель работы – сравнить акустические характеристики эмоциональной речи близнецов в парах, оценить возможность идентификации близнецов по голосу и речи. В исследовании принимали участие 10 близнецов – носителей русского языка в возрасте 20±2 лет соответственно). Проводили аудиозапись речи информантов в диалоге с экспериментатором и в паре друг с другом. Осуществляли анализ временных и спектральных характеристик речи в звуковом редакторе Cool Edit Pro. Для анализа отбирали эмоциональные высказывания участников. Составлены аудиотесты, включающие высказывания каждого из информантов. Аудиотесты предъявляли двум группам аудиторов – экспертам с опытом работы в области речевых исследований, аудиторам без опыта. Аудиторам давали задание определить эмоциональное состояние информанта. Для каждого высказывании определяли среднее значение частоты основного тона (F0ср, ЧОТ), диапазон частоты основного тона (F0mx-F0min), длительность всего высказывания, длительность пауз между словами, считали F0ср и длительность ударных и безударных гласных из слов. Выявлены различия по вероятности распознавания эмоциональных высказываний, произнесенных мужчинами и женщинами. Выявлены индивидуальные особенности проявления эмоционального состояния близнецов в парах. Установлены различия по временн'ым и спектральным характеристикам речи между близнецами в пределах пары. Работа выполнена при финансовой поддержке гранта РНФ (№ 22-45-02007). Ключевые слова: близнецы, акустика речи, эмоциональное состояние, частота основного тона

Акустический журнал, 71, № 5S, с. 31 (2025) | Рубрики: 13.05 13.06

 

Фролова О.В., Ляксо Е.Е. «Проявление эмоциональных состояний в мимике и речи детей, воспитывающихся в детском доме» Акустический журнал, 71, № 5S, с. 32 (2025)

Цель исследования – изучение особенностей эмоциональной сферы детей 5–16 лет с интеллектуальными нарушениями (ИН), воспитывающихся в детском доме. В работе приняли участие 28 детей из детского дома с легкими ИН (18 детей с задержкой психического развития, 10 – с умственной отсталостью легкой степени тяжести) и синдромом Дауна (СД). Все дети протестированы по методике CEDM (для детей с СД использована краткая версия методики CEDM-sh). Осуществляли аудиозапись речи, видеозапись поведения и мимики детей при выполнении тестовых заданий CEDM. Получены балльные оценки за выполнение детьми тестовых заданий на распознавание эмоций и отражение эмоциональных состояний в голосе, речи и мимической экспрессии. Проведен перцептивный и акустический анализ речи детей в разных эмоциональных состояниях. Мимическую экспрессию детей оценивали перцептивно и автоматически с использованием программы «FaceReader». Результаты исследования показали, что дети с СД значимо хуже выполняют тестовые задания, чем дети с ИН. Для детей с ИН выявлена возрастная динамика при выполнении тестовых заданий на отражение эмоций («беседа с экспериментатором» и «интервью») и распознавание эмоций. Данные по оценке эмоциональной сферы детей, воспитывающихся в детском доме, сопоставляются с данными по детям, растущим в условиях семьи. Работа выполнена при финансовой поддержке Российского Научного Фонда (проект № 22-45-02007). Ключевые слова: эмоциональное состояние, речь, дети из детского дома, интеллектуальные нарушения, синдром Дауна

Акустический журнал, 71, № 5S, с. 32 (2025) | Рубрики: 13.05 13.06

 

Павликова М.И. «Параметры интонации у детей с типичным развитием и интеллектуальными нарушениями» Акустический журнал, 71, № 5S, с. 32 (2025)

Целью работы было сравнить интонационные характеристики речи типично развивающихся (ТР) детей и детей с легкой формой умственной отсталости (УО) в разные возрастные периоды, начиная с 5 и до 14-ти лет. В работе применяли перцептивный, аудиторский и инструментальный анализ реплик детей, записанных в ходе диалога с экспериментатором. Определяли словесное ударение, фразовое ударение и интонационные параметры речи. Обнаружены различия между группами детей с ТР и УО по длительности реплик, количеству слов в репликах, темпу речи и длительности гласных в словах. Во всех группах детей выявлены различия в длительности ударных гласных в интонационно выделенных словах и обычных словах, а также в длительности ударных и безударных гласных. В группах детей показана возрастная динамика формирования словесного ударения за счет повышенной длительности ударных гласных. Прослежены возрастные изменения в частоте основного тона (ЧОТ) во фразах. Обсуждается возможная связь изменения ЧОТ на ударных гласных с фразовым ударением. Полученные результаты позволяют оценить динамику речевого развития у детей с умственной отсталостью. Ключевые слова: детская речь, умственная отсталость, интонация, акустические параметры речи

Акустический журнал, 71, № 5S, с. 32 (2025) | Рубрики: 13.05 13.06

 

Николаев А.С. «Акустические характеристики эмоциональной речи детей с расстройствами аутистического спектра» Акустический журнал, 71, № 5S, с. 32-33 (2025)

Исследование направлено на изучение акустических характеристик эмоциональной речи детей в возрасте 5–14 лет с расстройствами аутистического спектра (РАС), n=35, и типично развивающихся (ТР) детей, n=47. Проведен слуховой перцептивный эксперимент, в ходе которого взрослые носители русского языка (аудиторы), n=206, прослушивали тестовые последовательности (аудиотесты), содержащие фразы детей с РАС и ТР, отобранные из записей спонтанной речи. Проведен спектрографический анализ речевых сигналов фраз, классифицированных аудиторами по трем состояниям: комфорт–нейтральное состояние–дискомфорт. Показано, что состояние дискомфорта у детей с РАС характеризуется максимальными значениями длительности, частоты основного тона (ЧОТ) и ее вариативности по фразам, словам и гласным по сравнению с нейтральным состоянием и комфортом, минимальные значения – у нейтрального состояния. Во всех трех состояниях выявлены различия в значениях ЧОТ по фразам, словам и гласным, интенсивности ударного гласного между сигналами, распознанные аудиторами с высокой (0.75–1.0) и низкой (0–0.25) вероятностью. Показана связь между акустическими характеристиками речевых сигналов и вероятностью распознавания аудиторами. Работа выполнена при финансовой поддержке гранта РНФ (№ 22-45-02007). Ключевые слова: расстройства аутистического спектра, детская речь, эмоциональная речь, акустический анализ, перцептивный анализ

Акустический журнал, 71, № 5S, с. 32-33 (2025) | Рубрики: 13.05 13.06

 

Граве П.И., Николаев А.С. «Перцептивные и акустические характеристики речи детей 5–7 лет с расстройствами аутистического спектра» Акустический журнал, 71, № 5S, с. 33 (2025)

Цель исследования – определение перцептивных и акустических характеристик эмоциональной речи детей 5–7 лет с расстройствами аутистического спектра (РАС). В исследовании приняли участие 16 типично развивающихся (ТР) детей и 5 детей с РАС. В работе использован методический подход для оценки эмоциональной сферы детей CEDM, разработанный в Группе по изучению детской речи СПбГУ. Запись речи детей проводили в модельных ситуациях: диалог с экспериментатором – спонтанная речь, и «актерская» речь – произнесение ребенком слов и фраз в 4 эмоциональных состояниях: радость–нейтральное (спокойное) состояние–печаль–гнев. Для определения возможности распознавания взрослыми эмоционального состояния детей по их речи проведен перцептивный эксперимент, в котором приняло участие 10 взрослых аудиторов. Создано 4 тестовых последовательности, включающих речевой материал «актерской» и спонтанной речи ТР детей и детей с атипичным развитием. Показаны различия в распознавании аудиторами эмоционального состояния ТР детей и детей с РАС. Осуществлен инструментальный спектрографический анализ речевого материала, включенного в тестовую последовательность перцептивного эксперимента. Показаны различия в акустических характеристиках слов типично развивающихся детей и детей с РАС. Работа выполнена при финансовой поддержке гранта РНФ (№ 22-45-02007). Ключевые слова: расстройства аутистического спектра, эмоциональная речь, перцептивный анализ, акустический анализ

Акустический журнал, 71, № 5S, с. 33 (2025) | Рубрики: 13.05 13.06

 

Клешнев Е.А., Ляксо Е.Е. «Эмоциональная речь мальчиков 12–16 лет с расстройствами аутистического спектра и типичным развитием: акустические и перцептивные характеристики» Акустический журнал, 71, № 5S, с. 33-34 (2025)

Цель исследования – определить акустические и перцептивные характеристики эмоциональной речи мальчиков 12–16 лет с расстройствами аутистического спектра (РАС) и типичным развитием (ТР), провести сравнительный анализ. В исследовании приняли участие 15 мальчиков 12–16 лет: 10 ТР мальчиков, 5 мальчиков с РАС. Запись эмоциональной речи проводили при выполнении подростками тестовых заданий методики оценки сформированности эмоциональной сферы детей «Child Emotion Development Method» (CEDM). Использовали два метода анализа речи – перцептивный эксперимент, проводимый с целью распознавания аудиторами (n=10) эмоциональных состояний подростков по их речи и инструментальный спектрографический анализ. Результаты перцептивного эксперимента представляли в виде матриц спутывания. Спектрографический анализ речи детей проводили в программе «Cool Edit Pro 2.0». Считали: длительность; значения частоты основного тона (ЧОТ); минимальные и максимальные значения ЧОТ; вариативность ЧОТ; значения интенсивности по фразе, ударному слову и ударному гласному. Выявлены различия в акустических характеристиках эмоциональной речи мальчиков 12–16 лет: значениях ЧОТ ударного слова, ударного гласного; значениях вариативности ЧОТ. Аудиторы лучше определяли эмоциональные состояния по речи мальчиков с ТР, чем по речи мальчиков с РАС. Работа выполнена при финансовой поддержке РНФ (проект 22-45-02007). Ключевые слова: подростки, эмоциональная речь, расстройства аутистического спектра, акустические характеристики

Акустический журнал, 71, № 5S, с. 33-34 (2025) | Рубрики: 13.05 13.06

 

Столярова Э.И., Белова Н.Ю., Солнушкин С.Д., Чихман В.Н. «Использование инструментальных методик при обучении школьников с слухоречевыми нарушениями» Акустический журнал, 71, № 5S, с. 34 (2025)

Представляемая работа осуществляется в рамках договора о научно-практическом сотрудничестве между ИФ РАН и ГБОУ Школа № 10 «Изучение специфики проблем письма и чтения у школьников с речевыми нарушениями и развитие подходов к их коррекции». В 2024–2025 учебном году для занятий с педагогом-дефектологом были сформированы группы: 5 школьников из 5 класса, 14 – из 7 класса, 5 – из 8 класса. Из педагогических характеристик школьников следовало, что у них в той или иной степени наблюдается несформированность фонематического восприятия и слуха, лексико-грамматическое недоразвитие речи, дисграфия, дизорфография, ограниченность словарного запаса, недостаточная сформированность навыков языкового анализа, они испытывают трудности при составлении устного рассказа. Для проведения коррекционных занятий использовались программные комплексы «Учись слушать» (совместная разработка ИФ РАН и НИИ уха, горла, носа), в составе которого тесты и упражнения для развития слухового восприятия различной звуковой информации, и «ПЛД» (разработка лабораторий информационных технологий и психофизиологии речи ИФ РАН), который содержит наборы заданий с дидактическим материалом по развитию фонематического слуха, освоению навыков чтения, орфографической зоркости и грамотности. Результаты выполнения заданий автоматически сохранялись. Их анализ обеспечивал объективную оценку динамики и индивидуальных особенностей освоения учебного материала, с учетом которой могли планироваться последующие коррекционные занятия. Оба комплекса хорошо зарекомендовали себя в учебной практике и способствовали улучшению оцениваемых характеристик во всех группах учащихся. Ключевые слова: слух, речь, коррекция слухоречевых нарушений, информационные технологии

Акустический журнал, 71, № 5S, с. 34 (2025) | Рубрики: 13.05 13.06

 

Караваева В.Г., Андросова С.В. «Элизия в русском и английском академическом дискурсе: корпусное моделирование частотности» Акустический журнал, 71, № 5S, с. 35 (2025)

Целью настоящего исследования является моделирование частотности элизии в русском и английском академическом дискурсе на основе мультиязычного речевого корпуса. Элизия как фонетический процесс, связанный с полной редукцией или выпадением звуков, играет важную роль в спонтанной и подготовленной речи, однако ее особенности в академическом дискурсе изучены недостаточно. В работе ставятся следующие задачи: (1) выявить закономерности проявления элизии в русском и английском академическом дискурсе (на материалах лекции и дискуссии), (2) сопоставить частотность элизии в двух языках, (3) определить влияние темпа речи и позиции звука на реализацию элизии. Материалом для исследования послужили лекции на английском и учебные дискуссии на русском языках, размеченные в формате TextGrid. Для анализа использовались инструменты автоматической обработки речи: Prt (акустический анализ), Montrel Forced Aligner (выравнивание текста и звука), EXMARLDA (корпусная аннотация), Python библиотеки для анализа и визуализации данных. В результате исследования были (1) разработаны шаблоны запросов в корпусном менеджере для моделирования частотности и контекстов модификаций; (2) для русского и английского языков описаны реализации словоформ с альтернативным фонемным и слоговым составом. Полученные данные могут быть использованы в фонетических исследованиях, преподавании фоностилистики и дообучении систем автоматической обработки речи. Ключевые слова: элизия, академический дискурс, корпусная фонетика, моделирование частотности, сопоставительный анализ

Акустический журнал, 71, № 5S, с. 35 (2025) | Рубрика: 13.05