Российский фонд
фундаментальных
исследований

Физический факультет
МГУ им. М.В.Ломоносова
 

13.05 Речеобразование и восприятие речи

 

Леонов А.С., Сорокин В.Н. «Оценка треков резонансных частот речевого тракта» Акустический журнал, 69, № 6, с. 765-777 (2023)

Предлагается новый метод оценки треков формантных частот речевого тракта для произвольных речевых сегментов. Метод использует отношение двух преобразований Фурье речевого сигнала со специальными окнами экспоненциального типа, зависящими от некоторого параметра. Это отношение используется для определенных моментов времени и рассматривается как функция частоты и параметра. Анализируя для нескольких значений параметра распределение точек минимума (по частоте) для фазы этого отношения и/или аналогичное распределение точек экстремума для его амплитуды, можно оценить формантные частоты по пикам этих распределений. Представлено математическое исследование, обосновывающее такой подход. Проведены серии численных экспериментов по обработке синтетических и реальных речевых сигналов, подтвердившие работоспособность предложенного метода оценки формант. В частности, в экспериментах с синтезированными гласными было установлено, что погрешность оценки их резонансных частот мала и устойчива по отношению к аддитивным шумам вплоть до отношения сигнал/шум +5 дБ. Для реальной речи метод позволяет вычислить треки формантных частот как для звуков с голосовым возбуждением, так и для глухих фрикативных, аспиративных взрывов и шепотной речи.

Акустический журнал, 69, № 6, с. 765-777 (2023) | Рубрики: 12.01 13.05

 

Жиляков Е.Г., Белов С.П., Белов А.С., Медведева А.А. «Обнаружение пауз между словными фрагментами записей речевых сигналов» Информационные технологии и вычислительные системы, № 1, с. 40-46 (2022)

Рассматривается задача сегментации записей речевых сигналов на отрезки, порождаемые в присутствии речи (словные отрезки), и паузы между ними. Такая сегментация является важным этапом идентификации речевых компонент на основе некоторых признаков. Предполагается, что отрезки речевого сигнала в паузах речи являются выборками из стационарной последовательности отсчетов, (шумы в паузах). В качестве основной характеристики шумов в паузах предлагается использовать оценки по обучающей выборке математических ожиданий частей энергий их отрезков некоторой конечной длительности в заранее определенных частотных полосах (субполосный анализ).Показано, что использование максимального из отношений частей энергий текущего анализируемого отрезка к соответствующим математическим ожиданиям частей энергий отрезков шумов позволяет в максимальной степени учесть возможное присутствие речевой компоненты. Этот эффект равносилен максимизации отношения сигнал/шум, то есть предлагаемая решающая функция в этом смысле является оптимальной.

Информационные технологии и вычислительные системы, № 1, с. 40-46 (2022) | Рубрика: 13.05

 

Луничкин А.М., Штин К.С. «Роль слуховой обратной связи в контроле голоса при нормальном и сниженном слухе» Сенсорные системы, 37, № 41, с. 285-300 (2023)

Контроль голоса и речи осуществляется совместной работой прямой и обратной связей. Прямая связь отвечает за активацию выученной артикуляторной программы, в то время как обратная связь предоставляет акустическую и сенсомоторную информацию о выполнении высказывания. Их совместная работа по контролю речи описывается моделью DIVA, в основе которой лежит осуществляемая нервными центрами регуляция слуховой информации и проприорецептивных сигналов относительно артикуляторных программ. Несоответствие сенсорной информации, поступающей по обратной связи с представлением акустического сигнала в слуховой коре, вызывает корректирующие команды. У овладевающих речью детей слуховая обратная связь необходима для правильного освоения артикуляционных навыков, т.е. для формирования прямой связи. По этой причине прелингвально оглохшие взрослые характеризуются значительными нарушениями артикуляции ввиду несформированности артикуляторных навыков. При постлингвальной глухоте сформированная ранее прямая связь сохраняется, что позволяет успешно произносить фонемы. Однако у людей с сенсоневральной тугоухостью ухудшается контроль фонации и артикуляции по механизму слуховой обратной связи, что выражается в увеличении громкости голоса, изменении спектральных характеристик речи и нестабильности голоса по частоте и амплитуде. Похожие речевые изменения обнаруживаются у здоровых дикторов в присутствии шума, маскирующего собственный голос говорящего (эффект Ломбарда). Речь в шуме характеризуется ростом интенсивности голоса, смещения спектральных характеристик в высокочастотную область и гиперартикуляцией. Такая речевая реорганизация представляет собой адаптацию голоса диктора к фоновому шуму, целью которой являются демаскировка голоса и восстановление слуховой обратной связи. Ключевые слова: слухоречевое взаимодействие, слуховая обратная связь, речь, голос, эффект Ломбарда, хроническая сенсоневральная тугоухость, модель DIVA

Сенсорные системы, 37, № 41, с. 285-300 (2023) | Рубрики: 13.05 13.06

 

Огородникова Е.А., Клишова Е.А., Андреева И.Г. «Экспериментальные подходы к изучению локализации источников звука по расстоянию при патологии слуха» Сенсорные системы, 37, № 41, с. 301-319 (2023)

Представлен обзор современных экспериментальных подходов, которые применяют для оценки способности к локализации источников звука по расстоянию при патологии слуха. Рассмотрено влияние характерных проявлений нарушений слуха на процессы выделения основных признаков локализации – уровня сигнала, особенностей его спектра, бинаурального взаимодействия при слуховом восприятии расстояния до неподвижных и движущихся источников звука или речи. В обзор включены результаты собственных исследований авторов и литературные данные об изменении разрешающей способности слуха по расстоянию при сенсоневральной тугоухости с разной степенью двусторонней и односторонней потери слуха, центральных слуховых расстройствах, включая возрастные аспекты проблемы. Описан компенсаторный потенциал слуховой пространственной функции при неинвазивном и инвазивном слухопротезировании, а также при ее тренировке с применением элементов акустической виртуальной реальности. Предложен методический подход к формированию пространственных сцен, который доступен для реализации в клинической практике. Ключевые слова: пространственный слух, сенсоневральная тугоухость, центральные слуховые расстройства, разрешающая способность слуха, локализация по расстоянию, слухопротезирование, тренировка пространственного восприятия, акустическая виртуальная реальность

Сенсорные системы, 37, № 41, с. 301-319 (2023) | Рубрики: 13.05 13.06

 

Пудов В.И., Зонтова О.В. «Слуховое восприятие при кохлеарной имплантации» Сенсорные системы, 37, № 41, с. 320-329 (2023)

Кохлеарная имплантация – уникальная разработка в области протезирования сенсорных систем человека. За счет электрического раздражения слухового нерва возникают слуховые ощущения, близкие к естественным. Несмотря на значительный прогресс в разработке кохлеарных имплантов (КИ), качество слухового восприятия при их использовании существенно ограничено. Наибольшие трудности у пользователей КИ возникают в сложных ситуациях коммуникации, таких как восприятие речи в шуме или с несколькими говорящими. Существует множество факторов, как технических, так и физиологических, которые затрудняют разборчивость речи у пользователей КИ. Восприятие речи у пользователей КИ ограничено из-за низкой разрешающей способности по частоте, искажения восприятия высоты и сжатия динамического диапазона. Низкая разрешающая способность по частоте проявляется в снижении разборчивости речи и способности воспринимать музыку. Важным является вопрос о состоянии центральных механизмов слуха, особенно для детей с врожденной глухотой. С возрастом у ребенка снижается пластичность мозга и затрудняются процессы формирования центральных слуховых механизмов, поэтому желательно проводить кохлеарную имплантацию в как можно более раннем возрасте после выявления тугоухости. Изучение особенностей слухового восприятия при электрическом возбуждении слухового нерва позволяет не только предложить инновационные подходы для улучшения слуховых способностей пользователей КИ, но и определить новые направления в изучении слуховой системы человека. Ключевые слова: кохлеарная имплантация, высота звука, громкость, дифференциальный порог по частоте, разборчивость речи

Сенсорные системы, 37, № 41, с. 320-329 (2023) | Рубрики: 13.05 13.06

 

Торопчина Л.В. «Развитие методических подходов для оценки функционального состояния лабиринта внутреннего уха» Сенсорные системы, 37, № 41, с. 330-341 (2023)

Моделирование распространения звуковых колебаний от подножной пластинки стремени в овальном окне к воспринимающим образованиям кортиевого органа представляет собой сложную экспериментальную задачу. В поиске причин тугоухости тональная пороговая аудиометрия традиционно рассматривалась как основа диагностики. Наличие костно-воздушного интервала на аудиограмме ассоциировалось с нарушением функции среднего уха, однако, во многих случаях костно-воздушный интервал выявляется при локализации патологии в структурах внутреннего уха. В обзоре показано, что патологические состояния, нарушающие внутриулитковое звукопроведение, успешно выявляются применением компьютерной томографии височных костей. Выполнена классификация патологических состояний лабиринта, дающих костно-воздушный интервал на тональной пороговой аудиограмме. Ключевые слова: кондуктивная тугоухость, сенсоневральная тугоухость, смешанная тугоухость, звукопроведение, звуковосприятие, внутриулитковое звукопроведение, костно-воздушный интервал, тональная пороговая аудиометрия, мальформации внутреннего уха, компьютерная томография височных костей

Сенсорные системы, 37, № 41, с. 330-341 (2023) | Рубрики: 13.05 13.06

 

Балякова А.А., Лабутина О.В., Медведев И.С., Пак С.П., Огородникова Е.А. «Особенности распознавания речевых сигналов в условиях голосовой конкуренции в норме и при нарушениях слухоречевой функции» Сенсорные системы, 37, № 41, с. 342-347 (2023)

Исследовали особенности восприятия речевых сигналов в условиях голосовой конкуренции по гендерному признаку (мужской/женский голос) у испытуемых разного возраста и состояния слухоречевой функции. Психофизические измерения проводили при имитации ситуации “речевого коктейля” путем одновременного произнесения разных слов диктором-мужчиной и диктором-женщиной. Средняя частота основного тона голоса (ЧОТ) у диктора-мужчины составляла 108±5.92 Гц, у диктора-женщины – 185±12.03 Гц. Оба диктора являлись нормативными носителями русского языка. Цифровые реализации записей выравнивали по интенсивности и микшировали, чтобы суммарный тестовый стимул представлял собой смесь слов, произнесенных мужским (М) и женским (Ж) голосом, с синхронизацией времени начала их звучания. Тестовые речевые сигналы предъявляли через наушники или через динамик, расположенный перед аудитором на расстоянии 50 см. Сравнивали показатели времени реакции и числа правильных распознаваний слов целевого диктора (М или Ж) у четырех групп испытуемых разного возраста и слухоречевого статуса: взрослые испытуемые с нормой слуха и речи (n=35) и с нарушениями слуха (n=26); школьники с нормотипичным развитием (n=26) и с нарушениями речи (n=25). Результаты свидетельствовали об ухудшении способности выделять целевые речевые потоки в условиях голосовой конкуренции при нарушениях слуха и речи, включенных в сравнительное исследование. У испытуемых с тугоухостью и с речевыми проблемами выявлены различия в восприятии мужского и женского голоса, которые могут иметь биологическую и социальную основу. Результаты имеют практическое значение для развития системы слухоречевых тренировок и современных технологий слухопротезирования. Ключевые слова: голосовая конкуренция, распознавание речевых сигналов, речевой коктейль, гендерные различия голоса, тугоухость, нарушения речи, слухоречевая тренировка

Сенсорные системы, 37, № 41, с. 342-347 (2023) | Рубрики: 13.05 13.06

 

Савенко И.В., Гарбарук Е.С., Бобошко М.Ю. «Психоакустическое тестирование для оценки функционального созревания центральных отделов слуховой системы» Сенсорные системы, 37, № 41, с. 348-362 (2023)

Адекватное возрасту морфофункциональное формирование центральных отделов слуховой системы определяет нормальную траекторию слухоречевого развития ребенка. Ее нарушение может приводить к возникновению центральных слуховых расстройств (ЦСР) и ассоциированных с ними проблем психоречевого и общего развития. Достаточно информативным и наиболее доступным диагностическим инструментом для выявления признаков ЦСР, в том числе в детской практике, может быть психоакустическое тестирование, выполнение которого возможно, начиная с возраста 4 лет, при наличии нормативных данных для различных возрастных групп. Цель исследования – аудиологическая оценка функционального состояния центральных отделов слуховой системы с использованием психоакустических методов у здоровых детей различного возраста. Материалы и методы. Обследованы 125 здоровых доношенных детей в возрасте от четырех до 17 лет с нормальной периферической слуховой функцией без слухоречевых, языковых, когнитивных и академических проблем. Дети были разделены на пять возрастных групп: 4–5 лет 11 мес; 6–7 лет 11 мес; 8–9 лет 11 мес; 10–11 лет 11 мес; 12 лет и старше. Наряду с традиционным аудиологическим обследованием всем детям проводили тесты по оценке функционального состояния центральных отделов слухового анализатора: исследование восприятия ритмических последовательностей стимулов; тест обнаружения паузы (Random Gap Detection Test, RGDT); монауральное низко избыточное речевое тестирование в тишине и на фоне шумовой помехи; тест бинаурального взаимодействия в формате чередующейся бинаурально речи; дихотическое тестирование; тестирование с применением упрощенной версии русского матриксного фразового теста в шуме (RUMatrix). Результаты. На основании сведений о чувствительности используемых тестов к функциональному состоянию различных структур центрального звена слуховой системы были продемонстрированы признаки их созревания в направлении “снизу-вверх” по мере взросления. Темп эволюционных процессов, который оценивался по результатам соответствующих тестов, зависел от возрастной группы испытуемых. Показано, что морфофункциональное развитие центрального отдела слуховой системы не завершается к подростковому возрасту. Выводы. Полученные результаты могут быть использованы для проведения дифференциальной диагностики между незрелостью центральной слуховой системы, ЦСР и слухоречевыми нарушениями иной природы у детей различных возрастных групп. Ключевые слова: центральная слуховая обработка, дети, созревание слуховых центров, центральные слуховые расстройства, временной слуховой анализ, речевые тесты

Сенсорные системы, 37, № 41, с. 348-362 (2023) | Рубрики: 13.05 13.06

 

Тунян Н.Т., Бычкова Е.В. «Трудности кохлеарной имплантации при пороках развития внутреннего уха» Сенсорные системы, 37, № 41, с. 363-368 (2023)

По данным различных авторов, у 20% детей с сенсоневральной тугоухостью или глухотой по результатам компьютерной томографии определяются аномалии строения височных костей. Кохлеарная имплантация при наличии кохлеовестибулярных аномалий сопряжена с рядом трудностей. К ним относятся особенности выполнения кохлеостомии и размещения электрода внутри улитки, риск повреждения лицевого нерва из-за его аномального расположения и его аберрантная стимуляция в послеоперационном периоде, интраоперационная ликворея, что может привести к развитию бактериального менингита в послеоперационном периоде, а также опасность проникновения электрода во внутренний слуховой проход. В данной работе представлен наш способ выполнения кохлеарной имплантации при аномалии развития внутреннего уха – общей полости. Способ расширяет возможности кохлеарной имплантации для восстановления слухового восприятия у пациентов с данной патологией. Ключевые слова: кохлеарная имплантация, аномалии внутреннего уха, общая полость, кохлеостома

Сенсорные системы, 37, № 41, с. 363-368 (2023) | Рубрики: 13.05 13.06