Российский фонд
фундаментальных
исследований

Физический факультет
МГУ им. М.В.Ломоносова
 

13.05 Речеобразование и восприятие речи

 

Якимук А.Ю., Конев А.А. «Применение программных средств в задаче обучения вокальному мастерству» XXXII сессия Российского акустического общества, 14–18 октября 2019 г., Москва, с. 68 (2019). 106 с.

При обучении студентов в музыкальных школах по курсу вокальное мастерство чаще всего используется сольфеджио (пение по нотам). Из-за того, что у студентов еще не сформирован развитый музыкальный слух, затруднительно оценить с точки зрения правильности исполненную ноту. Особенно эта проблема заметна, если необходимо определить степень отклонения от идеального звучания ноты. Данная работа посвящена разработке алгоритмов сегментации и идентификации нот максимально приближенных к принципу действия человеческого уха. Ключевые слова: распознавание нот, частота основного тона, сегментация

XXXII сессия Российского акустического общества, 14–18 октября 2019 г., Москва, с. 68 (2019). 106 с. | Рубрики: 11.08 13.05

 

Крейчи С.А., Кедрова Г.Е. «Интерференция тюркоязычных фонетических систем при изучении русского языка» XXXII сессия Российского акустического общества, 14–18 октября 2019 г., Москва, с. 24 (2019). 106 с.

Интерференция фонетических систем разных языков часто является существенным препятствием для безакцентного произношения при изучении иностранного языка. В данной работе исследовалось влияние фонетической организации устной речи носителей тюркских языков на произношение звуков и реализацию интонации в русской речи тюркоязычных студентов, изучающих русский язык как иностранный. В качестве звукового материала использовались записи чтения сбалансированного словаря из 1,5 тысяч наиболее часто употребляемых русских слов, чтение анкетных вопросов и спонтанных ответов на них, находящиеся в базе данных звучащей русской речи, разработанной в лаборатории фонетики и речевой коммуникации филологического факультета МГУ им. М.В. Ломоносова. Анализ отклонений от русской произносительной нормы проводился как на сегментном, так и на супрасегментном уровне. В качестве образца для сравнения использовался аналогичный звуковой материал, начитанный носителями русского языка с нормативным литературным произношением. Выделены основные акустические и артикуляторные признаки интерференции при произнесении отдельных звуков русской речи и их сочетаний, а также отличительные особенности просодической реализации русской синтагмы под влиянием эквивалентных высказываний на родном языке у носителей тюркских языков. Ключевые слова: тюркоязычный, интерференция, фонетические системы, безакцентный, спонтанная речь, артикуляторные признаки, просодическая реализация, синтагма.

XXXII сессия Российского акустического общества, 14–18 октября 2019 г., Москва, с. 24 (2019). 106 с. | Рубрика: 13.05

 

Бобров Н.В. «Новые вычислительные методы выделения качественных акустико-фонетических характеристик речевых сегментов» XXXII сессия Российского акустического общества, 14–18 октября 2019 г., Москва, с. 24-25 (2019). 106 с.

Освещаются технологические аспекты получения информации о фонетическом качестве речевых сегментов путём автоматического анализа акустического сигнала во временной области. Некоторые акустико-фонетические признаки (такие, например, как вокальность, резкость, прерванность) определяются таким образом достаточно легко, и соответствующие алгоритмы давно и широко известны; другие же (назальность, бемольность, диезность и т.п.) традиционно считаются измеримыми только с использованием того или иного вида спектрального анализа. В настоящем исследовании предпринимается попытка показать, что, по крайней мере, качественные оценки многих из признаков последней группы можно получить непосредственно из осциллограммы звукового давления (а именно – из анализа взаимного расположения её экстремумов различной магнитуды), не прибегая к ресурсоёмким вычислительным методам, что открывает ряд новых возможностей как для автоматического распознавания речи, так и для решения других прикладных задач, требующих получения максимального количества информации о речевом сообщении при ограниченных вычислительных ресурсах. Ключевые слова: акустическая фонетика, автоматическое распознавание речи, вычислительные методы, анализ временной области, оптимизация

XXXII сессия Российского акустического общества, 14–18 октября 2019 г., Москва, с. 24-25 (2019). 106 с. | Рубрика: 13.05

 

Римская-Корсакова Л.К., Нечаев Д.И. «Обнаружение громкости и распознавание интенсивности импульса, предъявляемого до или после периодической последовательности импульсов помехи» XXXII сессия Российского акустического общества, 14–18 октября 2019 г., Москва, с. 26-27 (2019). 106 с.

В интересах поиска причин снижение разборчивости речи изучали обнаружение моделей фонем согласных звуков, предъявляемых до или после последовательностей помеховых фонем с разными периодами следования. За модели тестовых и помеховых фонем принимали узкополосные импульсы с частотой 4 кГц. Интенсивность помеховых импульсов была равна 80 дБ УЗД, число импульсов помехи – 11, а период следования Т варьировали от 20 до 110 мс. Если интенсивность тестового импульса (ТИ) была заметно меньше интенсивности импульсов помехи, то слушатель мог обнаружить ТИ на основании его громкости. При близости интенсивностей ТИ и импульсов помехи слушатель мог обнаружить ТИ, распознавая интенсивности тестового и помехового импульсов. Зависимости процента правильного обнаружения ТИ от его интенсивности при разных периодах Т были получены у слушателей с нормальным слухом и сенсоневральными потерями. Зависимость обнаружения ТИ от периода следования импульсов помехи выявляли: (1) порог временного разрешения (Tmin), равный минимальному периоду Т, при котором слушатель мог обнаружить ТИ; (2) сдвиг (dIso) порога обнаружения ТИ, предъявляемого до или после помехи, относительного порога обнаружения одиночного импульса; (3) смещение (dI-) пороговой разности между интенсивностями ТИ и помехового импульса относительно разностного порога распознавания интенсивности одиночного помехового импульса. Смещение dI- оценивали для случая, когда интенсивность ТИ была меньше интенсивности импульсов помехи. Пороги Tmin разных слушателей варьировали от 20 до 110 мс, а сдвиги dIso и смещения dI- при периоде Т близком к Tmin могли достигать 20 дБ. Показатели Tmin, dIso, dI- сопоставляли со слуховой чувствительностью, со свойствами временной суммации тонов и последовательностей импульсов. Показатели Tmin, dIso, dI- указывали на мешающие обнаружению ТИ известные слуховые эффекты. Если интенсивность помеховых импульсов заметно превышала интенсивность ТИ, то обнаружению могли мешать временная маскировка и частичная маскировка громкости ТИ. Если интенсивность ТИ почти соответствовала, но была меньше интенсивности помехового импульса, то обнаружению мог мешать возникающий при временной маскировке слуховой эффект повышения громкости ТИ. В зависимости от положения ТИ относительно помехи такие эффекты компенсировали или усиливали действие друг друга. Согласно полученных результатов, к снижению разборчивости быстрой речи могли приводить как снижение громкости фонем согласных звуков, так и уменьшение диапазона интенсивностей фонем, в котором слушатель был способен их обнаружить. Ключевые слова: слуховое обнаружение, распознавание интенсивности, маскировка, повышение громкости импульсов при маскировке, модель фонемы согласного звука

XXXII сессия Российского акустического общества, 14–18 октября 2019 г., Москва, с. 26-27 (2019). 106 с. | Рубрики: 13.05 13.06

 

Фролова О.В. «Акустические и перцептивные характеристики речи детей дошкольного возраста с умственной отсталостью» XXXII сессия Российского акустического общества, 14–18 октября 2019 г., Москва, с. 26 (2019). 106 с.

Цель исследования – выявить особенности акустических и перцептивных характеристик речи детей с диагнозами: умственная отсталость лёгкой степени (УО) и смешанные специфические расстройства психологического развития (СР), по сравнению с типично развивающимися (ТР) детьми. Участники исследования – дети 5–7 лет: 10 детей с УО, 20 детей с СР, 5 ТР детей, воспитывающихся в детском доме; 10 детей с СР, 20 ТР детей, растущих в условиях семьи. Использована комплексная методика, разработанная в группе по изучению детской речи СПбГУ: произведена аудиозапись речи, видеозапись поведения детей при взаимодействии с взрослым. Проведён фонетический (SAMPA), пецептивный (163 носителя русского языка), спектрографический анализ речи детей («Cool Edit Pro»). Установлено, что для всех детей характерно присутствие в словах несформированных согласных /r/, /tS/, /S/, ротацизм (замена /r/ ненормативным для русского языка увулярным дрожащим /R/); частота употребления постальвеолярных согласных у детей с УО ниже, чем у ТР детей и детей с СР. Вероятность распознавания взрослыми лексического значения слов детей с УО значимо ниже, чем вероятность распознавания лексического значения слов ТР детей и детей с СР, воспитывающихся в условиях семьи. На основании данных акустического спектрографического анализа установлено, что значения длительности и частоты основного тона (ЧОТ) ударных гласных в словах детей с УО выше, чем значения длительности и ЧОТ ударных гласных в словах ТР детей и детей с СР. Диапазон ЧОТ ударных гласных в словах детей с УО и детей с СР, воспитывающихся в детском доме, выше, чем у детей, воспитывающихся в условиях семьи и ТР детей из детского дома. Формантный треугольник ударных кардинальных гласных из слов детей с УО смещён в высокочастотную область двухформантной плоскости по значениям первой форманты относительно формантных треугольников ударных гласных из слов детей других групп. Значение индекса артикуляции ударных гласных (ИАГ) в словах детей с УО минимальны по сравнению с ИАГ детей с СР и ТР детей. Ключевые слова: акустические характеристики, перцептивный анализ, речь детей, умственная отсталость, смешанные специфические расстройства психологического развития

XXXII сессия Российского акустического общества, 14–18 октября 2019 г., Москва, с. 26 (2019). 106 с. | Рубрика: 13.05

 

Городный В.А., Ляксо Е.Е. «Временные и частотные характеристики речи детей 6–7 лет с синдромом Дауна» XXXII сессия Российского акустического общества, 14–18 октября 2019 г., Москва, с. 26-27 (2019). 106 с.

Исследования акустических характеристик речи детей с синдромом Дауна широко представлены на материале разных языков, однако для русского языка подобные исследования единичны. Цель исследования – сравнительный анализ временных и частотных характеристик речи детей с синдромом Дауна. В исследовании участвовало 20 детей 6-7 лет: с синдромом Дауна (СД, n=10) и типично развивающиеся (ТР, n=10). Запись речевого материала детей проведена по методике, разработанной в Группе по изучению детской речи СПбГУ (Ляксо и др., 2012). Спектрографический анализ осуществлен в звуковом редакторе «Cool Edit Pro 2.0». Из записей речи детей выделены слова. Для слов и гласных из слов детей определены длительность, значения частоты основного тона (ЧОТ), вычислен диапазон ЧОТ. На стационарном участке гласного считали значения ЧОТ, значения двух первых формантных частот (F1, F2). На двухформантной плоскости построены формантные треугольники ударных и безударных гласных /a/, /i/, /u/ из слов детей, определены значения их площадей (Ляксо, Григорьев, 2013). Вычислены значения индекса артикуляции ударных и безударных гласных (VAI) (Roy et al., 2009). Статистический анализ данных проведен в программе “Statistica.10”. Обнаружено, что длительности слов и гласных из слов детей с СД значимо выше, по сравнению с ТР детьми. Значения ЧОТ слов и ударных гласных из слов детей с СД выше, чем у ТР сверстников. Формантные треугольники ударных и безударных гласных /a/, /i/ и /u/ из слов детей с СД и ТР детей различаются по форме и ориентации. Значения F1 для ударного гласного /i/ и F1 для безударных гласных /a/ и /i/ из речи детей с СД смещены в высокочастотную область. Значения площади формантного треугольника безударных гласных значимо выше у детей с СД, по сравнению с ТР детьми. Для детей с СД характерны низкие значения VAI ударных гласных. Таким образом, в исследовании получены данные об акустических характеристиках речи детей с синдромом Дауна и определены различия между детьми с СД и типично развивающимися детьми. Ключевые слова: детская речь, спектрографический анализ, синдром Дауна, индекс артикуляции

XXXII сессия Российского акустического общества, 14–18 октября 2019 г., Москва, с. 26-27 (2019). 106 с. | Рубрика: 13.05

 

Куражова А.В. «Становление речи детей-близнецов 4–6 лет: акустический аспект» XXXII сессия Российского акустического общества, 14–18 октября 2019 г., Москва, с. 27 (2019). 106 с.

Работа выполнена в рамках исследований речи русскоязычных детей с типичным и атипичным развитием, проводимых группой по изучению детской речи СПбГУ (Ляксо, Фролова, 2018). Близнецы, относимые к группе риска в связи с действием факторов пренатального, раннего постнатального развития, характеризуются спецификой речевого развития по сравнению с нормально развивающимися одиночно рожденными детьми. Акустические особенности речи детей-близнецов изучены недостаточно. Цель исследования – проследить формирование акустического аспекта речи детей-близнецов в период с 4 до 6 лет, сравнить уровень речевого развития первого и второго по порядку рождения ребенка в паре. В исследовании принимали участие 10 дизиготных близнецов в возрасте от 4 до 6 лет. Проводили аудиозапись и видеосъемку речевого поведения детей в заданных ситуациях при взаимодействии с матерью. Оценивали уровень речевого развития близнецов, используя методы перцептивного, фонетического и инструментального спектрографического анализа. С возрастом детей увеличивается количество слов, достоверно распознаваемых аудиторами, и к шестилетнему возрасту составляет 60%. В период с 4 до 6 лет растет количество звуков, четко произносимых как первыми, так и вторыми детьми, но и в шестилетнем возрасте сохраняются артикуляционные ошибки – пропуски и замены согласных в словах. Значения частоты основного тона (ЧОТ) гласных из слов первых по порядку рождения детей снижаются с увеличением их возраста, в словах вторых детей значимо не изменяются; значения ЧОТ гласных в словах первых по порядку рождения детей значимо ниже, чем в словах вторых детей. Формантные частоты ударных гласных из слов близнецов имеют высокие значения. Длительность гласных и их стационарных участков уменьшается в период с 4 до 6 лет и значимо не различается в словах первых и вторых детей. Наблюдаемая динамика акустических характеристик речи дизиготных близнецов согласуется с данными по одиночно рожденным детям. Однако, выявлены различия между первыми и вторыми по порядку рождения близнецами в паре, которые заключаются в более низких значениях ЧОТ гласных в речи первых детей. Ключевые слова: речевое развитие, акустические характеристики, дети, близнецы

XXXII сессия Российского акустического общества, 14–18 октября 2019 г., Москва, с. 27 (2019). 106 с. | Рубрика: 13.05

 

Григорьев А.С., Ляксо Е.Е. «Акустические и перцептивные характеристики речи подростков 14–16 лет» XXXII сессия Российского акустического общества, 14–18 октября 2019 г., Москва, с. 27-28 (2019). 106 с.

На данный момент основное внимание исследователей сосредоточено на изучении формирования речи при атипичном различии детей (расстройства аутистического спектра, синдром Дауна и др.), однако для этих исследований очень важным является наличие данных о нормативном развитии речи при типичном развитии детей. Считается, что фонетическое освоение речи при типичном развитии заканчивается к 8 годам, но развитие речи в её тонких аспектах, включая акустические, продолжается до позднего подросткового возраста. Целью работы явилось изучение акустических и перцептивных характеристик речи подростков 14–16 лет. Осуществлена запись речи 60 типично развивающихся детей (по 10 мальчиков и 10 девочек для каждого возраста). В ходе перцептивного эксперимента определена возможность взрослых аудиторов, нейтральных по отношению к подростку, определять значение фразы, пол и возраст, а также эмоциональное состояние говорящего. Для его осуществления созданы тестовые последовательности, содержащие фразы детей разного возраста в различных эмоциональных состояниях (нейтральное, комфортное и дискомфортное). Описаны акустические характеристики фраз, отражающих разное эмоциональное состояние – длительность фразы, длительность пауз между фразами, значение частоты основного тона (ЧОТ) по фразе, его максимальное и минимальное значение, форма контура ЧОТ, длительность ударного слова, а также акустические характеристики ударных гласных – длительность гласного, длительность стационарного участка гласного, значения ЧОТ и трех первых формант гласного на стационарном участке, определены параметры отражающие четкость артикуляции гласных – индекс артикуляции и площади формантных треугольников. Полученные в работе сведения могут быть использованы в качестве нормативных при проведении исследований формирования речевой функции при атипичном развитии, а также расширяют представления о формировании голоса в период полового созревания при типичном развитии детей. Ключевые слова: детская речь, спектрографический анализ, перцептивный анализ, частота основного тона, форманты

XXXII сессия Российского акустического общества, 14–18 октября 2019 г., Москва, с. 27-28 (2019). 106 с. | Рубрика: 13.05

 

Ляксо Е.Е. «Акустические характеристики материнской речи, адресованной детям с РАС и синдромом Дауна» XXXII сессия Российского акустического общества, 14–18 октября 2019 г., Москва, с. 28 (2019). 106 с.

Проведено сравнение характеристик материнской речи (МР), обращенной к детям 4-7 лет типично развивающимся (ТР, n = 40), детям с расстройствами аутистического спектра (РАС, n=20) и детям с синдромом Дауна (СД, n=20). Показано, что значения частоты основного тона (ЧОТ) выше в речи матерей детей с РАС (p<0,0001 – критерий Манна–Уитни), чем у матерей ТР детей и детей с СД в высказывании, во фразе, слове, ударном гласном. Сравнительный анализ значений индекса артикуляции гласных (VAI) показал, что значения VAI ударных гласных в словах МР, обращенной к детям с СД, выше, чем значения VAI для МР обращенной к детям с РАС и ТР детям. Значения VAI безударных гласных значимо не различаются в словах МР, обращенной детям трех групп. Данные о значениях площадей формантных треугольников гласных и значениях VAI указывают на большую четкость артикуляции матерями слов, обращенных детям с нарушениями речи – РАС и СД, при более четкой МР, адресованной к детям с СД. Высказывания матерей детей с РАС более длинные (p<0,001), чем высказывания, обращенные ТР детям и детям с СД, содержат более короткие фразы (<0,005). Длительность слов и ударных гласных значимо не различаются при тенденции к большей длительности в речи матерей детей с РАС. В речи матерей детей с СД длительность пауз меду фразами в высказывании больше, чем в МР ТР детей; в речи матерей, обращенной детям с РАС паузы между высказываниями (p<0,005) и между словами (p<0,005) больше, чем в речи адресованной ТР детям. Таким образом, на основе инструментального анализа выявлены различия в характеристиках МР, обращенной к ТР детям и детям с атипичным развитием, установлены особенности характеристик МР, адресованной детям с РАС и детям с СД. Ключевые слова: материнская речь, акустические характеристики, дети с синдром Дауна, дети с расстройствами аутистического спектра

XXXII сессия Российского акустического общества, 14–18 октября 2019 г., Москва, с. 28 (2019). 106 с. | Рубрика: 13.05

 

Николаев А.С., Ляксо Е.Е. «Временные характеристики гласных из слов детей 5«1 лет с расстройствами аутистического спектра» XXXII сессия Российского акустического общества, 14–18 октября 2019 г., Москва, с. 28 (2019). 106 с.

Цель работы: изучение временных характеристик ударных и безударных гласных из слов детей с расстройствами аутистического спектра (РАС) по сравнению с типично развивающимися (ТР) детьми. Объект исследования: 10 детей с РАС в возрасте 5–11 лет и 10 ТР детей того же возраста (контрольная группа). Дети с РАС поделены на две группы по уровню их речевого развития: РАС-А, в которую вошли дети с более высоким уровнем речевого развития, и РАС-Б, в которую вошли дети с более низким уровнем речевого развития. Использованы методы перцептивного и акустического анализа. Перцептивный эксперимент, в котором приняли участие 116 взрослых носителей русского языка (аудиторов), проводили с целью выявления слов детей, распознанных взрослыми с высокой (значение слова верно определено в более чем 75% ответов) и низкой (значение слова определено верно в менее чем 25% ответов) вероятностью. В словах, распознанных с высокой и низкой вероятностью, определяли длительность ударных и безударных (первого предударного и первого заударного) гласных. У детей всех групп детей длительность (медиана) ударных гласных в словах, распознанных с низкой вероятностью, больше, чем в словах, распознанных с высокой вероятностью. Выявлены различия между детьми с РАС и ТР детьми по длительности ударных и безударных гласных в словах, значение которых определено с высокой и низкой вероятностью. Слова детей с РАС обеих групп характеризуются большей по сравнению с ТР детьми длительностью ударных и безударных гласных. Слова ТР детей 8–11 дет характеризуются наименьшей длительностью ударных и безударных гласных. В словах, распознанных с высокой вероятностью, длительность ударных гласных у детей группы РАС-Б больше (p<0,05), чем у детей группы РАС-А и ТР детей, длительность безударных гласных – больше, чем у ТР детей. В словах, распознанных с низкой вероятностью, длительность ударных и безударных гласных у детей с РАС больше (p<0,05), чем у ТР детей. Ключевые слова: восприятие речи, расстройства аутистического спектра, детская речь, акустический анализ

XXXII сессия Российского акустического общества, 14–18 октября 2019 г., Москва, с. 28 (2019). 106 с. | Рубрика: 13.05

 

Гутова С.Ю. «≈700 Гц в русской аутентичной певческой фонации» XXXII сессия Российского акустического общества, 14–18 октября 2019 г., Москва, с. 67-68 (2019). 106 с.

Приведены данные по экспериментальному измерению акустического сигнала вокальной речи русских этнопевцов методом слоговой артикуляции. В исследовании участвовали три группы исполнителей – традиционные певцы из различных регионов России, профессиональные и полупрофессиональные исполнители, работающие в фольклоризированной манере, и ученики автора. Для объективности анализировались 12 образцов фольклорных песен, исполненных аутентичными певцами и «перепетых» фольклоризированными исполнителями. Установлено, что в аутентичном голосе обнаруживается устойчивое присутствие частоты колебания в ≈700 Гц (это 698,46 Гц – по таблице А. Веркмейстера, 700 Гц или немного выше). Есть основания полагать, что данная частота, являющаяся первой гармоникой к основному тону f в данном случае первой октавы и находящаяся на стыке низкой и средней певческих формант, имеет важное значение для обертоново-резонансного раскрашивания русского традиционного этнозвука. Выявлено, что ≈700 Гц: проявляются на ноте f независимо от октавного расположения и всегда динамически активнее других гармоник; присущи рече-певческой позиции, т.е. диалектной вокальной речи; влияют на эстетические качества певческого звука. На ≈700 Гц: выстраиваются обертоны натурального звукоряда, а также образуются специфические обертоны, которые проявляются при особых акустических условиях на длинных звуках-интонемах; усиливается резонансное свойство звука; межформантные области более плотные и насыщены гармониками. В фольклоризированном голосе эта частота присутствует только в 40% случаев, а в аутентичном – 90%. Эксперимент с усилением частоты ≈700 Гц на учащихся показал возможность обучения по методике гармонического усиления для улучшения вокального звука. Исходя из данных эксперимента и трудов других исследователей следует, что ≈700 Гц связаны с биофизическими свойствами рече-дыхательной системы, а значит, данная частота является природным акустическим механизмом. Ключевые слова: аутентичный тембр, темброинтонирование, русское обертоновое пение, ≈700 Гц.

XXXII сессия Российского акустического общества, 14–18 октября 2019 г., Москва, с. 67-68 (2019). 106 с. | Рубрика: 13.05

 

Миронов Н.А. «Моделирование реальных условий выделения речевого сообщения из голосовой смеси» Радиотехника, № 6, с. 81-86 (2019)

Постановка проблемы. Работа посвящена актуальной проблеме выделения одного речевого сообщения из голосовой смеси, более известной как «the Cocktail Party Problem». Современные решения в данной области связаны с применением массива микрофонов для выделения речи определенного человека. Особую ценность представляют исследования по выделению речи в условиях, максимально приближенных к реальным. Цель. Исследовать устойчивость работы алгоритма обработки речевого сигнала микрофонной решеткой в реальных условиях. Алгоритм заключается во введении временных задержек, зависящих от пространственных координат полезного источника, в каждый канал обработки сигналов и дальнейшем определении оптимального весового вектора микрофонной решетки. Результаты. В реальных условиях звук многократно отражается, поэтому при проведении расчетов был учтен эффект реверберации. Энергия речевого сообщения полезного сигнала может значительно отличаться от энергии сигнала помехи, поэтому была проанализирована работа алгоритма по выделению «тихого» голоса. При разговоре человек может перемещаться в пространстве, поэтому был проведен эксперимент по выделению голоса движущегося диктора. В ходе исследования доказано, что предложенный алгоритм устойчив к эффекту реверберации звука. Определен минимально возможный уровень полезного сигнала по отношению к уровню сигналов источников помех (–20,5 Дб), при котором сохраняется удовлетворительный уровень разборчивости речи. При использовании информации о траектории движения диктора от независимых каналов определения местоположения удалось выделить голос движущегося источника из помех с уровнем словесной разборчивости в 93,23%. Практическая значимость. Результаты данной работы могут быть полезны специалистам, занимающимся разработкой акустических систем наблюдения и обеспечением безопасности в местах массового скопления граждан.

Радиотехника, № 6, с. 81-86 (2019) | Рубрика: 13.05

 

Канаков В.А., Миронов Н.А. «Выбор наилучшей конфигурации микрофонной решетки для выделения речевых сообщений из помех» Радиотехника, № 8, с. 13-19 (2019)

Постановка проблемы. Работа посвящена актуальной проблеме обеспечения безопасности в местах массового скопления людей. В настоящее время большое число исследований направлено на разработку систем акустического мониторинга, которые позволяют выделять речевые сообщения из различных точек пространства наблюдения. Задачи по выделению голоса определенного человека на фоне большого числа речевых помех от сторонних источников решаются применением микрофонных решеток. Геометрия микрофонных решеток очень многообразна и задача об оптимальной конфигурации решетки в общем виде не решена. Цель. Сравнить эффективность выделения голоса одного человека из смеси голосов четырех разных людей тремя различными конфигурациями многопозиционных систем из десяти ненаправленных микрофонов. Результаты. В первой конфигурации микрофоны размещены по одной стороне пространства наблюдения, во второй размещение угловое, а в третьей конфигурации размещение микрофонов происходит по периметру пространства наблюдения. Критериями качества являются объективная оценка разборчивости и отношение сигнал/помеха выделенного из смеси голосов речевого фрагмента полезного источника. Представлены результаты расчета для двух различных взаимных расположений полезного источника и источников помех. В ходе исследования доказано, что наилучшей из рассмотренных конфигураций для выделения речевых сообщений из сторонних распределенных в пространстве речевых помех для ограниченного пространства является конфигурация с размещением микрофонов по периметру помещения. Практическая значимость. Результаты данной работы могут быть полезны специалистам, занимающимся разработкой акустических систем наблюдения.

Радиотехника, № 8, с. 13-19 (2019) | Рубрика: 13.05

 

Шкловский В.М., Варламов С.А., Петрушевский А.Г., Майорова Л.А. «ФМРТ-корреляты категоризации звуков речевой и неречевой природы в слуховой коре» Физиология человека, 45, № 6, с. 5-15 (2019)

Изучается функциональная структура слуховой коры путем выявления и сопоставления пространственной локализации зон активации (по данным фМРТ) в ответ на речевые и неречевые стимулы. Помимо этого, было проведено аналогичное сопоставление зон активации в ответ на мужской и женский голос. Было обнаружено, что имеются специфические речевая, неречевая и перекрывающаяся зоны, причем речевая имеет значительные размеры относительно других. Перекрывание зон активации при прослушивании мужского и женского голоса имеет место, но не значительно, при этом влияние женского голоса оказалось значительно сильнее. Данные результаты свидетельствуют о наличии особых зон слуховой коры, предназначенных для специализированной обработки звукового сигнала.

Физиология человека, 45, № 6, с. 5-15 (2019) | Рубрики: 13.05 13.06