Российский фонд
фундаментальных
исследований

Физический факультет
МГУ им. М.В.Ломоносова
 

13.05 Речеобразование и восприятие речи

 

Ржевкин С.Н. Слух и речь в свете современных физических исследований (1928). 146 с.

Слух и речь в свете современных физических исследований (1928). 146 с. | Рубрики: 02 13.05 13.06

 

Ржевкин С.Н. Слух и речь в свете современных физических исследований. 2-е изд., перераб. и доп. (1936). 311 с.

Слух и речь в свете современных физических исследований. 2-е изд., перераб. и доп. (1936). 311 с. | Рубрики: 02 13.05 13.06

 

Колоколов А.С., Любинский И.А. «Сравнительное исследование нескольких способов кратковременного частотного анализа речевого сигнала» Автоматика и телемеханика, № 10, с. 144-151 (2015)

Исследована зависимость частотно-временного представления речевого сигнала от выбранного способа частотного анализа. Рассмотрены динамические спектрограммы, получаемые с помощью набора полосовых фильтров с различными параметрами и различным порядком расположения по частотной оси. Показано, что при использовании набора фильтров с параметрами, близкими к фильтрам слухового анализатора, информация о гласных и согласных звуках речи более равномерно распределена по шкале частот, кроме того, спектральные максимумы, связанные с первой и второй формантами гласного, выражены более четко, что весьма существенно при распознавании речи.

Автоматика и телемеханика, № 10, с. 144-151 (2015) | Рубрика: 13.05

 

Сорокин В.Н., Файн В.С. «Признаки звонких взрывных» Автоматика и телемеханика, № 10, с. 186-189 (1970)

Рассматривается методика выделения признаков согласных звуков на основе вычисления параметров непрерывных преобразований видеограмм к эталону.

Автоматика и телемеханика, № 10, с. 186-189 (1970) | Рубрики: 13.05 13.06

 

Алимурадов А.К. «Алгоритм помехоустойчивой обработки речевых команд для систем голосового управления» Измерение. Мониторинг. Управление. Контроль, № 1, с. 88-94 (2017)

Актуальность и цели. Повседневный ритм окружающей среды требует от систем голосового управления (СГУ) возможности функционировать в условиях интенсивных помех. Из-за шумов разница между зарегистрированными речевыми командами и шаблонами (полученными в процессе обучения системы) возрастает, а эффективность СГУ стремительно ухудшается. По этой причине актуальным является повышение помехоустойчивости СГУ. Материалы и методы. Для реализации помехоустойчивой обработки предложена модификация классической декомпозиции на эмпирические моды (ДЭМ) – комплементарная множественная ДЭМ. Для проведения исследований использовался пакет прикладных программ решения технических задач – МАТLАВ. Результаты. Представлен краткий обзор существующих алгоритмов помехоустойчивой обработки. На основе метода комплементарной множественной ДЭМ разработан алгоритм помехоустойчивой обработки речевых команд для СГУ. Проведены исследования предложенного алгоритма, результаты которых подтверждают повышение помехоустойчивости в широком диапазоне помех (от 20 до –5 дБ) в среднем на 3,1%. Выводы. В соответствии с результатами исследований предложенный алгоритм помехоустойчивой обработки речевых команд рекомендуется для практического применения в СГУ, функционирующих в условиях интенсивных помех.

Измерение. Мониторинг. Управление. Контроль, № 1, с. 88-94 (2017) | Рубрика: 13.05

 

Карпухин И.А., Конушин А.С. «Построение речевого аудиовидеокорпуса путем выравнивания длинных сегментов речи и текста» Вестник Московского университета. Серия 15: Вычислительная математика и кибернетика, № 2, с. 46-52 (2017)

Предлагается новый алгоритм выравнивания текста и речевого аудиосигнала длиной до нескольких часов. Алгоритм допускает эффективную оценку качества. При этом выдвигаются невысокие требования к используемой акустической модели. Алгоритм был применен к созданию обучающего аудиовидеокорпуса русского языка.

Вестник Московского университета. Серия 15: Вычислительная математика и кибернетика, № 2, с. 46-52 (2017) | Рубрика: 13.05

 

Римская-Корсакова Л.К. «Проявления периферического кодирования в эффекте повышения громкости и особенностях распознавания интенсивности импульсов, предъявляемых до и после импульсных помех» Акустический журнал, 63, № 4, с. 436-448 (2017)

Для нахождения возможных причин среднеуровневого повышения громкости импульсов и увеличения отношения Вебера во время распознавания интенсивности импульсов при маскировке проведено сравнение комплементарных распределений спайковой активности ансамбля волокон слухового нерва, таких как распределение моментов появления спайков во времени, распределение межспайковых интервалов, автокорреляционная функция. Свойства распределений обнаруживались в постстимульной гистограмме, гистограмме распределения межспайковых интервалов и автокорреляционной гистограмме, полученных из реакции ансамбля модельных волокон слухового нерва в ответ на одно предъявление звукового комплекса “импульсная помеха–полезный импульс”. Были использованы две конфигурации комплексов: в одной варьировали пиковую амплитуду импульса и фиксировали амплитуду помехи, в другой фиксировали амплитуду импульса и варьировали амплитуду помехи. Помеха могла опережать импульс или следовать за ним. Длительности помехи и импульса, а также интервал между ними составляли соответственно 10, 10 и 50 мс. Центральные частоты помехи и импульса были равны 4 кГц и соответствовали характеристическим частотам модельных волокон. Профили всех вычисленных гистограмм имели по два максимума. Величины и положение максимумов на постстимульной гистограмме соответствовали амплитудам и взаимному временному положению помехи и импульса. Максимум, возникший в ответ на действие импульса, мог быть основой для формирования громкости последнего (“явной громкости”). Однако положения максимумов на двух других гистограммах не зависели от положений импульсов и помех в комплексах. Первый максимум приходился на короткие интервалы и объединял интервалы, соответствующие длительностям помехи и импульса. Второй максимум приходился на интервалы, соответствующие задержке импульса относительно помехи, его величина была пропорциональной той амплитуде помехи или импульса, которая в комплексе была наименьшей. Увеличение амплитуд импульсов или помех вызывали нелинейные изменения двух максимумов и отношения между ними. Величина первого максимума в распределении межспайковых интервалов могла быть основой для формирования громкости замаскированного импульса (“неявной громкости”), а величина второго максимума – основой для формирования выраженности (силы) высоты периодичности комплекса. Слуховой эффект среднеуровневого повышения громкости импульса мог быть обусловлен изменениями неявной громкости импульса, вызванными изменениями интенсивности импульсов или помех. Причиной увеличения отношения Вебера могло быть конкурентное взаимодействие таких субъективных качеств, как явная и неявная громкости импульса, сила высоты периодичности комплекса. DOI: 10.7868/S032079191704013X

Акустический журнал, 63, № 4, с. 436-448 (2017) | Рубрики: 13.05 12.05

 

Куликов Г.А., Андреева Н.Г. «Довербальный период развития речи» Сенсорные системы, 18, № 2, с. 101-110 (2004)

Приводится краткий обзор данных о значимости довербальных вокализаций младенцев в развитии речи. Изложены сведения о стадиях формирования довербальных вокализаций и существующих представлениях об их функциональной роли. Особое внимание уделено взаимодействию врожденных и приобретенных (средовых) факторов в становлении специфических особенностей языкового окружения в довербальных вокализациях. На основе результатов исследования детей с нарушением слуха рассмотрены вопросы о значимости обратной акустической связи и такой формы обучения как имитация в освоении речевых элементов родного языка. Показано, что при высоких значениях частоты основного тона, характерных для довербальных вокализаций, величины двух первых формант гласноподобных звуков не могут являться значимыми признаками для их идентификации. Продемонстрирована возможность разделения гласноподобных звуков на соответствующие категории на основе взаимосвязи частотных и амплитудных характеристик спектральных максимумов. Обосновывается представление о преемственности развития речи, начиная с ранних довербальных вокализаций.

Сенсорные системы, 18, № 2, с. 101-110 (2004) | Рубрики: 13.05 13.06

 

Ляксо Е.Е., Сильвен М.С.А., Шестакова А.Н. «Перцептивный, акустический и фонетический анализ вокализаций русских и финских младенцев второго полугодия жизни» Сенсорные системы, 18, № 2, с. 111-123 (2004)

Описаны разные типы звуков и звукосочетаний в вокальном репертуаре русских и финских младенцев 9 и 12-месячного возраста при их взаимодействии с мамами “лицом к лицу” и “чтение”. На основе спектрографического анализа и фонетического описания показано, что к концу первого года жизни ребенка происходит формирование гласных, специфичных для их родного языка, в репертуаре детей появляются согласные и наиболее употребляемые слоги. Выявлено различие во временной организации слогов русских и финских детей 12-месячного возраста. Показано, что аудиторы – носители языка с большей вероятностью распознают и наиболее четко описывают звуки младенцев одной с ними национальности. При описании младенческих звуков аудиторы используют признаки, релевантные для фонетической системы своего языка. На основе комплексного метода анализа вокализаций русских и финских детей доказано начало формирования звуковой специфичности к концу первого года жизни.

Сенсорные системы, 18, № 2, с. 111-123 (2004) | Рубрика: 13.05

 

Самокищук А.П. «Сравнительный анализ доречевых и ранних речевых звуков детей» Сенсорные системы, 18, № 2, с. 124-129 (2004)

Проведен фонетический и спектральный анализ звуков детей первых трех лет жизни. Полученные результаты согласуются с данными литературы (Kuhl, Meltzoff, 1996; Андреева и др., 1999; Андреева, 2001) о значительных отличиях по ряду спектральных характеристик гласноподобных вокализаций у младенцев от соответствующих звуков взрослых. В частности, в сравнении с гласными взрослой речи, различные гласноподобные не удается разделить по значениям формант. В исследовании рассматривается роль энергетических соотношений спектральных составляющих в фонетической оценке гласноподобных звуков. Отмечается сходство спектральных характеристик гласноподобных вокализаций и гласных, записанных из слов ребенка второго и третьего года жизни. Это можно рассматривать в качестве подтверждения точки зрения о преемственности раннего доречевого и речевого этапов.

Сенсорные системы, 18, № 2, с. 124-129 (2004) | Рубрика: 13.05

 

Янович С.В., Зайцев А.В., Лупандин В.И. «Спектральные характеристики гласных звуков глухих детей четырех лет» Сенсорные системы, 18, № 2, с. 130-137 (2004)

Проведен анализ спектральных характеристик гласных звуков нормально слышащих и глухих детей 4-х лет. Произношение гласных звуков глухими и нормально слышащими детьми различается: звуки глухих детей фонетически неоднородны, отмечены дисфонации, бифонации и гиперфонации. Установлено, что средние частоты основного тона у нормально слышащих и глухих детей не различаются, однако, вариативность частоты основного тона у глухих детей больше. Средние значения двух первых формант гласных звуков [а], [о] и [у] глухих детей достоверно отличаются от формант гласных слышащих детей. Показано, что на основе двух первых формант не происходит разделения гласных звуков ни у глухих, ни у нормально слышащих детей 4-х лет. Разделение гласных звуков улучшается при использовании частот спектральных максимумов и особенностей распределения относительных амплитуд спектральных составляющих

Сенсорные системы, 18, № 2, с. 130-137 (2004) | Рубрика: 13.05

 

Андреева Н.Г., Куликов Г.А. «Характеристика певческих гласных при разной частоте основного тона» Сенсорные системы, 18, № 2, с. 170-178 (2004)

Согласно установившимся представлениям, для определения категориальной принадлежности гласных основным признаком служит соотношение первых двух формант. Однако в зависимости от условий генерации гласных их характеристики могут значительно варьировать. В частности, упомянутые признаки, справедливые для устной речи взрослых, не могут быть распространены на речевые сигналы с высокой частотой основного тона – детскую и вокальную речь. На основании проведенных исследований показано, что по мере возрастания высотности звука у певческих гласных [а], [у], [и] выявляется различный характер изменения относительной амплитуды спектральных максимумов. В условиях психоакустического эксперимента подтверждена роль относительной амплитуды спектральных максимумов для идентификации кардинальных гласных с высокой частотой основного тона.

Сенсорные системы, 18, № 2, с. 170-178 (2004) | Рубрики: 13.05 13.06

 

Гранстрем М.П. «Исследование формирования слоговых последовательностей при изменении темпа речи» Сенсорные системы, 18, № 2, с. 179-186 (2004)

Исследовалось формирование ритмических слоговых последовательностей из открытых слогов, следующих друг за другом без пауз. В ряде последних работ по речевой ритмике (Martin, 1972; Cutler, 1986; Bailey et al, 1999; Hertrich, Ackermann, 1995) обсуждается роль ударных слогов для анализа структурной организации речевого потока. Цель настоящей работы – исследование процесса формирования ритмических последовательностей связанных ударных и безударных слогов в условиях изменения темпа речи и построение моделей таких последовательностей. В основу построения этих моделей были положены экспериментальные данные, полученные автором методом текущей имитации стимулов – длинных последовательностей синтетических открытых слогов с различным темпом. Анализ результатов позволил сделать выводы о возможных функциональных свойствах такого механизма, который обеспечивает формирование слоговых последовательностей, сохраняя ритмические соотношения между ударными и безударными слогами при изменениях темпа в широком диапазоне.

Сенсорные системы, 18, № 2, с. 179-186 (2004) | Рубрика: 13.05

 

Альтман Я.А., Вартанян И.А., Куликов Г.А. «Третья конференция, посвященная памяти чл.-корр. АН СССР Г.В. Гершуни “Физиология слуха и речи”» Сенсорные системы, 18, № 2, с. 99-100 (2004)

Сенсорные системы, 18, № 2, с. 99-100 (2004) | Рубрики: 03 13.05