Российский фонд
фундаментальных
исследований

Физический факультет
МГУ им. М.В.Ломоносова
 

13.05 Речеобразование и восприятие речи

 

Самойленко Н.А., Заец В.П. «Влияние звукоизоляции ограждающих конструкций на разборчивость речи» Техническая акустика, 13, № 1, http://www.ejta.org/ru/samijlenko1 (2013)

Приведены результаты исследования влияния звукоизоляции ограждающих конструкций на разборчивость речи. В условиях заглушенной камеры были воспроизведены элементы речи, предварительно обработанные фильтрами, которые моделируют звукоизоляцию ограждающих конструкций, с учетом действия разных источников фонового шума. Результаты артикуляционных испытаний сравниваются с результатами моделирования аналогичного процесса формантным и формантно-модуляционным методами. Исследование дает возможность оценить влияние звукоизоляции на разборчивость речи.

Техническая акустика, 13, № 1, http://www.ejta.org/ru/samijlenko1 (2013) | Рубрики: 10.08 13.05

 

Овчинников П.Е. «Секция. Радиофизические методы измерения и их компьютерное обеспечение. Сравнение методов параметризации речевых сигналов для задачи распознавания фонем» Труды X научной конференция по радиофизике, посвященная 90-летию ННГУ и 100-летию со дня рождения Г.С. Горелика. 5 мая 2006 г. / Ред. А.В. Якимов, с. 02 (2006)

Распознавание звуков – составная часть задачи распознавания речи. Эффективность распознавания существенно зависит от способа параметризации – выбора характеристик сигнала, поступающих на вход классификатора, поскольку в речевом сигнале кроме информации о фонемах содержится информация о голосе, интонации, среде распространения звука. Задача параметризации состоит в выделении значимой для распознавания фонем информации. Целью работы является выбор оптимального способа параметризации звукового сигнала для распознавания звуков при помощи нейронной сети. Сравнение различных процедур распознавания фонем, основанных на использовании искусственных нейронных сетей, показало, что эффективность распознавания звуков нейронной сетью зависит от способа параметризации речевого сигнала. Результаты сравнения эффективности распознавания согласуются с результатами кластеризации. Лучшие результаты распознавания фонем получены при использовании в качестве входных данных нейронной сети характеристик, вычисляемых на основе банка фильтров.

Труды X научной конференция по радиофизике, посвященная 90-летию ННГУ и 100-летию со дня рождения Г.С. Горелика. 5 мая 2006 г. / Ред. А.В. Якимов, с. 02 (2006) | Рубрика: 13.05

 

Савченко А.В. «Об одном подходе к разработке автоматизированной системы дистанционного обучения произношению слов на основе вероятностной нейронной сети с проверкой однородности» Нелинейная динамика в когнитивных исследованиях – 2013, Нижний Новгород, 24–27 сентября 2013 года. Труды III всероссийской конференции, с. 144-147 (2013)

Нелинейная динамика в когнитивных исследованиях – 2013, Нижний Новгород, 24–27 сентября 2013 года. Труды III всероссийской конференции, с. 144-147 (2013) | Рубрика: 13.05

 

Савченко Л.В., Акатьев Д.Ю. «Выделение признаков речевого сигнала на основе теории приближенных множеств в методе нечеткого фонетического декодирования слов» Нелинейная динамика в когнитивных исследованиях – 2013, Нижний Новгород, 24–27 сентября 2013 года. Труды III всероссийской конференции, с. 148-151 (2013)

Предложена модификация метода нечеткого фонетического декодирования слов (НФДС), основанного на теории нечетких множеств, учитывающая признаки согласных, которые были выделены с помощью алгоритма машинного обучения на основе приближенных множеств. Показано, что точность распознавания сонорных и звонких согласных достаточно велика и составляет 77% и 76% соответственно. Поэтому, выделение признаков может применяться для уточнения решения, полученного не только по методу НФДС, но и по методу фонетического декодирования слов (ФДС). Применение признаков позволяет сократить количество решений с одинаковыми степенями принадлежности на выходе алгоритма распознавания, за счет чего повышается точность распознавания. Так, точность распознавания для метода ФДС повысилась на 7%, а для метода НФДС – на 4%. Таким образом, предложен метод распознавания слов с выделенными признаками согласных, основанный на ранее предложенном методе НФДС, который имеет большую точность распознавания по сравнению с традиционным методом ФДС.

Нелинейная динамика в когнитивных исследованиях – 2013, Нижний Новгород, 24–27 сентября 2013 года. Труды III всероссийской конференции, с. 148-151 (2013) | Рубрика: 13.05

 

Пикунова Т.М. «Уменьшение краевых эффектов с помощью метода коррекции огибающих при модовой декомпозиции речевых сигналов» Шестьдесят шестая всероссийская научно-техническая конференция студентов, магистрантов и аспирантов высших учебных заведений с международным участием. 23 апреля 2013 г., Ярославль. Ч. 1, 2: тез. докл., с. 719 (2013)

Шестьдесят шестая всероссийская научно-техническая конференция студентов, магистрантов и аспирантов высших учебных заведений с международным участием. 23 апреля 2013 г., Ярославль. Ч. 1, 2: тез. докл., с. 719 (2013) | Рубрика: 13.05

 

Панченко Е.Ю. «Метод k средних при решении задачи распознавания диктора по речевому образцу» Молодой ученый, № 3, с. 145-146 (2013)

Молодой ученый, № 3, с. 145-146 (2013) | Рубрика: 13.05

 

Музычук Д.С., Медведев М.С. «Использование преобразования Гильберта–Хуанга для формирования моделей фонем русского языка в задаче распознавания речи» Молодой ученый, № 6, с. 75-86 (2013)

Иследуются возможности использования преобразования Гильберта–Хуанга для создания моделей фонем русского языка в системе преобразования речи в текст. Производится сравнение предложенного метода с преобразованием Фурье и вейвлет-преобразованием. Расчеты показали, что метод Гильберта–Хуанга, несмотря на возможность выявления нелинейных изменений в сигнале, в первоначальном виде малопригоден для формирования признаков речевого сигнала (по крайней мере, в рамках нейросетевого подхода).

Молодой ученый, № 6, с. 75-86 (2013) | Рубрика: 13.05

 

Музычук Д.С., Медведев М.С. «Сегментация, шумоподавление и фонетический анализ в задаче распознавания речи» Молодой ученый, № 6, с. 86-96 (2013)

Рассматривается алгоритм сегментации и шумоочистки речевого сигнала, основанный на вычислении кратковременной энергии и использующий качественные пороговые оценки для идентификации пауз. Расчеты показали, что спектральные центроиды позволяют эффективно определять зашумленные участки речевого сигнала. Разработан метод формирования грамматической формы слова на основе его фонетическо-го представления с использованием метрик Левенштейна и Дамерау–Левенштейна. По результатам распознавания можно заключить, что алгоритм Дамерау–Левенштейна лучше всего подходит для получения грамматической формы слова.

Молодой ученый, № 6, с. 86-96 (2013) | Рубрика: 13.05

 

Черанёв М.А., Перов Б.Г. «Анализ математических моделей речевого тракта» Молодой ученый, № 6, с. 181-184 (2013)

Молодой ученый, № 6, с. 181-184 (2013) | Рубрика: 13.05

 

Вельс А.Е. «Формирование навыка произнесения звуков у младших школьников» Молодой ученый, № 7, с. 382-383 (2013)

Молодой ученый, № 7, с. 382-383 (2013) | Рубрика: 13.05

 

Мурадова А.А. «Методы оценки качества передачи речевых пакетов при исследовании надежности сети NGN» Молодой ученый, № 10, с. 162-168 (2013)

Рассмотрены различные методы оценки качества передачи речевых пакетов, которые используются при исследовании надежности сети NGN. Данные методы позволят правильно оценить основные параметры качества работы сети NGN. Получены временные характеристики влияния задержки на качество речи, а также зависимости качества речи от потери пакетов и типов используемых кодеков.

Молодой ученый, № 10, с. 162-168 (2013) | Рубрика: 13.05

 

Синицына Л.В. «Пропорциональность как ведущий принцип синтагматического членения дикторской речи» Современные проблемы науки и образования, № 6, http://www.science-education.ru/113-10730 (2013)

Рассмотрены принципы синтагматического членения дикторской речи. Под дикторской речью понимается чтение заранее подготовленного текста ведущими новостных телепередач. В качестве материала исследования выбраны записи информационных программ "Время", выходивших в эфир на центральном телевидении в 80-е гг. XX в. Единицей наблюдения избрана синтагма, понимаемая как минимальный интонационно-целостный смысловой отрезок речи. Основным методом исследования в данной работе является прием слухового анализа. В ходе анализа установлено, что ведущим принципом членения речевого потока в дикторской речи 80-х гг. XX века является пропорциональность. Тенденция к пропорциональности реализована пропорцией равенства, пропорцией убывания и пропорцией нарастания. Выявлено, что в дикторской речи 1980-х гг. принцип пропорциональности маркирует, как правило, информационные сообщения общественно-политической тематики, обзоры зарубежной прессы о Советском Союзе и новости, повествующие о негативных событиях за рубежом. Установлено, что членение речевого потока на пропорционально соотносимые отрезки способствует ритмизации дикторской речи 1980-х гг. и выполняет эмоционально-экспрессивную, смысловую, композиционную и организующую функции.

Современные проблемы науки и образования, № 6, http://www.science-education.ru/113-10730 (2013) | Рубрика: 13.05

 

Козлов Л.Б., Немков А.Г., Захарчук Е.В., Тусупбекова И.Н., Сенникова Е.С. «Устройство для функционирования певческих резонаторов и коррекции речи» Международный журнал прикладных и фундаментальных исследований, № 10-3, с. 508 (2013)

Создано устройство устранение дефектов речи у детей и взрослых, а также для обучения резонансному пению вокалистов и улучшения работы их артикуляционного аппарата. Устройство обеспечивает подвижность мягкого неба, позволяет разрабатывать артикуляционный аппарат не вызывая травматизма мягких тканей носоглотки и может использоваться в качестве массажора.

Международный журнал прикладных и фундаментальных исследований, № 10-3, с. 508 (2013) | Рубрика: 13.05

 

Грачев А.М. «Фонетический речевой модуль как способ обработки звуковой информации» Вестник Нижегородского университета им. Н.И. Лобачевского, № 4-1, с. 367-372 (2013)

Описывается речевая сенсорная модальность – фонетический, или речевой, модуль, предназначенный исключительно для обработки информации, содержащейся в звуках, идентифицированных как речь. При анализе использованы мнения и точки зрения наиболее авторитетных учёных-лингвистов. Отмечено, что теория фонологического восприятия речи должна лежать в основе экспериментального моделирования автоматического распознавания речи.

Вестник Нижегородского университета им. Н.И. Лобачевского, № 4-1, с. 367-372 (2013) | Рубрика: 13.05