13.05 Речеобразование и восприятие речи

Сабиров А.А. «Измерительный комплекс для оценки защищенности технических средств от утечки речевой информации по каналам акустоэлектрических преобразований» Физика для Пермского края: Материалы Краевой научно-практической конференции студентов, аспирантов и молодых ученых, Пермь, 18–25 апр., 2011. Вып. 4, с. 131-134 (2011). 182 с.

Физика для Пермского края: Материалы Краевой научно-практической конференции студентов, аспирантов и молодых ученых, Пермь, 18–25 апр., 2011. Вып. 4, с. 131-134 (2011). 182 с. | Рубрики: 10.08 13.05

Котомин А.В. «Основные этапы предварительной обработки звукового сигнала в системе распознавания речевых команд» Информационно-телекоммуникационные технологии и математическое моделирование высокотехнологичных систем: Тезисы докладов Всероссийской конференции с международным участием, Москва, 18–22 апр., 2011, с. 135-137 (2011)

Информационно-телекоммуникационные технологии и математическое моделирование высокотехнологичных систем: Тезисы докладов Всероссийской конференции с международным участием, Москва, 18–22 апр., 2011, с. 135-137 (2011) | Рубрика: 13.05

Малинин П.В., Поляков В.В. «Алгоритмы обработки звуковых сигналов при формировании баз голосовых данных» Многоядерные процессоры, параллельное программирование, ПЛИС, системы обработки сигналов: Сборник статей Всероссийской научно-практической конференции, Барнаул, 28 февр., 2013, с. 85-89 (2013)

Многоядерные процессоры, параллельное программирование, ПЛИС, системы обработки сигналов: Сборник статей Всероссийской научно-практической конференции, Барнаул, 28 февр., 2013, с. 85-89 (2013) | Рубрики: 13.05 13.06

Павлов П.А. «Подход к формализации образцов в системах распознавания слов» Наукоемкие технологии в приборо- и машиностроении и развитие инновационной деятельности в вузе: Материалы Всероссийской научно-технической конференции, Москва, 7–9 дек., 2010. Т. 1, с. 215-217 (2010)

Наукоемкие технологии в приборо- и машиностроении и развитие инновационной деятельности в вузе: Материалы Всероссийской научно-технической конференции, Москва, 7–9 дек., 2010. Т. 1, с. 215-217 (2010) | Рубрика: 13.05

Кропотов Ю.А. «Многоканальный адаптивный алгоритм подавления акустических помех методом ДПФ в системах обмена речевыми сообщениями» 22 Международная Крымская конференция "СВЧ-техника и телекоммуникационные технологии" (КрыМиКо-2012): Материалы конференции, Севастополь, 10–14 сент., 2012. Т. 2, с. 863-864 (2012)

22 Международная Крымская конференция "СВЧ-техника и телекоммуникационные технологии" (КрыМиКо-2012): Материалы конференции, Севастополь, 10–14 сент., 2012. Т. 2, с. 863-864 (2012) | Рубрика: 13.05

Пуртов К.С., Бабич М.В., Бродовский В.Б., Кубланов В.С., Черных О.А. «Виртуальная система автоматизированного определения слуховой чувствительности человека» Физика и радиоэлектроника в медицине и экологии (ФРЭМЭ2014): Труды 11-й межд.научн. конф, 1–3 июля 2014 г. Владимир–Суздаль, том 1, с. 299-302 (2014)

Физика и радиоэлектроника в медицине и экологии (ФРЭМЭ2014): Труды 11-й межд.научн. конф, 1–3 июля 2014 г. Владимир–Суздаль, том 1, с. 299-302 (2014) | Рубрики: 13.05 13.06

Vu Van Son, Nguyen Tri Tue, Nguyen Thi Hoai Thu «Результат применения разреженных адаптивных фильтров для подавления эхо-сигналов в слуховых аппаратах» Физика и радиоэлектроника в медицине и экологии (ФРЭМЭ2014): Труды 11-й межд.научн. конф, 1–3 июля 2014 г. Владимир–Суздаль, том 1, с. 361-365 (2014)

Физика и радиоэлектроника в медицине и экологии (ФРЭМЭ2014): Труды 11-й межд.научн. конф, 1–3 июля 2014 г. Владимир–Суздаль, том 1, с. 361-365 (2014) | Рубрики: 13.05 13.06

Крючков К.С. «Выбор порога различия при сегментации речевого сигнала на вокализованные и невокализованные сегменты» Научная сессия ТУСУР-2014: Материалы Всероссийской научно-технической конференции студентов, аспирантов и молодых ученых, Томск, 14–16 мая, 2014 г. Ч. 3, с. 40-43 (2014)

Проанализирован алгоритм сегментации речевого сигнала на основе поиска периодической структуры сигнала при помощи сверток набора масок и исходного сигнала.

Научная сессия ТУСУР-2014: Материалы Всероссийской научно-технической конференции студентов, аспирантов и молодых ученых, Томск, 14–16 мая, 2014 г. Ч. 3, с. 40-43 (2014) | Рубрика: 13.05

Горелов Г.В., Осницкий В.И., Трусов К.С., Ромашкова О.Н. «Компандирование речевого сообщения по рекомендации МСЭ-Е G. 711 международного союза электросвязи» Современные проблемы науки и образования, № 1-1, http://www.science-education.ru/ru/article/view?id=17291 (2015)

Наиболее значительным достижением в области телекоммуникаций, которое будет использоваться человечеством в необозримой перспективе, является создание основного цифрового канала (ОЦК), характеристики которого определяют режим преобразования речи человека в цифровую форму и регламентированы в начале 1980-х годов прошлого столетия рекомендацией МСЭ-Т G.711 Международного союза электросвязи. Одним из основных достоинств ОЦК является неравномерное квантование речевого сообщения (компандирование по «А-закону», используемое в Европе, и компандирование по «μ-закону», используемое в Северной Америке, Японии и т.д.). Для иллюстрации работы компандера G.711 применена реальная модель речевого сообщения, полученная авторами. Иллюстрировано существенное преимущество алгоритма компандирования в ОЦК по сравнению с алгоритмом равномерного квантования сообщения по уровню.

Современные проблемы науки и образования, № 1-1, http://www.science-education.ru/ru/article/view?id=17291 (2015) | Рубрики: 13.05 14.01

Орлова Л.И. «Распределение потоков речевой информации по кондиционным маршрутам транспортной сети связи» Современные проблемы науки и образования, № 1-1, http://www.science-education.ru/ru/article/view?id=18156 (2015)

Рассматривается проблема передачи пакетов речевой информации с требуемым качеством на транспортной сети связи с учетом используемой телекоммуникационной технологии. Обосновывается необходимость установления связи корреспондирующим узлам по кондиционным маршрутам. В качестве решения предлагается алгоритм распределения информационных потоков по кондиционных маршрутам с учетом информационной нагрузки на сети. Реализация алгоритма позволяет устанавливать гарантированные соединения корреспондирующим парам узлов по кондиционным маршрутам путем сокращения количество переприемов информационных сообщений в промежуточных центров коммутации до требуемого по условию кондиционности. Возможность оперативного переключения кондиционных маршрутов сохраняется для потокового графа.

Современные проблемы науки и образования, № 1-1, http://www.science-education.ru/ru/article/view?id=18156 (2015) | Рубрика: 13.05

Желтов П.В., Желтов В.П., Семенов В.И. «Применение вейвлет-преобразования при сегментации речи» Современные проблемы науки и образования, № 1-1, http://www.science-education.ru/ru/article/view?id=19205 (2015)

Рассматриваются существующие методы сегментации речевого сигнала. Среди разнообразных созданных в настоящее время методов можно выделить следующие: метод динамического искажения времени (Dynamic Time Warping, DTW), марковские Модели (Hidden Markov Models, HMM), искусственные нейронные сети (Artificial Neural Networks, ANN), прочие методы на основе DBN (Dynamic Bayesian Networks) и SVM (Support vector machines). Рассматриваются методы формирования слова, принципы, по которым производится отличие некоторых слов. Представлена математическая модель распознавания речи. В отличие от печатного текста или искусственных сигналов естественная речь не допускает простого и однозначного членения на элементы (фонемы, слова, фразы), поскольку эти элементы не имеют явных физических границ. Они вычленяются в сознании слушателя, носителя данного языка, в результате сложного многоуровневого процесса распознавания и понимания речи.

Современные проблемы науки и образования, № 1-1, http://www.science-education.ru/ru/article/view?id=19205 (2015) | Рубрика: 13.05

Сосунова И.А. «Извлечение темы из голосовых аннотаций дорожной обстановки на базе системы распознавания речи CMU SPHINX» Современные проблемы науки и образования, № 1-2, http://www.science-education.ru/ru/article/view?id=20115 (2015)

Предлагается подход, позволяющий получать информацию о дорожной обстановке и критических ситуациях на дороге напрямую от водителя посредством распознавания речи. Примером таких ситуаций являются: ямы, колдобины, обледенение дороги, открытые люки, аварии и аварийные ситуации, несоблюдение правил дорожного движения, неработающие или некорректно работающие светофоры и табло, некорректная разметка. Для формирования словаря ключевых слов, на основе которого производится распознавание речи, был собран и проанализирован корпус сообщений о дорожных проблемах. Из корпуса были выделены 11 подкорпусов, описывающих различные дорожные проблемы, в соответствии с которыми был составлен словарь ключевых слов для распознавания и реализован алгоритм выделения темы сообщения на основе списков ключевых слов, соответствующих различным дорожным проблемам. Итогом текущего этапа исследования стал прототип системы извлечения темы из голосовых аннотаций дорожной обстановки.

Современные проблемы науки и образования, № 1-2, http://www.science-education.ru/ru/article/view?id=20115 (2015) | Рубрика: 13.05

Зайцева Ж.И., Неделяева А.В., Кирилов И.С. «Исследование низкочастотных и высокочастотных порогов звуковосприятия в разновозрастных группах» Современные проблемы науки и образования, № 2-1, http://www.science-education.ru/ru/article/view?id=19313 (2015)

Исследования показали, что высокочастотные и низкочастотные пороги звуковосприятия меняются на пяти разных по силе уровнях звукового давления от первого уровня в 1 усл. ед. до пятого уровня в 100 усл. ед. в группах испытуемых, различающихся по возрасту и полу. Наибольшая чувствительность, т.е. меньшие пороги на низких частотах и большие пороги на высоких частотах, зарегистрирована у подростков 11–13 лет. У мужчин низкочастотные пороги в возрасте от 11 до 45 лет меняются незначительно в пределах Мср ±m от 62±2,87 до 66±3,67 Гц. У женщин от 11 до 45 лет низкочастотные пороги достоверно повышаются с 53± 2,57 до 69±2,74 Гц. У подростков-мальчиков в 11–13 лет высокочастотный порог звуковосприятия составил 15971±25,5 Гц, что примерно в 4 раза выше, чем у пожилых мужчин в возрасте 67–75 лет, у которых высокочастотные пороги от 4194±1077, 9 до 5368±1083,8 Гц. У подростков-девочек в 11–13 высокочастотный порог 15883±77,4 Гц, что примерно в 5 раз выше, чем у пожилых женщин, где он составил 3230±624,2 Гц. При первом повышении звукового давления до второго уровня на 25 усл. ед. во всех возрастных группах для лиц мужского и женского пола наблюдаются достоверное снижение низкочастотных порогов слуха и повышение высокочастотных порогов. При каждом последующем повышении уровня звукового давления от 25 к 50 усл. ед., затем к 75 и 100 усл. ед. во всех возрастных группах наблюдаются снижение низкочастотного порога слуха и повышение высокочастотного порога слуха. Однонаправленного преобладания (доминантности) по слуховым порогам правого или левого уха не выявлено.

Современные проблемы науки и образования, № 2-1, http://www.science-education.ru/ru/article/view?id=19313 (2015) | Рубрики: 13.05 13.06

Герасимов А.В., Морозов О.А., Солдатов Е.А., Фидельман В.Р. «Использование разложения автокорреляционной матрицы сигнала по собственным векторам в задаче устойчивого акустического кодирования вокализованных речевых сигналов» Вестник Нижегородского университета им. Н.И. Лобачевского, № 1, с. 194-199 (2004)

Рассматривается метод получения устойчивых акустических признаков для вокализованных речевых сигналов, основанный на анализе собственных векторов автокорреляционной матрицы сигнала. Полученные признаки предлагается использовать вместо коэффициентов линейного предсказания в блоке акустической обработки систем распознавания речи.

Вестник Нижегородского университета им. Н.И. Лобачевского, № 1, с. 194-199 (2004) | Рубрика: 13.05

Вольф Д.А., Мещеряков Р.В. «Модель процесса сингулярного оценивания частоты основного тона речевого сигнала» Акустический журнал, 62, № 2, с. 216-226 (2016)

Предложен новый способ оценивания частоты основного тона речи, основанный на сингулярном спектральном анализе. Представлена сингулярная модель вокализированного сегмента речевого сигнала, в которой рассматривается прямая и обратная задачи. Проведено исследование процесса сингулярного оценивания частоты основного тона речи. Выполнены экспериментальные исследования с моделью, где даны оценки адекватности и достоверности. Введено понятие сингулярного оценивания частоты основного тона речи.

Акустический журнал, 62, № 2, с. 216-226 (2016) | Рубрика: 13.05

Любимов Н.А., Захаров Е.В. «Математическая модель акустического речеобразования с подвижными стенками речевого тракта» Акустический журнал, 62, № 2, с. 227-236 (2016)

Рассматривается математическая модель речеобразования, описывающая распространение акустических колебаний в речевом тракте с подвижными стенками. Функция волнового поля удовлетворяет уравнению Гельмгольца с граничными условиями 3-го рода (импедансного типа). Режим импеданса соответствует трехпараметрической модели колебания маятника. Экспериментальные исследования демонстрируют нелинейный характер влияния подвижности стенок тракта на спектральную огибающую речевого сигнала.

Акустический журнал, 62, № 2, с. 227-236 (2016) | Рубрика: 13.05

Сорокин В.Н. «Сегментация периода основного тона голосового источника» Акустический журнал, 62, № 2, с. 247-258 (2016)

Экстремумы логарифмической производной средней энергии спектра речевого сигнала в области частот 1000–3000 Гц используются для определения моментов открытия и закрытия голосовой щели. Экспериментальная оценка погрешности анализа выполняется с использованием базы данных Arctic CMU, содержащей синхронную запись речевого сигнала и электро-глоттограмм. Оценки моментов открытия и закрытия голосовой щели, найденные разработанным алгоритмом, сравниваются с моментами максимума и минимума производной от сигналов электро-глоттограмм, которые принимаются за “истинные” моменты. Среднеквадратическое отклонение момента открытия голосовой щели от экстремумов производной от сигналов электро-глоттограмм для разных дикторов находится в диапазоне от 1.03 до 1.64 мс. Ошибка ложной оценки момента закрытия голосовой щели составляет от 0.01 до 0.14%, а ошибка пропуска – от 0.42 до 2.38%. Разработан алгоритм обнаружения ошибок. Среднеквадратическое отклонение относительной к периоду основного тона ошибки определения момента открытия голосовой щели находится в диапазоне 13–18% при наиболее вероятной ошибке от 0 до +5%.

Акустический журнал, 62, № 2, с. 247-258 (2016) | Рубрика: 13.05

Акустика

сигнальная информация

№3, 2016 год

13.05 Речеобразование и восприятие речи