Российский фонд
фундаментальных
исследований

Физический факультет
МГУ им. М.В.Ломоносова
 

13.05 Речеобразование и восприятие речи

 

Копылова А.А. «Формирование звукового анализа слова у детей старшего дошкольного возраста посредством игровых приёмов» Молодой ученый, № 12, с. 471-473 (2013)

Молодой ученый, № 12, с. 471-473 (2013) | Рубрика: 13.05

 

Борискевич А.А., Лагойко А.Ю. «Алгоритмы частотного синтеза визуально-звуковых образов речевого сигнала» Специальная техника, № 1, http://www.ess.ru/sites/default/files/files/annotations/2009-1.pdf (2009)

Рассматриваются разработанные алгоритмы частотного синтеза визуально-звуковых образов (ВЗО) речевых сигналов с использованием спектрограмм на основе дискретного преобразования Фурье (ДПФ) и дискретного косинусного преобразования (ДКП). Дана оценка качества синтеза ВЗО по визуальному и звуковому критериям. Установлено, что ВЗО на основе ДПФ, сохраняющий амплитудно-фазовую, амплитудную или фазовую информацию, обладает более высокой пространственной насыщенностью, чем ВЗО на основе ДКП, которая зависит от степени перекрытия кадров.

Специальная техника, № 1, http://www.ess.ru/sites/default/files/files/annotations/2009-1.pdf (2009) | Рубрика: 13.05

 

Гришачев В.В., Халяпин Д.Б., Шевченко Н.А., Мерзликин В.Г. «Новые каналы утечки конфиденциальной речевой информации через волоконно-оптические подсистемы СКС» Специальная техника, № 2, http://www.ess.ru/sites/default/files/files/annotations/2009-2.pdf (2009)

Представлен общий и экспериментальный анализ новых угроз безопасности конфиденциальной речевой информации связанный с широким распространением волоконно-оптических технологий в современных системах локальной связи. Показана реальная возможность формирования канала утечки речевой информации на основе волоконно-оптических элементов подсистем структурированной кабельной системы. Ключевые слова: речевая информация; безопасность речевой информации; волоконно-оптические инфокоммуникации; акусто-оптоволоконный канал утечки.

Специальная техника, № 2, http://www.ess.ru/sites/default/files/files/annotations/2009-2.pdf (2009) | Рубрика: 13.05

 

Борискевич А.А., Лагойко А.Ю. «Метод двухмерного прогрессивного кодирования параметров спектральной огибающей речевого сигнала» Специальная техника, № 2, http://www.ess.ru/sites/default/files/files/annotations/2009-2.pdf (2009)

Разработан эффективный метод двухмерного прогрессивного кодирования параметров спектральной огибающей речевого сигнала на основе дискретного косинусного преобразования матрицы целочисленных линейных спектральных частот (LSF-коэффициентов) и частотно-полосовой обработки матриц.

Специальная техника, № 2, http://www.ess.ru/sites/default/files/files/annotations/2009-2.pdf (2009) | Рубрика: 13.05

 

Гришачев В.В., Халяпин Д.Б., Шевченко Н.А. «Внешнее оптическое зашумление волоконно-оптического канала связи для предотвращения подслушивания по акусто-оптоволоконному каналу утечки речевой информации» Специальная техника, № 3, http://www.ess.ru/sites/default/files/files/annotations/2009-3.pdf (2009)

Предложен способ предотвращения подслушивания по акусто-оптоволоконному каналу утечки речевой информации путём добавления к информационному световому потоку оптического излучения с шумовым спектром модуляции. Проведена экспериментальная проверка эффективности нейтрализации канала утечки на основе артикуляционного метода. Обсуждаются возможные схемы реализации способа, а также его преимущества и недостатки.

Специальная техника, № 3, http://www.ess.ru/sites/default/files/files/annotations/2009-3.pdf (2009) | Рубрика: 13.05

 

Хорев А.А. «Технические каналы утечки акустической (речевой) информации» Специальная техника, № 5, http://www.ess.ru/sites/default/files/files/annotations/2009-5.pdf (2009)

Приведена классификация технических каналов утечки акустической (речевой) информации. Рассмотрены способы и средства перехвата информации по прямым акустическим (воздушным), акустовибрационным (вибрационным), акустооптическим (лазерным), акустоэлектрическим и акустоэлектромагнитным (параметрическим) техническим каналам утечки информации.

Специальная техника, № 5, http://www.ess.ru/sites/default/files/files/annotations/2009-5.pdf (2009) | Рубрика: 13.05

 

Шалимов И.А., Милошенко А.А. «Обзор моделей идентификации и информативные параметры речевого сигнала» Специальная техника, № 5, http://www.ess.ru/sites/default/files/files/annotations/2009-5.pdf (2009)

Приведен обзор основных алгоритмов, используемых для распознавания речевых сигналов. В частности, рассматриваются следующие модели: модель гауссовых смесей (GMM модель), модель опорных векторов (SVM модель), скрытая Марковская модель (HMM модель), искусственные нейронные сети (NN), векторное квантование (VQ) и тестовое распознавание. Дана классификация систем распознавания в зависимости от решаемых ими задач. Приведены информативные параметры речевого сигнала, используемые для формирования априорного словаря признаков.

Специальная техника, № 5, http://www.ess.ru/sites/default/files/files/annotations/2009-5.pdf (2009) | Рубрика: 13.05

 

Шалимов И.А., Костенко А.И. «Методы повышения качества речи в сетях пакетной коммутации» Специальная техника, № 5, http://www.ess.ru/sites/default/files/files/annotations/2009-5.pdf (2009)

Рассмотрены вопросы повышения качества речевого сервиса в сетях пакетной коммутации. Чувствительность качества речи к задержкам речевого трафика накладывает значительные ограничения на соответствующие протоколы. Значительные задержки и потери речевых пакетов вызывают специфические искажения речи. Для компенсации этих искажений применяется маскирование потерь пакетов – методы сокрытия потерянных пакетов (Packet Loss Concealment – PLC). Приведен обзор основных алгоритмов PLC, используемых в различных приложениях речевого сервиса. В частности, рассмотрены методы, осуществляющие восстановление потерянных сегментов непосредственно по последовательности поступающих пакетов, и методы, включающие специальную обработку пакетов на передающей стороне. Дана классификация методов PLC. Приведены результаты экспериментальных исследований авторов по оценке зависимости слоговой разборчивости речи для случая применения методов вставки от величины потерь пакетов. Представлены данные по сравнению методов PLC.

Специальная техника, № 5, http://www.ess.ru/sites/default/files/files/annotations/2009-5.pdf (2009) | Рубрика: 13.05

 

Белорусов Д.И., Корешков М.С. «WiFi-сети и угрозы информационной безопасности» Специальная техника, № 6, http://www.ess.ru/sites/default/files/files/annotations/2009-6.pdf (2009)

Рассмотрены прямые и косвенные угрозы информационной безопасности, которые возникают в связи с развитием технологии беспроводного доступа WiFi. Показано, что применение технологии WiFi может угрожать не только информации передаваемой непосредственно с помощью оборудования WiFi, но и речевой информации на объекте.

Специальная техника, № 6, http://www.ess.ru/sites/default/files/files/annotations/2009-6.pdf (2009) | Рубрика: 13.05

 

Борискевич А.А., Антончик А.В. «Технология векторного низкоскоростного фурье-кодирования речевого сигнала» Специальная техника, № 3, http://www.ess.ru/sites/default/files/files/annotations/2010-3.pdf (2010)

Предложена технология векторного кодирования речевых сигналов, основанная на использовании амплитудных фурье-векторов, модифицированной векторной кодовой книги, энтропийного межиндексного кодирования и фазовой модели речи. Данная технология обеспечивает разборчивость восстановленной речи при низкой битовой скорости за счет повышения точности аппроксимации спектрально-статистических свойств источника речевой Фурье-информации. По результатам моделирования установлено, что разборчивость речи может сохраняться на скоростях до 185 бит/с.

Специальная техника, № 3, http://www.ess.ru/sites/default/files/files/annotations/2010-3.pdf (2010) | Рубрика: 13.05

 

Гришачев В.В., Косенко О.А., Халяпин Д.Б., Шевченко Н.А. «Методы активного противодействия утечке речевой информации по акусто-оптоволоконным каналам акустическим зашумлением» Специальная техника, № 3, http://www.ess.ru/sites/default/files/files/annotations/2010-3.pdf (2010)

Предложен способ предотвращения подслушивания по акусто-оптоволоконному каналу утечки речевой информации путем воздействия на оптический канал внешнего поля с шумовым спектром. Проведена экспериментальная проверка эффективности нейтрализации канала утечки на основе зашумления внешним акустическим полем. Обсуждаются возможные схемы реализации способа, а также его преимущества и недостатки.

Специальная техника, № 3, http://www.ess.ru/sites/default/files/files/annotations/2010-3.pdf (2010) | Рубрика: 13.05

 

Коршаковский С.И., Коваленко С.М., Малахов А.В. «Определение характеристик сердечной деятельности человека по анализу его речевых фонем» Специальная техника, № 5, http://www.ess.ru/sites/default/files/files/annotations/2010-5.pdf (2010)

На основе выявленных новых свойств резонансных колебательных систем, предложен алгоритм обнаружения сигналов сердечной деятельности человека через голосовые фонемы в условиях, когда величина помехи превышает уровень полезного сигнала. Способ основан на преобразовании сигналов речевых фонем, формировании двух каналов с одинаковыми резонансными контурами, создании в них затухающих переходных процессов и последующей обработке преобразованных сигналов.

Специальная техника, № 5, http://www.ess.ru/sites/default/files/files/annotations/2010-5.pdf (2010) | Рубрика: 13.05

 

Большов О.А. «Пороговые сигналы при предельном ограничении речи» Специальная техника и связь, № 2-3, с. 46-51 (2010)

Рассмотрена проблема оценки защищенности речевого сообщения от несанкционированного доступа (перехвата) и определены некоторые условия, при выполнении которых обеспечивается достаточная защищенность речевой информации.

Специальная техника и связь, № 2-3, с. 46-51 (2010) | Рубрика: 13.05

 

Дворянкин С.В., Мишуков А.А. «Сепарация и маскировка речевых сообщений в многоканальных системах конфиденциальной голосовой связи.» Специальная техника и связь, № 1, с. 40-47 (2011)

Для обеспечения эффективной защиты речевой информации в многоканальных системах конфиденциальной голосовой связи, целесообразно управлять основным показателем защищенности речевой информации, а именно разборчивостью речи как комплексного речевого сигнала, так и составляющих его речеподобных сигналов через цифровую обработку изображений их графических образов путем процедур сепарации и маскирования. Результаты экспериментального тестирования предложенных организационно-технических моделей по управлению разборчивостью речи для защиты конфиденциальных переговоров в каналах голосовой связи полностью подтвердили их экономичность, эффективность и работоспособность.

Специальная техника и связь, № 1, с. 40-47 (2011) | Рубрика: 13.05

 

Козлачков С.Б. «Методические аспекты оценки защищенности речевой информации.» Специальная техника и связь, № 2, с. 44-47 (2011)

Проведен сопоставительный анализ методов оценки защищенности речевой информации. Показаны проблемы повышения точности и достоверности определения разборчивости речи, связанные с совершенствованием методов шумоочистки и обработки информации.

Специальная техника и связь, № 2, с. 44-47 (2011) | Рубрика: 13.05

 

Козлачков С.Б., Бонч-Бруевич А.М. «Критерии выбора полос частотного анализа речевых сигналов» Специальная техника и связь, № 5, http://www.st-s.su/archive/articles/1147675357 (2013)

Предложен объективный критерий выбора параметров полос частотного анализа при оценке защищенности речевых сигналов.

Специальная техника и связь, № 5, http://www.st-s.su/archive/articles/1147675357 (2013) | Рубрика: 13.05

 

Надеина Л.В. «Звук, сопровождаемый движением, как оценка речевого поведения человека» Вестник Забайкальского государственного университета, № 12, с. 103-107 (2013)

Предпринимается попытка показать, что в русских народных говорах коммуникативный акт описывается глаголами движения через такие компоненты, как скорость, резкость, наличие физических параметров звука. Результаты анализа глаголов движения, сопровождаемые звучанием, показали, что данные параметры становятся значимыми при оценивании речи.

Вестник Забайкальского государственного университета, № 12, с. 103-107 (2013) | Рубрика: 13.05

 

Картавенко М.В. «Об использовании акустических характеристик речи для диагностики психических состояний человека» Известия Южного федерального университета. Технические науки, № 5, с. 164-180 (2005)

Известия Южного федерального университета. Технические науки, № 5, с. 164-180 (2005) | Рубрики: 13.05 15.01

 

Кириченко И.А., Бондаренко Р.П. «Биотехническая система для аудиометрии с нелинейным преобразованием речевого сигнала» Известия Южного федерального университета. Технические науки, № 11, с. 160-161 (2006)

Известия Южного федерального университета. Технические науки, № 11, с. 160-161 (2006) | Рубрика: 13.05

 

Перервенко Ю.С., Старченко И.Б. «Эмоциональная речь: детерминированный хаос или нелинейный случайный процесс» Известия Южного федерального университета. Технические науки, № 1, с. 100-101 (2008)

Известия Южного федерального университета. Технические науки, № 1, с. 100-101 (2008) | Рубрика: 13.05

 

Бондарос Ю.Г., Иванов А.И., Шишов А.А. «Анализ речевых сигналов операторов критичных по безопасности систем: гипобария» Известия Южного федерального университета. Технические науки, № 5, с. 153-156 (2008)

Проанализирована изменчивость речи дикторов в зависимости от барометрического давления воздуха окружающей среды при подъемах в барокамере. Ключевые слова: распознавание речи, голосовой интерфейс.

Известия Южного федерального университета. Технические науки, № 5, с. 153-156 (2008) | Рубрика: 13.05

 

Перервенко Ю.С., Черемушкин В.А. «Формирование базы аудиозаписей диспетчеров ростовского узла СКЖД в оперативной обстановке» Известия Южного федерального университета. Технические науки, № 5, с. 156-157 (2008)

Представлен алгоритм формирования базы аудиозаписей для дальнейшего анализа и обработки. Составлена база данных по двум диспетчерам во временном интервале, соответствующем 1 неделе.

Известия Южного федерального университета. Технические науки, № 5, с. 156-157 (2008) | Рубрика: 13.05

 

Бондаренко Р.П., Кириченко И.А., Салов В.В. «Концепция разработки электронной библиотеки аудиограмм» Известия Южного федерального университета. Технические науки, № 5, с. 157-159 (2008)

Рассмотрена концепция построения электронной библиотеки тональных аудиограмм, представляющая собой приложение локальной базы данных Access, система управления которой разработана в среде Delphi.

Известия Южного федерального университета. Технические науки, № 5, с. 157-159 (2008) | Рубрика: 13.05

 

Бондарос Ю.Г., Иванов А.И., Лапа В.В., Радченко Е.В., Тищенко А.А. «Определение функционального состояния оператора по характеристикам речи: простая зрительно-речевая реакция» Известия Южного федерального университета. Технические науки, № 10, с. 118-123 (2009)

Выполнение оператором сложного или длительного задания изменяет его состояние и влияет на качество её исполнения. Следовательно, необходим контроль функционального состояния оператора до и во время выполнения задания, особенно если его деятельность критична по безопасности. Описаны результаты экспериментального исследования показателя простой зрительно-речевой реакции как информационного признака функционального состояния оператора.

Известия Южного федерального университета. Технические науки, № 10, с. 118-123 (2009) | Рубрика: 13.05

 

Бакаев А.В. «Особенности спектральных характеристик вокальной речи певца при профессиональных заболеваниях» Известия Южного федерального университета. Технические науки, № 9, с. 229-234 (2012)

Рассматриваются теории образования высокой певческой форманты, предложенные Е.А. Рудаковым и В.П. Морозовым, а именно образование ее посредством эффекта "краевого тона" или ее резонансная теория происхождения. Изложены результаты моделирования процесса формирования высокой певческой форманты на основе ее экспериментально полученной временной диаграммы и предлагаемой ее математической модели в виде периодической последовательности импульсов с огибающей в форме усеченных косинусоид с высокочастотным заполнением. Делается вывод о взаимном дополнении существующих теорий, ранее выступающих как противоборствующих. Приводятся спектры записей голоса профессионального певца в больном и здоровом состоянии.

Известия Южного федерального университета. Технические науки, № 9, с. 229-234 (2012) | Рубрика: 13.05

 

Копытов В.В., Якушев Д.В. «Методы кодирования речевых сигналов с помощью реконструированной модели речевого процесса» Известия Южного федерального университета. Технические науки, № 1, с. 37-44 (2013)

Представлена реконструированная модель речевого процесса. Рассмотрена возможность использования различных методов численного интегрирования для восстановления речевого сигнала с целью снижения ошибки реконструкции. Представлены результаты численного эксперимента. Разборчивость речи – лучшая для методов трапеций и Симпсона. Метод Симпсона наиболее трудоемкий в плане вычислительных мощностей и занимает большее количество времени для реконструкции речевого сигнала, в отличие от других методов. Поэтому на практике целесообразно введение дополнительной метрики для оценки разборчивости речи и сочетание представленных методов для получения максимально качественного речевого сигнала. Результаты исследования могут быть использованы для кодирования речевой информации.

Известия Южного федерального университета. Технические науки, № 1, с. 37-44 (2013) | Рубрика: 13.05

 

Лебедева Н.Н., Потапова Р.К., Каримова Е.Д., Вехов А.В., Казимирова Е.А. «Акустические характеристики речевого сигнала и психофизиологические корреляты различных эмоциональных состояний в модельных экспериментаХ» Биомедицинская радиоэлектроника, № 12, с. 35-42 (2013)

Представлены результаты исследования нелинейной характеристики речевого сигнала – корреляционной размерности D2 – и её связи с электрографическими и психофизиологическими характеристиками человека в экспериментах по моделированию различных эмоциональных состояний. Показано, что величина D2 уменьшается при моделировании стенических эмоций, увеличивается – при моделировании астенических; при этом выраженность динамики определяется гендерным признаком, уровнями экстраверсии-интроверсии и нейротизма, а также мощностью альфа-ритма в спектре электроэнцефолограммы испытуемых. The main aim of our work was studying the non-linear characteristic of voice signal in perspective of verification of people emotional condition and an impact, individual psychophysiological features have on this characteristic. It was studied in model experiment, during which each participant should plunge in each emotional states and then read four sentences. We recruited twenty two people in experiment – twenty non-actor (10 men, 10 women) and two professional actors (man and woman). There were five states: neutrality, happiness, anger, sorrow and fear. We obtained the non-linear characteristic D2 of voice signal. In order to identify individual psychophysiological profile for each participant, ECG-recording, psychological tests (including Eysenck’s test) and EEG-recording were used. Non-actors and actors results comparing have shown, that typical D2 dynamic is decrease during happiness and anger for all participants; but in sorrow and fear states D2 slightly increase for women and extroverts and decrease for men and introverts. These trends for Professional actors were more remarkable but non-actors also demonstrated the same. So, dynamic for D2 of women is similar to extroverts and of men is similar to introverts. In addition to measuring the level of introversions and extraversions, the level of neuroticism were measured as well. It has been shown, that people with high level of this factor demonstrated higher meanings of D2. It must be considered, that the majority part of this group was formed by women. After the division of all participants into several groups according their alpha-rhythm capacity we found out that D2 of people with ulterior rhythm changed hardly noticeable between different emotional states. For groups with alpha-rhythm varying degrees of capacity, value of D2 depends on the level of neuroticism. Besides the level of neuroticism influenced on the ratio of D2 values between different emotional states. In addition, five experts were offered all audio files for marking. According to the expert estimate, the most successful modeling was demonstrated by people with high level of extraversion and neuroticism at once. But for all that, experts could not make out emotion, which had right dynamic of D2. We may conclude that use non-linear voice characteristic may be more successful than expert estimation, at least for emotion directed outward (happiness, anger).

Биомедицинская радиоэлектроника, № 12, с. 35-42 (2013) | Рубрика: 13.05