Гай В.Е. «Идентификация диктора по спектральным характеристикам речевого сигнала» Датчики и системы, № 7, с. 40-45 (2013)
Describes the method of identification of the speaker. Is the entire sequence of steps in solving a problem of identification, starting with the construction of the signature of the speaker. The algorithm is based on the theory of active perception adapted to the analysis of speech signals. The results of these experiments demonstrate the ability to use the proposed algorithm for the solution of this problem.
Датчики и системы, № 7, с. 40-45 (2013) | Рубрика: 13.05
Зиновьев В.Н., Кравцов М.С. «Алгоритмы голосовой верификации» Двойные технологии, № 3, с. 28-30 (2013)
Приведен алгоритм формирования голосового отпечатка и алгоритм распозна вания. Описанные алгоритмы отличаются повышенной точностью, надёжностью и безопасностью. Также описана система защиты от подмены голоса на основе парольных фраз.
Двойные технологии, № 3, с. 28-30 (2013) | Рубрика: 13.05
Гладышев К.К. «Система поиска ключевых слов в непрерывном речевом потоке» Естественные и технические науки, № 1, с. 242-244 (2009)
Естественные и технические науки, № 1, с. 242-244 (2009) | Рубрика: 13.05
Кузнецов Д.С. «Алгоритм работы программной реализации фильтра Винера» Естественные и технические науки, № 4, с. 365-369 (2009)
Рассматривается фильтр Винера в качестве метода повышения эффективности работы систем распознавания речи. Приводятся сведения о возможных модификациях фильтра Винера для повышения степени шумоподавления. Рассматривается алгоритм работы программной реализации классического фильтра Винера и его модификаций.
Естественные и технические науки, № 4, с. 365-369 (2009) | Рубрика: 13.05
Кузнецов Д.С. «Исследование комплексного подхода к шумоподавлению в системах распознавания речи» Естественные и технические науки, № 4, с. 370-374 (2009)
Рассматривается возможность использования комплекса методов для повышения помехозащищенности речи, в частности, приводятся метод шумоподавления и метод удаления дыхания. Также даны результаты распознавания при использовании каждого из методов по отдельности и в комплексе. Сделаны выводы о том, какая обработка должна применяться к речевому сигналу до распознавания.
Естественные и технические науки, № 4, с. 370-374 (2009) | Рубрика: 13.05
Кузнецов Д.С. «Фильтр Винера как средство повышения помехозащищенности в системах распознавания речи» Естественные и технические науки, № 4, с. 375-382 (2009)
Описывается работа программной реализации фильтра Винера. Также рассматривается способ проведения исследования эффективности шумоподавления. Приводятся результаты работы программной реализации фильтра Винера.
Естественные и технические науки, № 4, с. 375-382 (2009) | Рубрика: 13.05
Кузнецов Д.С. «Эффективность шумоподавления в системах распознавания речи» Естественные и технические науки, № 4, с. 383-388 (2009)
Рассматривается возможность повышения эффективности распознавания речи при помощи метода шумоподавления. Приводятся результаты работы системы распознавания речи совместно с модулем шумоподавления. Даны необходимые комментарии и пояснения к полученным результатам работы.
Естественные и технические науки, № 4, с. 383-388 (2009) | Рубрика: 13.05
Ананьев А.Б., Ананьева Е.А. «Компьютерная экспертиза певческого голоса» Акустический вестник (Акустичний вiсник, укр.), 11, № 2, с. 5-11 (2008)
Рассмотрены вопросы объективного анализа свойств звуков певческого голоса и музыкальных инструментов. Приведены соответствующие образцы результатов, полученные с помощью разработанного авторами программного комплекса VOCA. Обсуждена возможность исследования интонационной мелодической трассы с применением аналогичной технологии.
Акустический вестник (Акустичний вiсник, укр.), 11, № 2, с. 5-11 (2008) | Рубрика: 13.05
Калюжный А.Я., Семенов В.Ю. «Метод идентификации пола диктора на основе моделирования акустических параметров голоса гауссовыми смесями» Акустический вестник (Акустичний вiсник, укр.), 12, № 2, с. 31-38 (2009)
Предложен метод автоматической классификации речевых фрагментов по признаку "мужчина/женщина" и описаны основные этапы его алгоритмической реализации. Метод основан на моделировании плотности распределения вектора акустических признаков голоса взвешенной суммой нескольких гауссовских распределений (метод гауссовых смесей). Каждый из членов GMM соответствует некоторому подклассу множества акустических параметров голосового сигнала. В качестве вектора акустических признаков была выбрана совокупность кепстральных RASTA-PLP коэффициентов, дополненных периодом основного тона. Обучение гауссовых смесей для мужских и женских голосов проводилось по методу expectation-maximization с инициализацией согласно алгоритму K-средних. Исследована зависимость процента ошибок классификации от типа ковариационных матриц GMM и их порядков. В различных экспериментах предложенный метод показал достаточно малую вероятность ошибки классификации (от 9 до 0%). Сделан вывод о вторичности порядка и типа GMM по сравнению с необходимостью разнообразного представления дикторов в обучающей базе речевых сигналов.
Акустический вестник (Акустичний вiсник, укр.), 12, № 2, с. 31-38 (2009) | Рубрика: 13.05
Семенов В.Ю. «Аналіз часового розподілу випромінювальних спектральних частот і методика ïх обчислення» Акустический вестник (Акустичний вiсник, укр.), 12, № 4, с. 52-56 (2009)
Рассмотрена задача вычисления излучательных спектральных частот (ИСЧ), являющихся альтернативной формой представления параметров голосового тракта. Изучены свойства взаимного расположения ИСЧ на смежных фреймах речевого сигнала. На их основе предложен новый экономичный метод вычисления ИСЧ. Проведено сравнение вычислительных характеристик полученного метода с характеристиками стандартного речевого кодека AMR-WB. Проанализирована эффективность метода в условиях потери голосовых данных в канале связи.
Акустический вестник (Акустичний вiсник, укр.), 12, № 4, с. 52-56 (2009) | Рубрика: 13.05
Калюжный А.Я., Ковтонюк А.А., Семенов В.Ю. «Метод идентификации авторегрессионных параметров речи в частотной области» Акустический вестник (Акустичний вiсник, укр.), 13, № 2, с. 20-28 (2010)
Рассмотрена задача оценивания авторегрессионных параметров зашумленного речевого сигнала в частотной области. На основании частотного представления авторегрессионного сигнала проиллюстрированы методика расчета функции правдоподобия, а также реализация метода ожидания-максимизации для итеративного оценивания авторегрессионных параметров. Анализ различных мер искажения речевых сигналов показал, что работа в частотной области обеспечивает такую же точность, как и соответствующие подходы во временной области, но при существенно меньших вычислительных затратах. Предложен и исследован двухэтапный метод оценивания авторегрессионных параметров зашумленного речевого сигнала в частотной области.
Акустический вестник (Акустичний вiсник, укр.), 13, № 2, с. 20-28 (2010) | Рубрика: 13.05
Кузенков Н.П., Логинов В.М., Прокопенко С.В., Можейко Е.Ю. «Статистическое описание речи человека при органических нарушениях центрального отдела речевого аппарата» Нелинейный мир, 10, № 4, с. 247-255 (2012)
Исследованы фазовые портреты рядов длительностей звуков и пауз в речи человека; показано, что фазовые портреты описываются вероятностями перехода точки между различными областями фазового пространства; обнаружены статистически значимые различия для речи человека при патологии речевого аппарата (дизартрия и афазия) и в норме; рассмотрена возможность использования данного подхода для диагностики отдельных речевых функций.
Нелинейный мир, 10, № 4, с. 247-255 (2012) | Рубрика: 13.05
Фролов М.В., Милованова Г.Б. «Речевой сигнал как показатель функционального состояния человека-оператора» Биомедицинская радиоэлектроника, № 6, с. 49-53 (2009)
Рассмотрены понятие функционального состояния и особенности динамического контроля последнего. Показаны существенное преимущество диагностики функционального состояния при использовании речевого сигнала и нередко возникающие при этом трудности выделения исходных параметров речи. Приведены примеры успешного применения мелодических и спектральных показателей речевого сигнала для распознавания и дифференцирования эмоционального и физического напряжений у человека-оператора в условиях наземных тренировок, а также в реальных космическом и авиационном полетах.
Биомедицинская радиоэлектроника, № 6, с. 49-53 (2009) | Рубрика: 13.05
Балацкая Л.Н., Красавина Е.А., Мещеряков Р.В., Чижевская С.Ю., Чойнзонов Е.Л. «Акустический анализ на этапах комбинированного лечения и голосовой реабилитации у больных раком гортани и гортаноглотки» Биомедицинская радиоэлектроника, № 8, с. 3-12 (2009)
Рассматривается новая технология комбинированного лечения и голосовой реабилитации для пациентов, страдающих заболеваниями голособразующего аппарата. Рассмотрена возможность использования акустического анализа в логовосстановительной терапии при формировании пищеводной речи у больных после удаления гортани. Показана возможность использования биологической обратной связи для повышения эффективности и уменьшения срока реабилитационного периода и улучшения качества голоса
Биомедицинская радиоэлектроника, № 8, с. 3-12 (2009) | Рубрики: 13.05 15.02
Лебедева Н.Н., Сидорова О.А., Марагей Р.А., Котровская А.Н. «Фрактальный анализ речевого сигнала при различении эмоционального состояния в модельных экспериментах» Биомедицинская радиоэлектроника, № 1, с. 3-7 (2010)
Представлены результаты применения фрактального анализа речевого сигнала при моделировании актерами различных эмоциональных состояний. Выявлены достоверные различия величины фрактальной размерности при моделировании состояния горя, радости и гнева по сравнению с нейтральным состоянием. Кроме того, обнаружены гендерные различия динамики показателя фрактальной размерности при моделировании эмоциональных состояний: у мужчин наиболее выраженные изменения исследуемого показателя наблюдались при моделировании эмоции горя (снижение по сравнению с нейтральным состоянием составило 30%) и гнева (повышение составило 18%), при моделировании же эмоции радости фрактальная размерность практически не изменилась; в то время как у женщин снижение размерности при моделировании эмоции горя составило 16%, при моделировании гнева – превышение только 9%, зато при моделировании эмоции радости повышение размерности по сравнению с нейтральным состоянием составило 21%.
Биомедицинская радиоэлектроника, № 1, с. 3-7 (2010) | Рубрика: 13.05
Лебедева Н.Н., Каримова Д., Казимирова Е.А. «Акустические характеристики речи и индивидуальные особенности человека» Биомедицинская радиоэлектроника, № 6, с. 29-35 (2013)
Представлены результаты исследования нелинейной характеристики речевого сигнала – корреляционной размерности и её связи с электрографическими и психофизиологическими характеристиками человека. Показано, что корреляционная размерность зависит от гендерного признака, а также различается при произнесении эмоциональных и нейтральных слов.
Биомедицинская радиоэлектроника, № 6, с. 29-35 (2013) | Рубрика: 13.05
Флаксман М.А. «Звукоподражательная лексика английского языка с атипичным фонетическим развитием» Известия Санкт-Петербургского государственного электротехнического университета "ЛЭТИ", № 7, с. 141-145 (2011)
Исследование проводится в рамках лингвистического направления фоносемантики. Целью является проверка гипотезы о наличии причинно-следственной связи между атипичным фонетическим развитием слова и его принадлежностью к звукоизобразительной лексике.
Известия Санкт-Петербургского государственного электротехнического университета "ЛЭТИ", № 7, с. 141-145 (2011) | Рубрика: 13.05
Вовк И.В., Гринченко В.Т., Мацыпура В.Т. «Природа шумов дыхания и их мультифрактальные свойства» Акустический журнал, 59, № 5, с. 636-647 (2013)
На основе использования традиционной и оригинальной методики регистрации везикулярных и трахейных шумов дыхания человека в норме и проведения их фрактального анализа, установлено, что шумы имеют мультифрактальный характер и природа возникновения везикулярных и трахейных шумов разная. Показано, что везикулярные шумы возникают в результате деформации растяжения–сжатия паренхимы легких в процессе акта дыхания, а трахейные шумы, как известно, за счет пульсаций давления на внутренней поверхности трахеи, вызванных нестационарностью потока воздуха в зоне голосовой щели.
Акустический журнал, 59, № 5, с. 636-647 (2013) | Рубрики: 13.05 08.06
Або Исса Никола, Али Мамун, Гитлин В.Б. «Особенности спектра арабских гласных, произнесенных совместно с эмфатическими согласными» Вестник Ижевского государственного технического университета (ИжГТУ), № 1, с. 112–116 (2013)
Исследованы средние спектры гласных арабского языка, произнесенных совместно с четырьмя эмфатическими арабскими согласными, и проведено сравнение со средними спектрами подобных фонетических произнесений русского языка. Найдены отличия этих спектров. Показано, что эти отличия определены различиями в способе произнесения подобных звуков дикторами-арабами и русскоязычными дикторами.
Вестник Ижевского государственного технического университета (ИжГТУ), № 1, с. 112–116 (2013) | Рубрика: 13.05

