Российский фонд
фундаментальных
исследований

Физический факультет
МГУ им. М.В.Ломоносова
 

13.05 Речеобразование и восприятие речи

 

Белоруцкий Р.Ю., Житник С.В. «Распознавание речи на основе сверточных нейронных сетей» Вопросы радиоэлектроники, № 4, с. 47-52 (2019)

Рассматривается задача распознавания речи человека в виде записанных на диктофон сигналов произнесенных цифр от 1 до 10. Использован метод распознавания спектрограммы звукового сигнала с помощью сверточных нейронных сетей. Реализованы алгоритмы для предварительной обработки входных данных – изображений спектрограмм, а также алгоритмы для обучения сети и распознавания произнесенных слов. Оценено качество распознавания для разного количества сверточных слоев. Исходя из этого, выбрано их число, предложена структура нейронной сети. Произведено сравнение качества распознавания в случаях, когда входными данными для сети являются спектрограмма звукового сигнала или выделенные из нее первые две форманты. Тестирование алгоритма распознавания произведено на примерах мужского и женского голосов с разной длительностью произношения.

Вопросы радиоэлектроники, № 4, с. 47-52 (2019) | Рубрика: 13.05

 

Балакирев Н.Е., Нгуен Х.З. «Особенности распознавания тональности в речевом потоке» Труды Московского авиационного института, № 104, с. 25 (2019)

Рассматривается один из возможных подходов к решению задачи распознавания особых аспектов речи, связанных с тональностью, которая занимает важное место в человеческой коммуникации. Градус особого состояния напряжения, прежде всего, отражается не в содержании слов, а способе их произношения, который несет иногда другую смысловую нагрузку относительно содержания слов. Решение такой задачи может использоваться в авиационной технике, в частности, для автоматического распознавания эмоционального состояния на борту, для выделения эмоциональных отрезков в записях бортовых самописцев с речью пассажиров местных и международных рейсов. Особое ключевое значение тональность имеет в тональных языках Юго-Восточной Азии, хотя тональность и для европейских языков имеет немаловажное значение, отражая характер произносимой фразы и привнося дополнительный смысл в содержание распознаваемых слов и предложений. Так или иначе, сама тональность проявляется идентично, но имеет свои особенности по отношению информационного содержания фонемы или слова. И это прежде всего касается рассмотрения самого объекта, несущего информацию о тоне. В отличие от решения задачи распознавания последовательности слов, где ориентиром является совокупность частот, задача распознавания тональности не может опираться на общепринятые математические методы обработки и распознавания волн. Рассмотрение вопросов распознавания тональности обычно выходит за рамки широкого обсуждения в этих методах, а также весьма ограничен круг предложений алгоритмического разрешения этой задачи. Поэтому рассматривается на примерах тональная составляющая, прежде всего, фонемы, которая может быть получена специальными методами, отличными от традиционных методов. Предлагаются методы, опирающиеся на установление отношений между характерными точками и представление конфигурации этих отношений в виде матричной модели. Фактически, такая модель является качественной характеристикой тональности, не зависящей от значения амплитуд, что позволяет сравнивать разные проявления тональности, выраженные в громкости произношения и в особенностях артикуляционного аппарата конкретного человека. Само сравнение предполагает наличие качественной меры, которая позволяет отражать степень различия рассматриваемых фонем в речевом потоке. Все эти вопросы обсуждаются в данной статье.

Труды Московского авиационного института, № 104, с. 25 (2019) | Рубрика: 13.05

 

Савченко А.В., Савченко В.В. «Метод измерения частоты основного тона речевого сигнала для систем акустического анализа речи» Измерительная техника, № 3, с. 59-63 (2019)

Разработан новый метод измерения частоты основного тона речевого сигнала с повышенной помехоустойчивостью. Проблема защиты от интенсивного фонового шума в нём решена путём частотной селекции вокализованных отрезков речевого сигнала по схеме с гребенчатым фильтром межпериодного накопления. Эффективность метода исследована теоретически и экспериментально с помощью разработанного многоканального частотного измерителя для акустического анализа речи. Показано, что при отношении сигнал-шум 10 дБ и выше погрешность метода не превышает 2%.

Измерительная техника, № 3, с. 59-63 (2019) | Рубрика: 13.05

 

Егоров А.В., Поляков В.В., Салита Д.С. Физические основы защиты информации (2014). 76 с.

Представлены основные теоретические сведения и подробные практические руководства, необходимые для выполнения лабораторного практикума по дисциплине «Физические основы защиты информации». Ключевые слова: шумовые помехи, акустические детекторы, акустические аолны, импульсный эхо-метод.

Физические основы защиты информации (2014). 76 с. | Рубрики: 02 10.08 13.05