Чистиков П.Г., Хомицевич О.Г. «Автоматическое определение границ предложений в потоковом режиме в системе распознавания русской речи» Вестник Московского государственного технического университета имени Н.Э. Баумана (МГТУ). Серия: Приборостроение, № S, с. 115-123 (2011)
Описан подход к решению задачи деления речевого сигнала на предложения, который является необходимым шагом для автоматического распознавания слитной речи. Представлена модель, которая предсказывает вероятности границ предложений, основываясь только на просодической информации – частоте основного тона, энергии и длине пауз. Алгоритм работает в потоковом режиме и определяет вероятность границы предложения для каждого разрыва основного тона. Далее эти данные используются как дополнительная информация для языковых моделей, применяемых в системе распознавания.
Вестник Московского государственного технического университета имени Н.Э. Баумана (МГТУ). Серия: Приборостроение, № S, с. 115-123 (2011) | Рубрика: 13.05
Кореневский М.Л., Пономарева И.А., Левин К.Е. «Потоковая классификация звукозаписей новостных сообщений русскоязычных средств массовой информации» Вестник Московского государственного технического университета имени Н.Э. Баумана (МГТУ). Серия: Приборостроение, № S, с. 124-132 (2011)
Описана методика тематической классификации потока речевых данных с использованием предварительной разметки слитной речи на предложения. Показано, что использование информации о границах предложений повышает надежность тематической классификации потока речи в среднем на 25–30%. Максимальная надежность классификации достигается при совместном использовании порогового значения для числа распознанных слов и информации о границах предложений. Однако, и в случае применения только информации о границах предложений (без учета числа распознанных слов) полученные результаты демонстрирую высокую степень надежности.
Вестник Московского государственного технического университета имени Н.Э. Баумана (МГТУ). Серия: Приборостроение, № S, с. 124-132 (2011) | Рубрика: 13.05

