Российский фонд
фундаментальных
исследований

Физический факультет
МГУ им. М.В.Ломоносова
 

Изв. ЮФУ. Техн. н. 2023, № 5

 

Гладков Л.А., Гладкова Н.В., Курейчик В.М. «Подсистема автоматического аннотирования текстов на основе методов машинного обучения» Известия Южного федерального университета. Технические науки, № 5, с. 138-151 (2023)

Рассматривается задача автоматического аннотирования текстов. Рассмотрена постановка задачи. Обоснована актуальность и важность разработки эффективных методов и программных систем для решения задачи автоматического реферирования текстов в современных информационных системах. Приведены определения понятий «данные» и знания». Описан перечень задач, относящихся в направлению Data Mining. Подробно описана задача Text Mining и существующие методы ее решения. Рассмотрена задача реферирования текстов. Выделены основные этапы решения задачи суммаризации. Описаны основные методы автоматической обработки текста, выделены их достоинства и недостатки. Подробно рассмотрены методы реферирования и квазиреферирования. Проведен сравнительный анализ эффективности различных методов реферирования и квазиреферирования, выделены их ключевые достоинства и недостатки. Приведено краткое описание архитектуры encoder-decoder с точки зрения использования данной архитектуры в разрабатываемом алгоритме автоматического реферирования текстов. Приведено описание модели рекуррентных нейронных сетей, отмечены достоинства и недостатки подобных моделей. Рассмотрены архитектуры рекуррентной нейронной сети применительно к решению задачи автоматического реферирования текстов. Приведено описание модифицированной модели рекуррентной нейронной сети – нейронной сети долгой краткосрочной памятью. Приведено описание предложенного алгоритма автоматического реферирования и значения настроек его основных параметров. Приведено описание разработанной программной подсистемы автоматического реферирования. Выполнено компьютерное моделирование и приведены результаты, полученные в ходе вычислительных экспериментов. Выполнена оценка качества полученных решений. Определены оптимальные параметры разработанной программной системы. Сформулированы направления продолжения исследований.

Известия Южного федерального университета. Технические науки, № 5, с. 138-151 (2023) | Рубрика: 17