Курейчик В.В., Герасименко П.С. «Основные подходы к извлечению текстовой информации (обзор)» Известия Южного федерального университета. Технические науки, № 4, с. 6-14 (2024)
Данная статья посвящена обзору известных и современных подходов, методов и алгоритмов полнотекстового поиска. Описана краткая история решения задачи поиска в неструктурированных текстовых данных, её развитие и актуальность. Сформулирована основная задача поиска в текстовых данных. Приведено определение индекса базы данных. В общем виде определена целевая функция поисковой информационной системы и описаны возможные компромиссные вариации её параметров при решения различных прикладных задач. Приведена обобщённая архитектура современной поисковой информационной системы с разделением задачи поиска на две фазы: первичное извлечение релевантных записей и их последующее ранжирование для формирования окончательных результатов поиска. Даны базовые описания основных алгоритмов и методов полнотекстового поиска, таких как: поиск по термам (логический поиск), поиск с помощью деревьев и их разновидностей (B-деревья, UB-деревья, tries), поиск на основе n-грамм (в том числе поиск на основе частотного представления), использование векторной модели пространства (VSM), поиск на основе инвертированного (обратного) индекса, поиск с использованием аппарата нечёткой логики и биоинспирированных методов. Приведены основные достоинства и недостатки этих методов, описана их применимость в различных условиях, а также рассмотрены возможные методы оптимизации поиска текстовых данных для улучшения точности, скорости поиска и эффективности использования ресурсов. Представлены возможные перспективные направления в области решения задачи первичного извлечения информации. Приведены некоторые способы определения сходства текстовых записей для решения задачи ранжирования на основе аппарата нечёткой логики. Затронуты вопросы повышения релевантности первичного извлечения с помощью методов искусственного интеллекта, нейронных сетей, аппарата нечёткой логики и биоинспирированных методов, в частности методы расширения поискового запроса и/или расширения обрабатываемых текстовых записей. Описано влияние граничных условий построения поисковой системы на повышение её эффективности. В заключение статьи подводятся итоги обзора и обсуждаются перспективы дальнейшего развития различных методов полнотекстового поиска.
Известия Южного федерального университета. Технические науки, № 4, с. 6-14 (2024) | Рубрика: 17
Егорчев А.А., Пашин Д.М., Сарамбаев Н.А., Фахрутдинов А.Ф. «Анализ систем определения и классификации эмоций человека по данным звукового потока» Известия Южного федерального университета. Технические науки, № 4, с. 91-100 (2024)
В современной быстро меняющейся и требовательной рабочей среде способность быстро и точно оценить эмоциональное состояние сотрудника имеет решающее значение для защиты человеческих жизней и снижения материальных рисков. Эмоциональное благополучие играет важную роль в обеспечении безопасности на рабочем месте, производительности труда и общего психического здоровья. Поэтому разработка эффективных инструментов для мониторинга негативных эмоций и реагирования на них является актуальной задачей современности. Целью данного исследования является разработка алгоритма, способного классифицировать эмоции, используя аудиоданные, записанные смартфоном пользователя. Такой инструмент особенно полезен, если интегрирован в более широкую систему мониторинга здоровья, позволяющую оценивать показатели здоровья человека в режиме реального времени с помощью неинвазивных методов. В статье представлено новое решение, которое использует акустические сигналы, улавливаемые микрофоном смартфона, для обнаружения и классификации эмоций пользователя. Используя сверточные нейронные сети (CNNS), тип алгоритма глубокого обучения, известного своей эффективностью при обработке аудио- и визуальных данных, предлагаемая система может определять эмоциональное состояние пользователя. Модель CNN обучена распознавать признаки в аудиоданных, соответствующие различным эмоциональным проявлениям, фокусируясь на обнаружении негативных эмоций, таких как, гнев или печаль. Результаты исследования демонстрируют эффективность системы: частота ошибок при определении негативных эмоций составляет 19,5% для ложноположительных результатов (ошибки I рода) и 20,1% для ложноотрицательных результатов (ошибки II рода). Эти показатели указывают на ее потенциал для практического применения в реальных условиях. Внедряя это решение в существующие системы биомедицинского мониторинга, организации могут расширить свои возможности по мониторингу эмоционального благополучия сотрудников, потенциально предотвращая негативные последствия, такие как несчастные случаи на производстве или кризисы психического здоровья. Интеграция распознавания эмоций с помощью смартфонов в системы мониторинга состояния здоровья представляет собой значительный прогресс в области неинвазивного биомедицинского мониторинга, использующего повсеместное присутствие смартфонов и возможности машинного обучения.
Известия Южного федерального университета. Технические науки, № 4, с. 91-100 (2024) | Рубрики: 13.01 13.06
Вишняков Ю.М., Вишняков Р.Ю. «Формализация распознавания и идентификации семантических объектов в естественно-языковых текстовых потоках» Известия Южного федерального университета. Технические науки, № 4, с. 110-122 (2024)
Участившиеся случаи совершаемых в киберпространстве преступлений, в особенности, в социальных сетях и различного рода мессенджерах требуют создания адекватных и эффективных мер противодействия. Рост киберпреступлений настолько большой, что они уже могут нанести невосполнимый урон государству и обществу. Однако выявление подобного рода преступлений и преступных деяний, наталкивается на большие трудности, так как преступники присутствуют в социальных сетях виртуально и лингвистически, используют всячески их возможности и особенности для сокрытия следов своих преступлений. И, тем не менее, такими инструментами противодействия могли бы быть различного рода распознаватели и идентификаторы, способные автоматически обрабатывать естественный язык, выделять в нем специфические смысловые черты преступных деяний, распознавать и идентифицировать их. Поскольку по многим параметрам и обстоятельствам применительно к данным ситуациям использования нейросетевого подхода представляется нецелесообразным, в предлагаемой работе разрабатывается собственный формальный метод проектирования распознавателя для идентификации в текстовых потоках семантических объектов по их лингвистическим следам. Вводятся такие формальные понятия, как формальная модель семантического объекта, функция поведения, сценарий, лингвистический след, функция распознавания. Рассуждения строятся на теоретико-множественных положениях вычислительной теории семантической интерпретации и используют вычислительное представление смысла текстовых фрагментов для их сравнения на семантическую близость. Предлагаемый подход носит общий и универсальный характер, он позволяет формальным образом синтезировать распознаватель семантических объектов по их лингвистическим описаниям и поведению. В работе все рассуждения и построения иллюстрируются конкретными примерами.
Известия Южного федерального университета. Технические науки, № 4, с. 110-122 (2024) | Рубрика: 17

