Analysis of short unstructured documents using fuzzy significance scales and special procedures for economic information integration
Полная версия
Analysis of short unstructured documents using fuzzy significance scales and special procedures for economic information integration
Жанр: информатика и вычислительная техникаинформацияклассификациямодели и методикистатистический анализэкономическая интеграция
Язык: Английский
Год издания: 2019
Добавлена:
В статье предложен новый подход к автоматическому анализу коротких сообщений, поступающих на Интернет-порталы и электронную почту органов государственной власти. Разработанная модель позволяет выполнять классификацию коротких неструктурированных текстовых документов при недостатке статистической информации и слабой степени пересечения тематических рубрик. Входными данными для алгоритма построения модели является множество рубрик и обучающая выборка, а его результатом являются нечеткие весовые коэффициенты значимых слов тезаурусов рубрик, что обеспечивает корректное представление характеристик документа и работу алгоритма рубрицирования (классификации).