bannerbanner
Применение нечетких деревьев решений для рубрицирования неструктурированных текстовых документов небольшого размера
Применение нечетких деревьев решений для рубрицирования неструктурированных текстовых документов небольшого размера

Полная версия

Применение нечетких деревьев решений для рубрицирования неструктурированных текстовых документов небольшого размера

Ежедневно на Интернет-порталы органов государственной власти поступает большое количество электронных обращений (заявлений, предложений или жалоб), представленных в неструктурированном текстовом виде. Качество и скорость автоматической обработки указанных сообщений напрямую зависит от правильности их классификации (отнесения к конкретной предметной области), в основе которой лежат их отличительные особенности. Однако специфика таких сообщений (небольшой размер, наличие ошибок, отсутствие четкой структуры и т.д.) не позволяет использовать известные методы рубрицирования текстовых документов. Авторами разработана модель рубрицирования электронных неструктурированных текстовых документов с учетом синтаксических связей и ролей слов в предложениях на основе нечеткого дерева решений. Построение дерева решений основано на анализе степени пересечений словарей рубрик, а также расстояний между рубриками в n-мерном пространстве признаков. Данная модель позволяет более точно рубрицировать электронные неструктурированные текстовые документы в условиях взаимосвязанных рубрик, а также повысить оперативность обработки поступивших документов.

Читать онлайн «Применение нечетких деревьев решений для рубрицирования неструктурированных текстовых документов небольшого размера»

Спасибо за оценку! Будем признательны, если Вы оставите комментарий.
Добавить отзыв

Другие книги автора