Рубрицирование текстовой информации на основе голосования интеллектуальных классификаторов

PDF-книга
Добавлено 01.12.2020
Автор: М. И. Дли
Жанр: Информатика и вычислительная техника
Год издания: 2020
Серия: Прикладная информатика. Научные статьи
Оценка: 0.0
Рецензии в лоцмане: нет рецензий
Скачать: pdf
Аннотация

Одним из приоритетов государственной политики России выступает практическая реализация концепции электронного правительства. Важным элементом этой концепции является организация эффективного взаимодействия органов власти и граждан, которая, помимо оказания государственных услуг, должна включать в себя обработку электронных обращений (заявлений, жалоб, предложений и т.п.). Исследования показывали, что скорость и оперативность обработки обращений в значительной степени зависит от качества определения тематических рубрик, т.е. решения задачи рубрицирования. Проведенный анализ обращений граждан, поступающих на электронную почту и официальные сайты различных органов власти, выявил ряд специфических особенностей (небольшой размер, наличие ошибок в тексте, свободный стиль изложения, рассмотрение нескольких проблем), которые не позволяют успешно применять традиционные подходы к их рубрицированию. Для решения указанной проблемы было предложено использовать различные методы интеллектуального анализа неструктурированных текстовых данных (в частности, нечетко-логические алгоритмы, нечеткие деревья решений, нечеткие пирамидальные сети, нейро-нечеткие классификаторы, сверточные и рекуррентные нейронные сети). В статье описаны условия применимости шести интеллектуальных классификаторов, предложенных для рубрицирования электронных обращений граждан. В их основе лежат такие факторы, как размер документа, степень пересечения тематических рубрик, динамичность их тезаурусов и объемом накопленной статистической информации. Для ситуации, когда конкретная модель не может произвести однозначный выбор тематической рубрики, предложено использовать метод голосования классификаторов, который позволяет существенно снизить вероятность ошибок рубрицирования на основе взвешенного агрегирования решений, полученных несколькими моделями, отобранными с помощью нечетко-логического вывода.

Полная версия

Читать онлайн


Отзывы о книге Рубрицирование текстовой информации на основе голосования интеллектуальных классификаторов
Нет отзывов
Добавить отзыв

Чтобы добавить отзыв Вам нужно зарегистрироваться или авторизироваться