bannerbanner
О поиске эквивалентных текстов
О поиске эквивалентных текстов

Полная версия

В статье описан подход к формированию поискового множества, используемого при определении эквивалентов текста. Задача такого вида возникает при поиске дубликатов текста, определении авторства и возможного плагиата, организации библиотечного поиска, а также при создании поисковых систем Интернета. В подходе, представленном в статье, учитывается ряд особенностей: частотность слов, пунктуация, морфемная структура слов, регистр букв и артефакты текста (специфические цифро-буквенные сочетания). Разработанная программа протестирована на наборе данных, в число которых включены как оригиналы текстов, так и их специальным образом модифицированные варианты. В результате проведенного эксперимента определены слабые стороны подхода. Приведены варианты по улучшению разработанного программного средства и схема взаимодействия модулей разработанной программы после модификации.

Скачать бесплатно книгу «О поиске эквивалентных текстов»

fb2.ziptxttxt.ziprtf.zipa4.pdfa6.pdfepubfb3

Читать онлайн «О поиске эквивалентных текстов»

Спасибо за оценку! Будем признательны, если Вы оставите комментарий.
Добавить отзыв