О поиске эквивалентных текстов

текст

Д. С. Бухаров

Жанр: программы интернет технические науки информатика и вычислительная техника текстовый материал поиск информации эффективные алгоритмы инструментальные средства

Язык: Русский

Год издания: 2016

Добавлена: 05.05.20

Серия «Прикладная информатика. Научные статьи»

Использование нейросетевых моделей в поведенческом скоринге

Беспроводные теги на основе Bluetooth-устройств

Профессиональные стандарты в области ИТ как фактор технологического и социального развития

О книге

Читать онлайн

В статье описан подход к формированию поискового множества, используемого при определении эквивалентов текста. Задача такого вида возникает при поиске дубликатов текста, определении авторства и возможного плагиата, организации библиотечного поиска, а также при создании поисковых систем Интернета. В подходе, представленном в статье, учитывается ряд особенностей: частотность слов, пунктуация, морфемная структура слов, регистр букв и артефакты текста (специфические цифро-буквенные сочетания). Разработанная программа протестирована на наборе данных, в число которых включены как оригиналы текстов, так и их специальным образом модифицированные варианты. В результате проведенного эксперимента определены слабые стороны подхода. Приведены варианты по улучшению разработанного программного средства и схема взаимодействия модулей разработанной программы после модификации.

О поиске эквивалентных текстов

Скачать бесплатно книгу «О поиске эквивалентных текстов»

fb2.ziptxttxt.ziprtf.zipa4.pdfa6.pdfepubfb3

Читать онлайн «О поиске эквивалентных текстов»

Другие книги автора

Об автоматизации настройки устройств автоматической ликвидации асинхронного режима с трапециевидной характеристикой

Д. С. Бухаров