Гибридный алгоритм сравнения документов в формате LaTeX
Полная версия
Гибридный алгоритм сравнения документов в формате LaTeX
Рассматривается задача построения различий LaTeX документов. Каждый документ представляется в виде синтаксического дерева, узлы которого называют токенами. Тексты разбиваются на фрагменты, границы которых соответствуют токенам. Строится отображение текстовых фрагментов и соответствующее отображение символов. Выделяются токены, соответствующие только удаляемым, только добавляемым или только не изменяемым символам. Для остальных токенов строится отображение деревьев алгоритмом Zhang-Shasha.