КонтрПлагиат методом перефразирования и рерайта для антиплагиат ВУЗ. Как повысить оригинальность текста за несколько часов и пройти проверку с первого раза

Полная версия

КонтрПлагиат методом перефразирования и рерайта для антиплагиат ВУЗ. Как повысить оригинальность текста за несколько часов и пройти проверку с первого раза

текст

Алексей Вячеславович Мустакимов

Жанр: рукоделие и ремесла книги о компьютерах другие справочники

Язык: Русский

Год издания: 2024

Добавлена: 01.08.24

О книге

Читать онлайн

Настройки чтения

Размер шрифта

Высота строк

Поля

<1 2 3 4 5 >

На страницу:

Перейти

2 из 5

Таким образом, КонтрПлагиат – система принудительных мер, сочетающих в себе вариативность инструментов глубокого рерайта и копирайтинга, усиленных принудительным изменением шинглов (биграмм), дополненного методом сверки текста рерайта с текстом донора по показателю Ш2 (сверка шинглов, состоящих из 2 слов). КонтрПлагиат изменяет весь текст, в том числе и термины, при показателе Ш2 более 95% цель КонтрПлагиата достигается – работа набирает высокий показатель уникальности.

КонтрПлагиат применяется для успешного прохождения проверки в антиплагиат, версии ВУЗ, как правило для других систем поиска заимствований КонтрПлагиат не нужен, там достаточно глубокого рерайта.

1.2. Методы которые не работают в антиплагиат ВУЗ

Ниже обобщены методы, в которых присутствует как размытая, так и четка грань, связанная со студенческой «оптимизацией» рерайта, например методы некоторые способы демонстрируют элемент легальности, а использование технического кодирования, содержат состав мошеннических действий.

Изменение размера предложений и замена знаков препинания

Метод предполагает манипуляции с предложениями – простые объединить в сложные, сложные разделить на простые, метод – практически не влияющий на оригинальность текста, т.к. шинглы не изменяются. Максимальное повышение оригинальности, которое можно достичь с помощью этого метода, составляет всего 1—2%. Кроме того, такой подход требует значительных временных затрат. Применение данного метода в сочетании с рерайтом – эффективно, т.к. точка является своеобразным маркером, наравне с запятой.

Удаление абзацев и приведение текста к массиву на несколько страниц

Данный подход не изменяет шинглы, следовательно не является способом повышения уникальности. Изменяет общий хеш абзацев, но из наших пояснения выше явствует, что начальным анализом является анализ хеша шинглов а не хеша абзацев, поэтому изменение размера абзацев не влияет на уникальность при проверке в АП ВУЗ.

Принудительные и автоматические переносы

Принудительный перенос – постановка дефиса без учета требований русского языка (прогр-амма, пров-ерки, заимс-твован-ие). Метод может применятся в таблицах, на небольших участках текста до 500 знаков, с отключением функции проверки документа.

Автоматические переносы, хотя и представляют собой рабочую идею, дают результаты прибавки оригинальности лишь в небольшом объёме. Кроме того, в некоторых учебных заведениях запрещено использование автоматической расстановки переносов, это требуют соответствующие методические рекомендации.

Стоит отметить, что расстановка переносов в программе Word выполняется практически мгновенно, что позволяет воспользоваться этим методом без трудозатрат. Ещё лучший результат даёт копирование текста с переносами в блокнот, а затем вставка его обратно, в текст работы. Правая граница текста выравнивается с помощью пробелов между словами строки текста.

Мертворожденный метод – замена кириллицы на буквы другого алфавита (латиница, греческое письмо)

Когда то, лет 20 тому назад АП ВУЗ общался со своими клиентами на равных. Именно тогда нами был предложен в чате метод замены кирилистической буквы «о» на греческий, похожий символ. Это давало 100% уникальность в бесплатной версии проверки на плагиат.

Разработчики предложение не прокомментировали, но метод перестал работать в течении недели.

Замена букв русского языка на буквы других языков, таких как латиница или греческое письмо, все еще используется студентами, этим методом грешат зарубежные студенты, которых у нас становится все больше. Метод эффективен только при использовании в очень небольших объемах, например, в таблицах.

Следует отметить, что преподаватель может заметить нетипичные буквы, так как они отличаются от обычного написания. Если использовать этот метод в большем объеме, антиплагиат может выявить его использование и присвоить статус подозрительного документа. С учетом лишь 1—3 процентов повышения оригинальности, нет смысла тратить свои временные ресурсы и репутацию на этот метод.

Невидимый скрытый текст (белый или уменьшенный, или за пределами документа)

Скрытый текст использовался в прошлом в различных вариантах. Например, одним из способов было вставлять абзац размером несколько строк и делать его белым, а также уменьшать размер шрифта до единицы. Данные методы дискредитируют проверяемый файл, и вы получите сообщение о подозрительном документе – наличие вставок и т. д.

Другой подход заключался в создании надписей, в которых содержался текст, а сами надписи перемещались за пределы документа. Сегодня использование такого метода считается неприемлемым, т.к. антиплагиат ВУЗ все это подметит и свое слово в отчете скажет, выделив его красным транспарантом. Впрочем, насколько можно судить, некоторые методы вставок все еще пользуются популярностью и относятся к методам кодирования.

Вставка знаков, символов отличных от текста или кириллицы

Техническое кодирование, именуется по-разному, знаки в работе, символы и т. д. Метод технического кодирования применяет разные подходы, его цель – обман скрипта проверки системы антиплагиат. Любой метод технического «повышения оригинальности» текстов, с течением времени, становится известен и пресекается системами проверок, проверяемому документу присваивается статус подозрительного документа.

Практически все системы антиплагиата выявляют кодирование, да и сам проверяющий может наглядно увидеть элементы кодировки, см. рис. 7.

Рисунок 7 – Пример технического повышения оригинальности текстов, кодирование текста точками

Итак, все еще находящим применение методом для повышения оригинальности текста является вставка в слова невидимых в WORD символов. Метод называется кодированием, его преследуют все ВУЗы. Например, вместо слова «покакзатель» можно написать «пока затель». Если не злоупотреблять такими словами, это повышает оригинальность текста.

Техническое кодирование текста на сайтах

Знаки, символы, кодирование, к которому прибегают если осталось совсем немного времени до сдачи работы особенно опасно, рисунки выше это демонстрируют.

Кодирование можно убрать в блокноте, или, если применено перемешивание слов, рис. 8., путем распознавания сконвертированного в PDF документа.

Рисунок 8 – Кодирование методом перемешивания слов (метод не повышает уникальность при проверке в АП ВУЗ)

Если вы попадете на фоновое обновление ПО антиплагиата, техническое кодирование будет обнаружено, и вам придется потратить еще больше времени на переписывание работы. Кроме того, кодирование всегда можно обнаружить простым способом, скопировав чистый текст в обычный блокнот, где будут видны невидимые символы, перемешивание слов или пропуски букв и слов.

Мы не рекомендуем использовать этот метод никогда, хотя с экономической точки зрения это может показаться оправданным и позволяет быстро повысить оригинальность документа хоть до 100%.

Обработка с помощью макросов

Переработка текста с помощью макросов фактически является методом технического кодирования. Разница заключается в том, что кодирование обычно выполняется сервисами, в то время как макросы могут быть скачаны и запущены на компьютере в среде Word.

Возможно, вам повезет, и вы найдете рабочий макрос с надежным способом обхода антиплагиат, однако, с учетом отечественного рынка рерайта академических работ, все, что работает приносит доход, поэтому в интернет нет рабочих макросов.

Любой внимательный научрук обнаружит попытку обхода за несколько минут. Поэтому наш совет – не стоит использовать такие методы для повышения оригинальности работы и не стоит тратить время на поиск граального макроса.

Разное содержание работы для проверки и в реальности

Различные варианты содержания работы для проверки и в реальности представляют собой явно неприемлемый и морально неэтичный подход к повышению оригинальности, который следует исключать во всех случаях.

Такой подход позволяет успешно пройти проверку на Антиплагиат, но скорее всего несоответствие будет обнаружено достаточно быстро, т.к. помимо научного руководителя за качество студенческих работ отвечают назначенные специалисты, которые просматривают работы и отчеты АП ВУЗ достаточно дотошно. В лучшем случае, придется представить другую работу для проверки. В худшем случае, это может привести к наказаниям, вплоть до отчисления.

Специализированный софт для быстрого и «качественного» повышения уникальности текстов

Такого софта не существует, а в ближайшее время не появится в силу того, что современные, бесплатные онлайн-переводчики способны дать достойный результат по показателю Ш2=70—85, а нейросети могут повысить уникальность до 100%. Сравните объемы инвестиций в эти сервисы, например в GPT. Указанный сервис бесплатен в версиях GPT-4o, GPT-3.5, а в ближайшие месяцы бесплатным станет и GPT-4. В чем смысл покупки сомнительно работающих программ?

Добавление ошибок (слияние слов, пробелы в словах, опечатки)

Насыщение текста ошибками, редко применяемая практика, но на самом деле все еще является популярным способом «повышения» уникальности текста. Аксиома проста, чем больше ошибок в тексте, тем выше его уникальность.

Следует помнить, что использование большого количества ошибок не рекомендуется – не более 1—2 опечаток на страницу. Если текст будет подчеркнут красным, возможно он и прибавит проценты, но точно не пройдет проверку глазами человека.

Проверка текстов в антиплагиат. ВУЗ перед вставкой в работу

Логично предположить, что если собрать в файл несколько тысяч листов текста, то проверка покажет, что является плагиатом, а что является уникальным текстом.

Метод имеет право на жизнь, с учетом специфики:

– антиплагиат учитывает совокупность, а не фрагментарность, поэтому нет 100% гарантии, что после включения «уникального» текста в работу он не станет плагиатом;

– накидать в файл проверки дипломные и курсовые работы можно, но как правило все эти работы уже отметились в индексе АП ВУЗ, здесь может повезти, вы найдете свежую работу, которая еще не ушла в кольцо ВУЗов.

Выбор редких тем работ

Решение выбрать сложную и непопулярную тему не дает предсказуемого результата, что связано с дефицитом материалов. Возможно текст, посвященный такой теме, обладает высокой степенью оригинальности, однако необходимость в длительном поиске и анализе материалов может значительно затруднить процесс написания работы.

Существует вероятность, что часть необходимых исходных данных будет недоступна или сложна для обработки. Поэтому, у нас нет однозначной рекомендации что лучше, выбрать сложную тему, по которой нет материалов или выбрать тему, по которой масса материала, но он уже использован не одной тысячей авторов. Примером заспамленной темы является возрастная характеристика детей, как правило младшего, дошкольного возраста, ее содержит почти каждая педагогическая работа.

Таким образом, в миллиардно базе индекса АП ВУЗ есть все, даже самые экзотичные тексты, экзотичных тем, при выборе темы исследования стоит лишь один вопрос, насколько высокочастотной является тема. Если ее писали миллионы раз, то вам может понадобиться добиваться отличия текста рерайта от источника на уровне Ш2 = 100%.

2. Википедия перефразирования для антиплагиат ВУЗ: работающие (Р) и частично работающие методы (ЧР)

ЧР – Лёгкий, поверхностный рерайт и перефразирование

Поверхностный, легкий рерайт представляет собой упрощённый метод модификации текста, путем перефразирования, который заключается в замене слов и фраз синонимами, изменении грамматических конструкций и перефразировании предложений. Показатель Ш2 для легкого рерайта находится на уровне до 80%, при сверке по шинглам, состоящим из двух слов, рис. 9.

Поверхностный рерайт можно делать используя метод пересказа, или, используя приложение 1 разбивать n-граммы текста авторским контентом. Ниже приведена иллюстрация процесса автоматизации этого метода.

Рисунок 9 – Пример сверки двух текстов по методу Ш2, левое окно, текст переведенный на китайский и затем на русский, правое окно – текст источник, показатель отличия см. внизу, справа

Лёгкий рерайт не требует глубоких знаний стилистики и лингвистики, что делает его доступным для широкого круга пользователей. Поверхностное перефразирование может быть достаточно эффективным подходом для повышения оригинальности текста в системах проверки заимствований, основанных на элементарном сравнении слов и фраз (РуКонтекст, антиплагиат ру, бесплатная версия).

Антиплагиат ВУЗ использует более сложные алгоритмы анализа текста, основанные на методе Ш2, поэтому легкий рерайт не преодолеет порог срабатывания модуля поиска перефразирования и модуля поиска рерайта, который лежит на границе выше 80%.

Ниже приведены сравнения эффективности двух онлайн-переводчиков, примененных для поверхностного рерайта текстов, сверка отличия осуществлена по параметру Ш2 (сверка шинглов, состоящих из двух слов), табл. 1.

Таблица 1 – Показатель отличия текстов Ш2 для онлайн-переводчиков DEEPL и translate. google

Из таблицы 1 видно, что большее отличие текстов, по сумме балов, достигает translate. google, абсолютными лидерами, дающими наибольшее отличие выступают: финский, китайский (традиционный), китайский (упрощенный), эстонский, японский языки.

Переводчик DEEPL демонстрирует не плохие результаты отличие текста по показателю Ш2 на следующих языках: китайский (традиционный), китайский (упрощенный), финский, эстонский, венгерский. Как заверяют разработчики DEEPL, переводчик самый точный в мире.

Производительность – в среде файлового перевода translate. google – 100 тыс. знаков в минуту, в интерфейсе – 10—15 тыс. в минуту. В интерфейсе DEEPL, 50 тыс. знаков в минуту.

В целом, для поверхностного рерайта можно рекомендовать финский, китайский и эстонский языки. Уровень поверхностного рерайта лежит в границах менее 80% отличия текстов по показателю Ш2.

ЧР – Глубокий рерайт и перефразирование

Глубокое перефразирование текстов актуально для всех сервисов проверки на уникальность, несмотря на значительную трудозатратность. Основная задача такого процесса заключается в систематичном внедрении новых слов после второго-четвёртого слова или замене существующих 2, 3, 4 слов. Что и как менять, какой это дает результат, показывает Приложение 1. Аксакалы традиционных школ рекомендуют текст прочитать и напечатать его своими словами по памяти, пересказать, другими словами. Метод имеет право на жизнь, хотя при наличии в доме пылесоса редкий эстет согласиться подметать пол зубной щеткой.

Глубокий рерайт подразумевает отличие текстов Ш2 на уровне более 80%. Исходя из таблицы 1, справедливо задаться вопросом, как онлайн-переводчики способны помочь в глубоком перефразировании. Обратимся к DEEPL и выполним цепочный перевод – русский – китайский (традиционный) – финский – эстонский – венгерский, это дает показатель отличия Ш2 – 85%.

Рисунок 10 – Цепочный перевод – русский – китайский (традиционный) – финский – эстонский – венгерский, это дает показатель отличия Ш2 – 85%

Как видно из рисунка 10, текст рерайта требуют вычитывания, так как содержит неточности, например, текст рерайта содержит фразу – «уличных праздников», вместо «уличного досуга». В целом текст читабелен и не составит особого труда его подправить.

В следующем эксперименте выполним круговой перевод – русский – китайский (традиционный) – русский – финский – русский – эстонский – русский – венгерский – русский, рис. 11.

Рисунок 11 – Пример последовательного перевода, ин. язык-русский + ин. язык – русский…

Из рисунка 11 видно, что вместо «уличных праздников» появилась фраза «уличных фестивалей», текст обладает меньшим отличием, Ш2 = 81%, однако читабельность текста выше.

Производительность – в среде файлового перевода translate. google – 50 тыс. знаков в минуту, в интерфейсе – 5—10 тыс. в минуту. В интерфейсе DEEPL, 10 тыс. знаков в минуту.

Помимо переводчиков, сегодня только ленивый не пользуется услугами генеративных моделей ИИ-GPT. Протестируем результаты трех сервисов. В своем исследовании, с целью доказательности приведем скриншоты окна с текстом исходником, командой, ответом сервиса и результатом сравнения параметра Ш2.

ЧР Применение ChatGPT, Copilot, Gemini

Всем известен посыл маркетологов относительно перспектив рерайтеров, «они останутся без работы». Ниже мы проанализируем так ли это, протестировав три нейросети мирового уровня: ChatGPT, Copilot, Gemini.

Сходства протестированных ИИ заключено в следующем:

– Все три инструмента используют передовые языковые модели для обработки и генерации текста. ChatGPT и Copilot основаны на моделях GPT от OpenAI, а Gemini использует аналогичные технологии от Google.

– ChatGPT, Copilot и Gemini доступны через веб-интерфейсы и мобильные приложения, что делает их удобными для использования в любом месте и в любое время.

Как видно из анализа сходств, различие используемых генеративных моделей следующее:

– ChatGPT, известен своей универсальностью и креативностью. Он может генерировать текст на основе широкого спектра запросов и часто используется для создания контента, написания эссе и научных статей.

– Copilot, интегрирован в продукты Microsoft, такие как Office и Visual Studio, что делает его идеальным для пользователей этих платформ.

– Gemini, используя отличную генеративную модель является альтернативным выбором для пользователей, известен своей способностью помогать в создании статей и других текстов.

Согласно анализу качества текстов:

– Copilot – показал наивысшую точность в интерпретации данных и выполнении задач, связанных с анализом текста, другими словами, текст, достаточно часто, изменяется на недостаточно высокий процент, т.к. решение «боится отойти» от текста контекста.

– ChatGPT, отличается высокой степенью креативности, например вместо «полегших сортов пшеницы» мы можем получить фразу – «не прямостоячие сорта пшеницы».

– Gemini, удовлетворительно справляется с базовыми задачами рерайта, однако насыщает текст предельным количеством маркеров генеративности.

Как видно, ChatGPT, Copilot и Gemini предлагают определенные возможности для рерайта академических текстов, каждый инструмент имеет свои сильные и слабые стороны и особенности.

ChatGPT

GPT (Generative Pre-trained Transformer) – это серия моделей искусственного интеллекта, разработанных компанией OpenAI. Модели известны своей способностью генерировать текст, который, как считают разработчики, трудно отличить от написанного человеком. Наиболее известные версии включают GPT-3 и GPT-4. Эти модели обучены на огромных объемах текстовых данных и способны выполнять широкий спектр задач, от написания эссе до создания кода.

GPT используется в различных областях, включая создание контента, автоматизацию общения, перевод текстов, написание кода и многое другое. Модель также может использоваться для анализа данных и предоставления рекомендаций. GPT использует архитектуру трансформеров, что позволяет модели эффективно обрабатывать и генерировать текст.

Как правило пользователи GPT относится к генеративным возможностям с излишней наивностью, формирую примитивные инструкции, например «Выполни глубокий рерайт на русском языке», рис. 12, примитивный запрос порождает примитивный ответ с примитивным результатом, рис. 14.

Рисунок 12 – Оправка текста на GPT-рерайт с инструкцией: выполни глубокий рерайт текста на русском языке

Рисунок 13 – Ответ ChatGPT

Рисунок 14 – Сверка контекста (правое окно) с GPT-рерайтом (левое окно) по методу Ш2=52

Как видно из рисунка 14, показатели «глубокого перефразирования» GPT находятся на достаточно низком уровне, Ш2 = 52%, в этом GPT проигрывает онлайн-переводчикам, которые показали, на китайском языке Ш2 = 68%, на финском 72%. Как видно из рисунка 14, текст практически не содержит неточностей, о которых мы упоминали, понятие «уличный досуг» изложено без ошибки.

Copilot

По мнению Microsoft, Copilot – это инновационный инструмент, разработанный для повышения продуктивности и улучшения взаимодействия с пользователями.

Copilot тесно интегрирован с приложениями Microsoft 365, такими как Word, Excel, PowerPoint и Outlook. Это позволяет пользователям получать интеллектуальные подсказки и автоматизировать рутинные задачи прямо в привычных приложениях.

Copilot использует модели искусственного интеллекта для анализа данных и предоставления рекомендаций. Copilot может автоматизировать множество задач, таких как создание отчетов, анализ данных и подготовка презентаций.

Проделаем аналогичные действия с ИИ Copilot, рис. 15—17.

Рисунок 15 – Отправка инструкции и контекста в Copilot

Рисунок 16 – Получение ответа, в виде текста рерайта

Рисунок 17 – Сверка текстов по методу Ш2, контекст см. в правом окне

Как видно из рис. 17, Copilot сделал классический поверхностный рерайт, с отличием текстов по показателю Ш2 = 53, что может оказаться недостаточным для систем антиплагиат. Причина такого ответа ИИ – примитивный запрос, он не конкретизирует сущности «глубокого рерайта».

Gemini. Google

Gemini разработан с нуля для работы с текстом, изображениями, аудио, видео и кодом. Gemini Pro 1.5, одна из версий модели, способна обрабатывать вдвое больше данных по сравнению с предыдущими версиями. Модель используется для различных целей, включая создание контента, планирование, обучение и многое другое. Google также представила облегченную версию Gemini под названием 1.5 Flash, оптимизированную для чат-приложений, видео и подписей к изображениям.

Ниже, рис. 18 и 19 показан пример загрузки в интерфейс примитивного запроса.

Рисунок 18 – Загрузка инструкции и текста в интерфейс gemini. google

Рисунок 19 – Результат сверки текста рерайта gemini. google

Gemini. Google внес в текст свой незабываемый колорит, создав массу маркеров генеративности в виде нумерованных и маркированных списков, тавтологии (Игры: Сюда относятся игры …), рис. 19. Текст Gemini увеличился в объеме почти на 1000 знаков, и его редактура займет достаточно много времени, процент уникальности по показателю Ш2 = 71%, что приравнивает эту нейросеть к онлайн-переводчикам, которые создают гораздо меньше текстовых проблем.

После вставки сгенерированного текста в работу необходимо, выделив весь текст, указывать правописание (меню: рецензирование – язык – язык проверки правописания – русский).

Производительность – примерно одинаков для любой нейросети – 100 тыс. знаков в минуту.

Р Использование GPT с применением параметров

Мы уже отмечали, что пользователи GPT предпочитают использовать примитивные запросы, однако есть правило, каков вопрос – таков ответ. Для многих вопросы оптимизации рерайта не праздный вопрос, а вопрос выживания или заработка.

<1 2 3 4 5 >

На страницу:

Перейти

2 из 5