Кто не спрятался, я не виноват

Школьники на контрольной подглядывают в учебник и тетрадь отличницы Маши, первокурсники на экзаменах достают шпаргалки и смартфоны, а выпускники скачивают дипломы из Интернета и применяют специальные программы, чтобы обмануть систему поиска заимствований.

kto-ne-spryatalsya-suvorova

Автор Марина СУВОРОВА, руководитель отдела бизнес-анализа компании «Антиплагиат»

По статистике запросов Google, ещё до 2008 г. почти никого не интересовало, как обойти «Антиплагиат», хотя сервис к тому времени существовал уже три года. Пик пользовательского интереса пришёлся на 2016-й. Вполне закономерно, так как проверка выпускных работ на заимствования стала обязательной¹.

¹. Приказ Министерства образования и науки РФ от 29 июня 2015 г. N 636 «Об утверждении Порядка проведения государственной итоговой аттестации по образовательным программам высшего образования — программам бакалавриата, программам специалитета и программам магистратуры» [Электронный ресурс]. — Режим доступа: http://ivo.garant.ru/#/document/71145690/ (дата обращения: 16.05.2019).

По статистике «Яндекса», за последний месяц (середина апреля — середина мая 2019 г.) запросы типа «Обойти "Антиплагиат"», «Повысить оригинальность», «Обмануть "Антиплагиат"» и аналогичные были показаны не менее 30 тыс. раз. С приближением сессии количество таких запросов только возрастает: времени у студентов на написание диплома остаётся мало, а на создание текста, который пройдёт проверку на заимствования, ещё меньше. С точки зрения студента, выход есть: обратиться в компанию, которая занимается повышением процента оригинальности. Найти в Интернете сайты таких организаций не составляет труда.

Почти всегда эти сервисы предлагают нечестные способы, предусматривающие техническое изменение документа или его текста. Притом что исходный вид документа не вызывает подозрений у проверяющего, для программы текст изменяется настолько, что в нём уже нельзя найти совпадения с источниками. Такие нечестные методы получили название обходов. Скажем сразу: это именно технические способы, не требующие особых интеллектуальных затрат, в отличие от рерайта или перефразирования, которые система «Антиплагиат», кстати, успешно находит².

². «Трое в лодке, нищета и собаки», или Как «Антиплагиат» ищет парафраз [Электронный ресурс]. — Режим доступа: https://habr.com/ru/company/antiplagiat/blog/422941/ (дата обращения: 16.05.2019).

Такие варианты изменения текста и повышения процента оригинальности требуют индивидуальной проработки документа, стоят гораздо дороже и поэтому менее популярны среди студентов.

В нашей практике мы видели множество различных технических способов обмануть систему. При всём многообразии их можно поделить на несколько групп по воздействию на документ.

1. Искажение написания слов

Первый обход, который применялся по отношению к системе «Антиплагиат», — это омоглифия³.

³. Омоглиф [Электронный ресурс] // Википедия. — Режим доступа: https://ru.wikipedia.org/wiki/%D0%9E%D0%BC%D0%BE%D0%B3%D0%BB%D0%B8%D1%84 (дата обращения: 16.05.2019).

Омоглифами называются символы, которые совпадают с оригинальными или очень похожи на них при написании, но абсолютно различны с точки зрения системы. Кириллические и латинские буквы а, о, е ничем не различаются для человека, но вообще непохожи для компьютера. Такие обходы система «Антиплагиат» давно и успешно игнорирует, так что они не влияют на результаты проверки.

2. Вставка ненужного текста

При таких обходах в текст документа добавляются символы, слова или даже целые страницы. Причём если просматривать документ в распечатанном виде или на экране компьютера, эти фрагменты чаще всего будут не видны. Тем не менее при загрузке документа в систему вставленный текст извлекается и портит исходный, меняя структуру слов и предложений. Примеров много: невидимые символы в середине слов; повторяющиеся слова в предложениях; специальные символы, которые меняют порядок букв в слове на обратный.

Второй вариант этого обхода — вставка больших фрагментов текста: абзацев и даже страниц. Это увеличивает общий объём текста, и доля заимствований сокращается. Чтобы обход сработал, текст должен быть уникальным с точки зрения системы «Антиплагиат», но при этом вовсе не обязан нести хоть какой-то смысл. Случаются и казусы. На заре развития системы кто-то добавил огромные фрагменты кого-то из классиков: Толстого или Достоевского. Ещё видели фразу «Хоть бы прокатило», повторенную на десятках страниц, видимо в качестве волшебного заклинания.

3. Сокрытие нужного текста

Этот способ работает по обратному принципу: в заимствованном тексте нужные фрагменты или слова скрываются от системы. Для проверяющего всё по-прежнему в порядке, а вот система, для которой часть текста становится недоступной, принимает его за оригинальный. До недавнего времени таким способом было использование формул, когда слова «упаковываются» в формулы и становятся невидимыми для системы.

К этой же группе обходов можно отнести вставку текста в виде картинки, так как графические изображения не распознаются системой и не учитываются при поиске заимствований. Правда, если включить режим OCR, при котором весь документ воспринимается как множество картинок, данный способ также теряет смысл.

Накопленный опыт, помощь наших пользователей и присланные ими примеры документов позволили провести детальный анализ различных вариантов обходов. На его основе мы выделили признаки, которые сигнализируют о наличии технических способов обмана и искусственного завышения процента оригинальности. В октябре 2018 г. мы обновили алгоритмы и добавили механизм для отображения обходов в системе «Антиплагиат».

Теперь система маркирует подозрительный документ в кабинете пользователя, обращая внимание на возможную попытку обмана. Также преподавателю доступен список всех признаков обходов, которые «Антиплагиат» нашёл в документе: указываются типы обходов и номера страниц.

В специальном интерфейсе (рис. 1) на страницах документа подсвечиваются конкретные позиции возможных технических обходов.

kto-ne-spryatalsya-1

Рис. 1. Интерфейс страницы «Подозрительный документ» для просмотра потенциальных обходов

Если были вставлены символ, слово или целый текст, то они дополнительно выводятся на экран. Это сделано специально, для того чтобы преподаватель мог открыть исходный документ, найти данный текст и убедиться в наличии обхода. Подробно о принципах работы с подозрительными документами мы рассказываем на своих вебинарах⁴.

⁴. Новые возможности системы Антиплагиат для эффективной работы [Электронный ресурс]. — Режим доступа: https://www.youtube.com/watch?v=9XwqSOJf0LM&feature=youtu.be (дата обращения: 07.06.2019).

С помощью новых алгоритмов определения обходов мы смогли провести анализ работ, которые проходят через систему «Антиплагиат», чтобы понять масштабы технического завышения процента оригинальности. На рис. 2 приведён график с абсолютными и относительными показателями количества документов, в которых система обнаружила признаки обходов. Значения указаны за период между выпусками изменений в системе.

kto-ne-spryatalsya-2

Рис. 2. Статистика подозрительных документов

Анализ показывает, что доля подозрительных документов существенно зависит от полноты и новизны алгоритмов по определению признаков обходов. Очень хорошо прослеживается, что сразу после обновления признаков данный показатель резко увеличивается и потом постепенно снижается, по мере того как студенты понимают, что обход не работает, до своего среднего значения — около 3%. С 21 по 27 января после нашего обновления, которое начало определять обходы с помощью формул, он достиг своего пикового значения в 6,24%. Теперь вы сами можете оценить их популярность!

Суммарное число документов, которые были промаркированы как подозрительные, за семь месяцев работы нового алгоритма составило почти 200 тыс. Этот показатель достаточно велик, если сопоставить его с количеством выпускников (в 2017 г. — 1 млн⁵).

⁵. Россия в цифрах. 2018: крат. стат. сб. [Электронный ресурс] / Росстат. — M., 2018. — 522 с. — Режим доступа: http://www.gks.ru/free_doc/doc_2018/rusfig/rus18.pdf (дата обращения: 16.05.2019).

Получается, что каждый пятый потенциально может сдать работу с обходами.

Возникают два главных русских вопроса: «Кто виноват?» и «Что делать?». Искать виновных можно долго, но совершенно бессмысленно: проблему это не решит. Поэтому предлагаем сосредоточиться на втором вопросе.

Итак, что же делать, если вы как проверяющий столкнулись с обходами? Прежде всего стоит удостовериться в том, что обход действительно есть. Система реагирует на подозрительные места в документе, однако срабатывание может быть и ложным, например из-за особенностей форматирования документа. Если же обход действительно используется в документе, на этот случай, по нашему мнению, в организации должен быть разработан специальный локальный акт. В нём следует регламентировать процедуры проверки работ на заимствования, а также прописать обязанности, ответственность обучающихся и проверяющих, в том числе при попытке нечестного повышения процента оригинальности для обхода системы «Антиплагиат».

Чтобы понять, как решать проблему в общем, нужно выяснить, почему сейчас используются обходы. Отчасти это спровоцировано текущими условиями и отношением к проверке: в вузе есть строгий порог процента оригинальности, который надо получить.

Мы постоянно говорим о том, что все работы нельзя рассматривать абсолютно одинаково. Существует множество причин, по которым автор заимствует текст. К примеру, он использует выдержки и цитаты из другой своей же работы. В научной статье такое цитирование нужно минимизировать, тогда как диссертация, наоборот, должна быть итогом предыдущих полученных и апробированных результатов⁶.

⁶. Чехович Ю.В. Самоцитирования — корректные и некорректные [Электронный ресурс]. — Режим доступа: http://www.unkniga.ru/innovation/tehnology/8997-samcitirovaniyakorrektnye-i-nekorrektnye.html (дата обращения: 16.05.2019).

Другой пример. Студент вполне резонно недоумевает, когда требуется переписать своими словами фрагменты текста, которые нужно приводить в оригинале: юристам — нормативно-правовые акты, филологам — цитаты из Толстого, социологам — методики проведения эксперимента. И тут начинают использовать обходы. Нам известен случай, когда одному дипломнику руководитель сам посоветовал написать пять страниц слов «сыр», «колбаса», «молоко» и скрыть этот текст, чтобы повысить процент оригинальности. К чему приведёт такой совет? К тому, что проверка превратится в бессмысленное действие, которое отнимает время, но не приносит никакой пользы.

Выход здесь только один: менять отношение к процедуре проверки. Учитывать только процент оригинальности — плохая и непродуктивная практика. Любой численный критерий, который выступает мерилом успеха, рано или поздно приводит к тому, что все усилия направляются на его максимизацию. Это мы и наблюдаем в случае систем обнаружения заимствований: появляются абсурдные рекомендации типа переписать законы своими словами или вставить десяток страниц бессмысленного текста.

Так происходит тогда, когда система заменяет человека. «Антиплагиат», как и другие образовательные системы, действительно упрощает работу эксперта, но нельзя перекладывать на неё всю ответственность. Система лишь выдаёт предварительную оценку, тогда как окончательное решение имеет право вынести только эксперт. Именно поэтому каждый документ должен быть тщательно разобран и проанализирован проверяющим. Это касается как изучения обходов в документе, так и оценки заимствований в целом, их правомерности и возможности использования.

Мы надеемся, что в будущем борьба с обходами завершится вместе с повышением уровня ответственности, вовлечённости в учебный процесс и его осознанности, когда диплом станет нужен не для галочки, а для оценки реальных знаний и компетенций выпускника.


Рубрика: Инновационные технологии

Год: 2019

Месяц: Июнь

Теги: Марина Суворова