Обнаружение заимствований: от технологии к методологии


Борьба с академической нечестностью продолжается на разных фронтах. Цифровые инструменты уже сегодня позволяют выявлять заимствования в студенческих работах и научных статьях, обнаруживать мошеннические издательства и сайты. Однако до тех пор пока не появился сильный искусственный интеллект, способный отделить зёрна от плевел, конечное решение за живым человеком — компетентным экспертом. Вопросы публикационной этики и их связь с технологиями обсуждались в ходе конференции «Обнаружение заимствований» и круглого стола «Опыт внедрения и практического использования систем обнаружения заимствований в научной, издательской и образовательных сферах».

ФИЛОСОФИЯ АНТИПЛАГИАТА

obnaruzhenie-semenov

Дискуссию открыл академик Российской академии наук и Российской академии образования Алексей СЕМЁНОВ.

По словам эксперта, проблема заимствований начинается не в аспирантуре, не в профессиональной научной деятельности: её корни в начальной школе, а то и ещё раньше. И в современных условиях технологии являются средством, способным на операционном уровне ограничить рост нечестности.

— Темой ЕГЭ сезона 2011 г. стало массовое списывание. Этот процесс был остановлен благодаря внедрению довольно примитивного технологического средства с трансляцией видео низкого разрешения в Интернет. Миллионы были потрачены на установку видеокамер в аудиториях. Сегодня всё больше тестовых процедур проходит онлайн с использованием средств прокторинга. Образовательная система предусматривает, что ход всех занятий в классе фиксируется на той или иной цифровой платформе.

Волна списанных рефератов нарастала так же, как и нечестность в ЕГЭ. Безусловно, заимствование является нормой научной деятельности и должно стать нормой работы школьника. Речь идёт не о том, где списать реферат, а о том, чтобы указать, где школьник взял ту или иную мысль, усилить её, сказать на её основании что-то своё и т.п. И в данном случае технологии систем обнаружения заимствований аналогичны прокторингу или наблюдению за ходом ЕГЭ. Урок — это публичное пространство, в котором допустимо «всевидящее око», а антиплагиат оказывается всепомнящей технологией, где возможен анализ научного и культурного наследия и выявление тех или иных заимствований. А дальше уже дело человека, эксперта, — выяснить, легальны они или нет.

obnaruzhenie-chekhovich

Основные на сегодняшний день тренды в деле борьбы с некорректными заимствованиями обозначил исполнительный директор компании «Антиплагиат» Юрий ЧЕХОВИЧ.

— ИТ принесли в нашу жизнь как минимум одну проблему: копипаст. Проблема масштабная, в конце 1990-х гг. появились зарубежные решения, а 15 лет назад — российская система «Антиплагиат», которая призвана обнаруживать заимствования и разбираться в том, насколько корректно они использованы в работе.

С точки зрения бакалавра, магистранта, соискателя учёной степени, прохождение «Антиплагиата» — это хождение по мукам. Необходимо «протащить» свою работу, убедить комиссию или диссовет в том, что не списал. В текущей модели обнаружения заимствований страдают все, и большинство воспринимает проверку на «Антиплагиате» как барьер, который нужно перепрыгнуть. Можно понять тех, кто использует любые средства, для того чтобы повысить оригинальность.

Наиболее распространённый пример — перефразировать предложение, переписать своими словами, т.е. механически снизить процент совпадения проверяемого текста и источника. Это общемировая практика, и чаще всего она далека от научной этики. Разные сайты предлагают свои услуги, для того чтобы быстро перефразировать текст.

Самые вопиющие практики — повышение процента оригинальности без изменения текста. Это не просто нарушение академической этики, которое может быть допущено по недосмотру или неопытности, но в чистом виде мошенничество, граничащее с подлогом документов. Решения, связанные с транслитерацией, заменой символов, вставкой нечитаемых фрагментов, направлены на то, чтобы система не разобралась в проверяемом файле и поставила высокую оценку оригинальности.

Классика жанра — написание работ под заказ. В России реклама подобных услуг запрещена с конца 2018 г., но тем не менее огромное число ресурсов ориентировано на то, чтобы найти студентов и учёных, предложить им свои услуги и получить за это деньги.

Что произойдёт, когда в «Антиплагиате» окажутся все тексты? Так выглядит самый большой страх нечестных авторов. Им кажется, что, когда система начнёт безошибочно выявлять те или иные формы мошенничества, писать работы станет невозможно. Но что делать честному студенту или учёному, чтобы не стать жертвой неотлаженности системы обнаружения заимствований? Анализ ситуации показывает, что очень сложно опираться на внешний опыт: он фрагментарен и ещё только нарабатывается. И совсем нельзя надеяться на то, что вопрос будет решён сверху. В числе принятых в последнее время законодательных инициатив к борьбе с плагиатом можно отнести лишь поправки, которые касаются запрета рекламы заказных работ. По сути, эта мера не работает: не было ни одного случая, когда кого-то наказали, хотя штраф введён. В данной ситуации представляется разумным обобщить опыт, агрегировать знания о проблеме и вырабатывать правила, которые позволили бы бороться с проблемой копипаста.

В заключение эксперт отметил, что в настоящее время готовятся две методики работы с «Антиплагиатом», которые будут касаться проверки дипломных работ и деятельности научной организации: проверки статей и других документов. Эти произведения будут находиться в открытом доступе. Последние два года прошли под флагом работы с самоцитированиями и самоплагиатом. Получив критические отзывы, коллеги готовят работу, в которой изложат современный взгляд на эту проблему.

obnaruzhenie-kurpakov

Заимствования могут быть абсолютно правомерными, нейтральными и незаконными. Но результаты проверки в «Антиплагиате» очень часто оказываются «красными». С критикой существующей системы обнаружения заимствований выступил директор Издательско-библиотечного центра Балтийского федерального университета имени Иммануила Канта Вадим КУРПАКОВ.

— Дьявол играет нами, когда мы не мыслим точно. Кто определяет границы достоверности и оригинальности научного текста? Производитель программного обеспечения, «Диссернет», ВАК, министерство? Давайте представим себе, что некая компания изобрела замечательный измерительный инструмент, но общепринятая система мер отсутствует. Скажем, это штангенциркуль, а в разных регионах существуют дюймы, вершки и другие экзотические меры длины. Очевидно, что эффективность такого измерительного прибора стремится к нулю. «Антиплагиат», конечно, стал уже нарицательным именем, таким же как «Ксерокс». Но что мы имеем в итоге? Основными деятелями в публичном пространстве являются коммерческая структура, которая производит профильное ПО, и две общественные организации («Диссернет» и Ассоциация научных редакторов и издателей (АНРИ). — Примеч. ред.), пытающиеся своей гражданской гиперактивностью компенсировать невнятность происхождения и предельную расплывчатость критериев, и сомнительное качество производимых рекомендаций. Почему научное сообщество России это устраивает в той области, от которой зависят научные карьеры и судьбы тысяч людей, непонятно. Создаётся впечатление, что причина в отсутствии достаточных оснований для построения чёткой системы, которая бы регулировала заимствования контента в научных текстах.

Говорить о том, что не существует нормативной базы, не вполне корректно. Даже Бернская конвенция и тезисы Пиратской партии Швеции схожи в том, что и та и другая признают неприкосновенность личных неимущественных прав. Это говорит о том, что всё давно придумано и является общепринятым. Более того, само слово «плагиат» означает нарушение личных неимущественных прав автора, и только это. От иных заимствований плагиат отличается тем, что он регулируется законом, общим для всех, независимо от статуса физического лица или организации. А любые нормативы в отношении заимствований носят локальный характер.

Семантически плагиат тоже является заимствованием, только неправомерным. А заимствование — это любое использование контента, за исключением плагиата. Что мы вообще должны обнаруживать: плагиат или добросовестное цитирование? Какова цель? Границы между плагиатом и добросовестным заимствованием всегда чётко устанавливаются. Но тут начинается «игра в напёрстки» и появляются кейсы «Диссернета», а понятие плагиата размывается. Наши западные партнёры вообще предлагают 10 типов плагиата. Когда мы забываем базовый принцип мышления: не стоит умножать сущности сверх необходимого, то нами начинают играть демоны. Например, такие, как самоплагиат. Это демон терминологического низкопоклонства, когда мы бездумно заимствуем английский термин, несмотря на то что в русском языке это типичный оксюморон. Чем не угодил термин «избыточное самоцитирование», не очень понятно. Вообще, формат научной статьи не способствует тому, чтобы это был некий совершенно оригинальный жанр. Прирост научного знания, т.е. новизна, не может быть единственным критерием. А её наличие или отсутствие должна установить только глубокая экспертиза мысли, но не текста. В настоящее время никакой компьютерный анализ на это не способен. Оригинальности научного произведения с точки зрения текста в действительности не существует. Чем выше оригинальность, тем скорее текст будет иметь пониженную научность.

При этом оригинальность нельзя измерить существующими средствами: любой показатель будет отражать только возможности системы. Штангенциркуль сравнивает с эталоном, а система обнаружения — лишь с массивом текстов. Оригинальность не может быть выведена из какого-либо норматива, сейчас все границы установлены произвольно. Наконец, она не может служить положительной характеристикой. Таким образом, мы выявляем то, что неизмеримо, ненормируемо и не может быть критерием оценки.

Что делать в сложившейся ситуации? Вспомнить, кто диктует правила. На самом деле их можем устанавливать мы сами в пределах того или иного сообщества. Любые нормативы носят локальный характер. На своём уровне: в университетах, в редакциях — мы правомочны. Нужно осмыслить проблему ещё раз, понять, что существующая система обнаружения заимствований не может использоваться для оценки оригинальности текстов. Она может работать лишь на поиск нарушений, и нужно поменять вектор с положительной характеристики на отсутствие отрицательной. Таким образом мы победим одного из демонов и начнём возврат в русло здравого смысла.

НАУЧНАЯ ПЕРИОДИКА: ВИДЫ МОШЕННИЧЕСТВА И ВОПРОСЫ РЕТРАКЦИИ

obnaruzhenie-abalkina

Помимо уже многим известных хищнических журналов, публикующих статьи сомнительного качества за большие деньги, в академической терминологии есть такое понятие, как «похищенные журналы», или журналы-клоны. Впервые такой случай был задокументирован в 2011 г. Мошенники тогда зарегистрировали истекающий домен и тем самым привлекали авторов публиковаться в журнале, который до того принадлежал добросовестным издателям. Анализ проблемы представила Анна АБАЛКИНА, исследователь из Университета Людвига Максимиллиана (Германия).

Журнал-клон — вид кибермошенничества, когда некто копирует название издания и его ISSN, тем самым обманывая потенциального клиента. Публикация, как правило, проходит без рецензии, за плату. Чаще всего копируются журналы, издающиеся на национальном языке, а не на английском, соответственно международное сообщество их не знает. Или же это небольшие издания, занимающиеся очень узкой тематикой. Если похитить известный журнал, это быстро обнаружится. На сегодняшний день известно о сотнях похищенных журналов.

Проблема состоит в том, что подобные издания очень быстро регистрируются. Затраты на создание интернет-страницы минимальны, и такие журналы обнаруживаются, когда целый ряд клиентов оказываются обманутыми. Когда мы говорим об индексации журналов в международных базах данных, то есть определённый контроль качества. Здесь его нет вообще.

Мошенники могут похищать журнал несколько раз, и можно найти много клонов одного и того же издания. Механизмы тоже разные: похищение домена (если издатель не успел продлить его), взлом оригинального сайта или создание домена, мимикрирующего под оригинальный сайт.

В нынешнем году зафиксировано увеличивающееся число похищений. Эта проблема связана с развитием ИТ и журналов открытого доступа. В частности, в 2020 г. начал действовать журнал-клон, который на плохом английском языке предостерегает авторов от того, что есть клон этого журнала-клона. Его смогли обнаружить лишь потому, что мошенникам удалось индексировать 462 статьи в Scopus и 90 из них принадлежали российским авторам. Это стало возможным, благодаря тому что «Диссернет» обращает внимание на динамику индексации статей наших соотечественников. Чаще всего это хищнические журналы, которые работают с недобросовестными посредниками, продающими статьи с плагиатом. Было проведено оперативное расследование, и все эти публикации исключили из Scopus. Тем не менее за несколько месяцев журнал смог опубликовать значительно больше статей, а цена за публикацию достигала 1 тыс. долларов. Ещё один примечательный случай — похищение российского журнала «Новый мир», который индексируется в Web of Science (WoS).

Само мошенническое издательство не может организовать такой огромный поток статей в свой журнал. Скорее всего, здесь работают посреднические связи со специализированными сайтами. Мошенничество чаще всего имеет под собой сетевую организацию; это не один журнал и не один обманутый автор. Речь идёт о системном подходе как со стороны изданий, так и со стороны авторов, которые хотят обмануть свой университет. Исследуя контент одного журнала-клона, мы можем обнаружить другие. На сегодняшний день был проведён поиск по массиву 11 тыс. статей и найдено более 50 журналов-клонов. Основной метод обнаружения — наличие аналогичных статей в архивах. Другой метод — поиск плагиата. Один и тот же текст под разными фамилиями был обнаружен в различных изданиях.

Большая проблема, которая стоит перед научным сообществом, — всё это обнаруживать и контролировать. Вскоре полный список клонов будет опубликован, но нужна помощь научного сообщества, чтобы разобраться в этой проблеме.

obnaruzhenie-bogorov

Ретракция научных публикаций, или их отзыв по причине каких-либо нарушений, — явление достаточно экзотическое для отечественного академического сообщества. В то же время в мире эта практика абсолютно допустима и нормальна. Анализ показывает, что на сегодняшний день в журналах WoS ретрагировано примерно 6,5 тыс. публикаций. К разговору подключился руководитель отдела образовательных программ компании Clarivate Валентин БОГОРОВ.

— Первые ретрагированные документы появились в 1970-е гг. До 1990-х это были единичные случаи, а в последнее десятилетие XX в. число ретрагированных статей достигло 30–50 в год. Начиная с 2000-х гг. оно переваливает за 100, постепенно растёт, и в последнее время ежегодно отзываются 200–300 статей. Пик ретрагирования пришёлся на 2011 год, что было связано с одной конкретной научной конференцией, где практически все материалы были массово отозваны.

Статьи могут быть ретрагированы по самым разнымпричинам. К сожалению, наиболее частое основание — плагиат. Большинство отозванных статей относятся к биомедицине, и чаще всего их ретрагируют из-за нарушений в этике исследований или невоспроизводимости результатов.

Откуда статьи ретрагируются в принципе? Список интересен тем, что в нём немало узкоспециализированных изданий, но в основном присутствуют именно известные журналы. В топ-25 по числу отозванных статей ведущие журналы мира: Nature, Science, престижные журналы открытого доступа.

По направлениям лидируют экология и топливная энергетика, биомедицина. Представлены все основные естественные науки: химия, физика, математика.

Максимальное количество ретрагированных публикаций относится к малоизвестным вузам, но здесь же присутствуют величайшие университеты мира: Гарвард, французский аналог академии наук, китайский вуз — основатель Шанхайского рейтинга. Что касается стран, то лидируют Китай, США, Япония, Индия, а также ряд развивающихся стран и государств БРИКС, где есть достаточно сильный прессинг на учёных в отношении числа публикаций. Пока немного ретракций статей из России — их всего 30. Но это, скорее всего, свидетельство того, что отечественные журналы крайне неохотно обращаются к этой процедуре.

obnaruzhenie-kirillova

Президент АНРИ Ольга КИРИЛЛОВА добавила, что самое главное нарушение — когда журналы не рецензируются и издают в большом количестве статьи низкого качества. Вообще, переводной плагиат и самоплагиат не являются основными характеристиками журналов-хищников, если это не системное явление. Один из главных их признаков — отсутствие ретракции при выявлении нарушений. Есть в принципе хищники, а есть журналы со слабой редакционной политикой. И наличие плагиата или других нарушений не может быть основанием для исключения издания из Scopus, если он работает над ошибками. Из 73 млн документов в Scopus 412 тыс. содержали ошибки, и была произведена их коррекция, но лишь 4 тыс. статей ретрагированы. В 2009–2011 гг. большие нарушения были связаны со сборниками конференций, и их отозвали. В основном их тематика — инжиниринг, компьютерные науки и бизнес, а страна происхождения — Китай.

ПУБЛИКАЦИОННАЯ ЭТИКА: ВОПРОСЫ И ОТВЕТЫ

obnaruzhenie-kuleshova

На вопросы участников относительно заимствований, плагиата, этики научных публикаций в ходе мероприятия ответила председатель Совета по этике научных публикаций АНРИ Анна КУЛЕШОВА.

Что такое публикационная этика?

— На мой взгляд, публикационная этика — это справедливость, достигаемая через сохранение целостности научного знания, снижение наукометрических искажений и работу репутационных механизмов. Что происходит, когда этика научных публикаций недостаточно развита? Прежде всего появляются лжеэксперты, которые из одной статьи делают 17, при этом идея изначально была украдена, а человек занимает должность и считает себя большим учёным, участвует в распределении грантов как ведущий эксперт. А разбирается он только в механизмах плагиата, и не более. Подобные фальсификации возникают, если не работают механизмы, защищающие публикации. Когда рушатся дома, падают самолёты, распространяются болезни, обычно всё начинается с подлога. Например, выпускаются дженерики лекарств, которыми врачи обязаны лечить людей. А запускается процесс с псевдонаучной публикации, где говорится о том, что проведено исследование и т.п., хотя на деле ничего не было.

Самая большая проблема, с которой мы сталкиваемся, когда можно и нужно вывести на чистую воду лжеэкспертов: люди не хотят выглядеть «стукачами», не обращаются в Совет по этике, не пытаются написать заявление о лишении учёной степени на основании плагиата, позволяют такому человеку работать, получать надбавки, гранты. Когда речь идёт о гуманитариях, казалось бы, вреда от них никакого нет. Но на самом деле такие агрессивные игроки оказываются теми людьми, которые могут выступать в судах, готовить гуманитарные экспертизы, на основании чего судьи принимают решения. Чтобы стать экспертом по гуманитарным наукам, требований никаких нет, достаточно учёной степени и сотрудничества с государственным университетом. Если вы такое обнаружили, то свяжитесь с Советом по этике научных публикаций или с Комиссией РАН по противодействию фальсификации научных исследований, передайте информацию. Назначат дополнительную экспертизу, утечки информации о том, кто прислал информацию, не будет. Конечно, тот, кто это допустил, должен быть отстранён от должности вместе со своей диссертацией, с фальшивыми монографиями и т.д.

Каждый научный журнал имеет свою публику. Почему автор не может разместить свою статью в разных изданиях с целью расширения читательской аудитории?

— Расширять аудиторию можно и нужно, но не вводя никого в заблуждение. Например, вы писали для социологов, а теперь эту мысль хотите донести до медиков. Вы спрашиваете у социологического журнала разрешение на публикацию данной статьи со ссылкой на него, а в медицинском со ссылкой пишете, что данная статья доработана и публикуется здесь для определённых целей.

Какими должны быть действия редакции, если она получает сообщение о плагиате статьи, опубликованной 10 лет назад, когда не было проверки на заимствования, а в данный момент не располагает специалистами по данному направлению?

— Не так важно, когда у вас украли. Даже если это случилось 10 лет назад, важно исправить наукометрические искажения. Ведь статья цитировалась не по тому автору и индекс Хирша рос у другого человека. Это несправедливо. Ретракция не является наказанием, это способ исправления ошибки. В случае обнаружения плагиата статья должна быть отозвана. Даже если нет специалистов в редколлегии, должен существовать корпус экспертов, к которым журнал обращается за рецензиями. Скорее всего, по схожей тематике в журнале статьи уже публиковались. Следует найти их авторов и запросить рецензию у них. И здесь нужен не столько специалист по научному направлению, сколько решение редколлегии и дополнительный анализ данных в «Антиплагиате», с тем чтобы принять решение о ретракции. Если вы не отзываете статьи, то повышаете риск того, что появятся лжеэксперты.

Практика ретракции не закреплена законодательно, но достаточно того, что она существует в международном пространстве и содействует целостности научной публикации.

Каковы правовые последствия плагиата?

— Прежде всего, по решению суда изымаются диссертации и другие научные публикации. Кроме того, суд может запретить преподавать.

Какой процент заимствований считается допустимым для кандидатских и докторских диссертаций с учётом самоцитирования предыдущих авторских статей?

— Здесь нет общей формулы. Есть добросовестные цитирования и недобросовестные. Процент добросовестных заимствований определяется логикой научной работы, а не нормативными актами. Если вы написали тезисы, которые затем превратились в научную статью, а та стала кандидатской диссертацией, то здесь не было никакого плагиата. Происходило естественное развитие научной мысли, какое и должно быть, когда пишется научный текст. Ни к каким нормам мы здесь не привязываемся, имеет значение экспертность, трезвость ума и здравость рассудка.

Можно ли считать, что большой процент самоцитирований в статьях можно приравнять к множественной публикации?

— Что такое научная статья? Это приращение научного знания. Если для самоцитирования нет оснований и публикация не обеспечивает приращение знания, то она может считаться множественной. У всего должна быть логика. Решить данный вопрос могут только эксперты, которые видят текст, ваше профессиональное сообщество. Никакой процент сам по себе ничего не даст. Безусловно, вы можете поставить ссылки на свои работы, а не цитировать большие фрагменты. Но если вы не стали цитировать тех, кого стоило бы, а решили повысить свой индекс Хирша, это другой вопрос. Когда мы говорим об этике научных публикаций, главный вопрос — «Зачем?». Он помогает проанализировать ситуацию.

Что и как считать плагиатом в обзорной статье?

— Безусловно, в таких статьях могут повторяться цитаты из других работ. Это нормальное явление. Если они адекватным образом оформлены, то это не плагиат, а добросовестное цитирование. Но если один обзор полностью дублирует логику другого: подбор работ, цитат и выводов совпадает, то здесь можно говорить о плагиате. Мы разделяем добросовестное цитирование и недобросовестное, плагиат текста и воровство идей. Плагиат идей плохо обнаруживается машинными методами, но хорошо «ловится» экспертами. Неважно, какое количество украдено, если логика и выводы пересекаются.

Не секрет, что при подготовке статей и диссертаций по праву нужно цитировать нормы законодательства. Это серьёзно снижает уровень оригинальности. Было бы целесообразным устанавливать различные требования к проценту оригинальности по разным наукам. Возможно ли это технически?

— Действительно, он должен быть разным. Если вы химик, биолог или медик, то описание эксперимента может воспроизводиться в разных статьях, но одними и теми же словами. Это является не плагиатом, а нормой для научных текстов по данной дисциплине. И это никак не должно влиять на оригинальность. Когда вы получаете отчёт «Антиплагиата», то должны оценить, что стоит за теми цифрами, которые получили. Если это цитирование законодательства, то оно не понижает уровень оригинальности.

Правомерен ли отказ журнала опубликовать статью вследствие её несоответствия требованиям к проценту оригинальности? Как автору защитить свои интересы?

— К сожалению, это нередкая ситуация, когда этика научных публикаций понимается превратно. Где-то принуждают к рерайтингу, где-то просто отказывают немотивированно. На таком основании отказывать в публикации не должны, и в этом случае стоит отдать журнал на перевоспитание в Совет по этике. Рерайтинг неэтичен, а главное, не нужен.


Рубрика: Copyright.ru-комментарии

Год: 2020

Месяц: Декабрь

Теги: Алексей Семёнов