Ученые открыли \"охоту на ведьм\"

На модерации Отложенный Главными инквизиторами новой чистки рядов выступили два ученых из университета при Техасском юго-западном медицинском центре, Моурнир Эррами и Гарольд Гарнер. Каленым "железом" своих компьютеров они безжалостно выжигали ересь и плагиаторство из хранилищ научной мудрости.

По результатам "субботника" ученые пришли к выводу, что 200 тысяч из 17 миллионов статей в базе данных Medline являются, либо слабеньким рерайтом, либо копиями, а то и вовсе многократными публикациями в разных изданиях, сообщает журнал Nature.

К сожалению, даже для такого богоугодного дела, как истребление плагиата, ученым не хватило компьютерных мощностей, чтобы разом сопоставить все 17 миллионов статей. На помощь отважным пришла обычная смекалка. Не щадя коллег по научному ремеслу, исследователи пропустили через специальную программу сопоставления текста 62 тысячи выбранных наобум статей, самая ранняя из которых датирована 1995 годом, выявили 421 копию, а потом поочередно загнали их части в поиск и нашли похожие статьи. Так и появилась цифра 200 тысяч.

Но это было только начало. Следующим шагом борцов с засильем плагиата стала публикация 70 тысяч найденных статей на общедоступном интернет-ресурсе Déjà vu, дабы устыдить нерадивых коллег, которые полному погружению в научную нирвану предпочли простое копирование чужих источников. По мнению исследователей, такая показательная порка отвратит многих колеблющихся и поможет уняться многим действующим плагиаторам.


По ходу дела ученые разработали собственное программное обеспечение для сопоставления текстов, назвали его eTBLAST и выложили в сеть для свободного скачивания всеми желающими.
Кстати, сама концепция такого ПО и его массового использования не нова. Группа издателей уже тестирует анти-плагиат систему CrossCheck, на основе алгоритма компании iParadigms. Теперь каждая статья, поступающая в издательство, проходит проверку невозмутимой и неподкупной системы, которая сверяет их с имеющимися в базе данных и отправляет редакторам наиболее подозрительные образчики. Переход от тестирования к непосредственному использованию программы намечен на середину 2008 года.

В прошлый раз "охоту на ведьм" открывали в 2006 году, тогда в архиве статей по физике arXiv нашли 280 копий, а еще раньше, в 2002, ученые провели анонимный опрос среди своих коллег и выяснили, что лишь 1% признает постоянное использование результатов чужого научного труда, а 5% признались, что они изредка переиздают свои работы в разных изданиях.

По мнению Гарнера и Эррами, результаты их исследования хуже, чем результаты по arXiv потому, что в 2006 году поиск велся по всему тексту, а в этот раз ученые использовали только выборочные абзацы.