Искусственный интеллект будет проверять научные статьи на антиплагиат

Российская компания «Антиплагиат» занимается разработкой новой технологии, которая будет находить в научных работах переводные фрагменты-заимствования с любого языка. Российская венчурная компания (РВК) предоставила им грант в размере 180 млн рублей. Разработка будет осуществляться в рамках направления «Искусственный интеллект» (ИИ), которое относится к нацпроекту «Цифровая экономика». Возможно, мера связана с участившимися случаями плагиата в работах чиновников и политиков.

Разработчики компании хотят создать универсальный алгоритм поиска повторяющихся текстовых фрагментов для различных пар языков, которые может задать пользователь. Технология будет основана на компьютерной лингвистике с внедрением ИИ и возможности адаптивного обучения.

Тестовый запуск системы уже показал более 20 000 копирований текста с английского языка в научных статьях. На данный момент технология может находить плагиат с русского, английского и казахского языков.

С развитием проекта, компания хочет распространить его за рубежом и выйти за пределы российского рынка.

Сервисы компании «Антиплагиат» начали работу в 2005 году. Это первый проект подобного плана в России. Большинство российских научных учреждений (вузы, издательства, школы и т.д.) пользуются их программами. На сайте разработчиков указано, что сервис индексирует более 500 млн источников на разных языках. Примерно 250 000 проверок с помощью программы осуществляются ежедневно.

С развитием машинного перевода участились случаи прямых заимствований из иностранных источников. В противовес этому, с помощью возможностей ИИ, компьютеры постепенно учатся лучше анализировать и обрабатывать естественный язык, программы по поиску плагиата постоянно становятся «умнее».