SberDevices разработала нейросеть для проверки орфографии

На модерации Отложенный

Компания SberDevices представила новый ИИ-сервис под названием "Генеративная проверка орфографии", который разработан для корпоративного использования. Этот сервис способен работать с текстами на русском языке и предназначен для использования в копирайтинге, редактуре и создании маркетинговых и рекламных материалов, сообщает портал Хабр.

Команда разработчиков поставила цель реализовать коррекцию орфографии с помощью генеративных моделей. В результате была разработана методология генеративной коррекции орфографии для русского языка.

Разработчики утверждают, что представленный инструмент в настоящее время превосходит по качеству открытые решения для русского языка и проприетарные модели конкурентов.
Модель генеративной проверки орфографии переписывает текст без ошибок, не исправляя при этом сленг, особенности диалектов, сокращения и аббревиатуры.

В модели используется система "Опечаточника", обученная на различных датасетах, а также поддерживается консистентный перенос стиля и устойчивость к текстам из разных источников.

Ограничения текущей версии проекта включают текст длиной до 1000 символов, невозможность исправления пунктуационных ошибок (пунктуация остается авторской) и поддержку только русского языка.

Компания SberDevices планирует постепенно улучшать сервис, включая поддержку пунктуации и форматирования, а также работу с несколькими языками. Они также планируют внедрить другие языки, включая европейские языки, языки СНГ и малые языки России.

Сервис "Генеративная проверка орфографии" является проприетарной разработкой, и для его корпоративного использования необходимо заключить договор с ML Space/Cloud.ru. Для частного тестирования сервиса требуется регистрация на платформе ML Space.