Японцы сделали ИИ-фильтр, превращающий крик в спокойную речь

На модерации Отложенный

Японский технологический гигант SoftBank Corp внедрил инновационную систему "отмены эмоций", представляющую собой телефонную технологию изменения голоса с использованием искусственного интеллекта. Цель этой системы - преобразование гневной речи в спокойную, что должно помочь снизить уровень стресса среди операторов колл-центров, столкнувшихся с резким ростом числа недовольных клиентов в последнее время в Японии.
Этот проект разрабатывался три года, и его основная идея заключается в двухэтапном процессе. Сначала искусственный интеллект идентифицирует разгневанный голос и выделяет ключевые аспекты речи, а затем использует акустические инструменты для придания голосу естественного и спокойного тембра. Для обучения нейронной сети использовались более 10 000 элементов голосовых данных.

Кроме того, разработчики привлекли 10 актёров обоих полов, чтобы они записали 100 общих фраз с различными эмоциями, включая крики, обвинения и требования извинений, чтобы система могла адаптироваться к разнообразию выражений.
Важно отметить, что технология не изменяет слова, произносимые звонящим, но значительно смягчает интонацию, делая голос более спокойным. Например, высокий женский голос автоматически становится более низким, а громкая мужская речь, которая может звучать угрожающе, преобразуется в более дружелюбный тон. При этом вызывающий абонент не осознает изменений, что позволяет операторам более эффективно управлять сложными ситуациями.

Пока что система SoftBank работает исключительно на японском языке. В долгосрочной перспективе компания готова расширить поддержку на другие языки в случае соответствующих запросов от пользователей.