Билл Гейтс представляет искусственный интеллект, который заменит блогеров и дикторов новостей

На модерации Отложенный


Билл Гейтс создает искусственный интеллект, который заменит подкастеров и ведущих новостей

Microsoft Билла Гейтса представила новую программу под названием VASA, которая создает «живые говорящие лица виртуальных персонажей с привлекательными визуальными эффектами (VAS) на основе одного статического изображения и речевого аудиоклипа».

По данным подразделения искусственного интеллекта (ИИ) Microsoft, технологический гигант тайно работает над программой, позволяющей полностью заменить подкастеров, телеведущих и дикторов новостей искусственным интеллектом.


«Наша премьерная модель VASA-1 способна не только воспроизводить движения губ, которые прекрасно синхронизируются со звуком, но также улавливать широкий спектр нюансов лица и естественных движений головы, которые способствуют восприятию аутентичности и живости», — - написала команда в  статье  об этих последних событиях.


Naturalnews.com сообщает: «Основные инновации включают в себя целостную динамику лица и модель генерации движений головы, которая работает в пространстве лица, а также развитие такого выразительного и распутанного пространства лица с помощью видео. Посредством обширных экспериментов, включая оценку набора новых показателей, мы показываем, что наш метод значительно превосходит предыдущие методы по различным параметрам».


Качественные дипфейки


Методы, используемые Microsoft Research Asia для разработки подобных человекоподобных дипфейков, позволяют создавать высококачественное видео в сочетании с реалистичной динамикой лица и головы. Такое видео можно создавать онлайн в разрешении 512×512 с частотой до 40 кадров в секунду (FPS) и незначительной начальной задержкой.


С точки зрения непрофессионала, технология настолько правдоподобна, что многие люди, вероятно, купятся на нее и подумают, что на их экранах изображены настоящие люди. Только самые проницательные смогут сказать, что с тем, что они видят, что-то не так.

«Это открывает путь к взаимодействию в реальном времени с реалистичными аватарами, имитирующими разговорное поведение человека», — с гордостью заявляет Microsoft Research Asia.


Если вам интересно увидеть несколько примеров этих жутких движущихся и говорящих изображений ИИ, вы можете сделать это  на сайте Microsoft.com .

«Наш метод способен не только обеспечить синхронизацию губ и звука, но также генерировать широкий спектр выразительных нюансов лица и естественных движений головы», — говорят в компании.


«Он может обрабатывать звук произвольной длины [sic] и стабильно выводить бесшовное видео с говорящим лицом».

Целью исследования является создание целого общества или армии виртуальных ИИ-аватаров, заявляет Microsoft, но не волнуйтесь: все это «нацелено на позитивное применение», настаивает компания.


«Он не предназначен для создания контента, который будет использоваться для введения в заблуждение или обмана», — говорится в заявлении об отказе от ответственности на сайте. «Однако, как и другие связанные методы создания контента, его все равно потенциально можно использовать не по назначению для выдачи себя за других людей».


«Мы выступаем против любого поведения, направленного на создание вводящего в заблуждение или вредного контента реальных людей, и заинтересованы в применении нашей технологии для улучшения обнаружения подделок. В настоящее время видео, созданные этим методом, все еще содержат опознаваемые артефакты, а численный анализ показывает, что все еще существует пробел для достижения подлинности реальных видео».

Предполагаемые положительные варианты использования такой технологии звучат как пародия: Microsoft утверждает, что она может создать «равенство в образовании», одновременно «улучшая доступность для людей с проблемами общения, предлагая общение или терапевтическую поддержку тем, кто в ней нуждается…»