GPT-4o - в чем отличие новой версии

На модерации Отложенный

Новая версия ChatGPT - GPT-4o - может считывать выражения лиц, имитировать человеческий голос и вести разговоры практически в режиме реального времени.

OpenAI продемонстрировала GPT-4o на презентации в режиме реального времени. Чат-бот, который разговаривал с ведущими по телефону, похоже, прекрасно поддерживает разговор, понимая эмоциональные сигналы, а также визуально обрабатывает выражения лиц и обстановку своих собеседников.

Во время демонстрации голосовой ассистент с искусственным интеллектом продемонстрировал свои навыки, выполняя такие задачи, как перевод с языка в режиме реального времени, решение математического уравнения, написанного на листе бумаги, а также смог провести слепого человека по улицам Лондона.

Чтобы продемонстрировать свою способность считывать визуальные сигналы, чат-бот использовал объектив камеры телефона, чтобы прочитать выражение лица инженера OpenAI и описать его эмоции.

"Ппохоже, ты чувствуешь себя довольно счастливым и жизнерадостным, - сказал бот, откликнувшийся на имя ChatGPT. - Не хотите поделиться источником этих приятных ощущений?".

"Мы строим будущее взаимодействия между нами и машинами, - отметила на пресс-конференции Мира Мурати, технический директор OpenAI. - Мы думаем, что GPT-4o изменит эту парадигму".

Новый голосовой ассистент будет выпущен ограниченным тиражом для альфа-тестеров в ближайшие недели, за которым последует более широкое внедрение, которое начнется с платных подписчиков ChatGPT Plus. 

Но новая технология сопряжена со значительными проблемами безопасности. Способность бота обрабатывать текстовые, аудио- и визуальные данные в режиме реального времени означает, что его можно использовать для шпионажа. А его убедительная эмоциональная имитация также может сделать его искусным в проведении мошеннических телефонных звонков или дезинформации.