Главная (Newsland) Умно и интересно Ученые разработали эталонный тест для определения AGI

23.10.2024 11:25

Ученые разработали эталонный тест для определения AGI

Учёные из OpenAI разработали революционный бенчмарк для оценки возможностей искусственного интеллекта (ИИ) – MLE-bench. Этот набор из 75 задач призван определить, способен ли ИИ к самосовершенствованию и автономной инженерии машинного обучения (AutoML). В отличие от традиционных тестов, проверяющих лишь узкоспециализированные навыки, MLE-bench фокусируется на способности ИИ самостоятельно улучшать свой код, адаптироваться к новым задачам и проводить полноценный научный эксперимент без вмешательства человека. Это выходит далеко за рамки простого выполнения заданного алгоритма и приближает нас к появлению истинного искусственного интеллекта общего назначения (AGI). AGI – это гипотетический ИИ, обладающий интеллектуальными способностями, сравнимыми или превосходящими человеческие. Он сможет решать сложные задачи в различных областях, учиться на собственном опыте и адаптироваться к новым ситуациям без программирования.

Каждая из 75 задач MLE-bench представляет собой реальную проблему из мира науки и техники.

Это не абстрактные математические головоломки, а задачи, требующие глубокого понимания предметной области и применения передовых методов машинного обучения. Например, одна задача может потребовать от ИИ разработки новой архитектуры нейронной сети для решения специфической проблемы классификации изображений, другая – оптимизации алгоритма поиска в огромном графе данных, а третья – создание системы обработки естественного языка для анализа сложных текстов.

В каждой задаче ИИ должен не только найти решение, но и продемонстрировать весь процесс его разработки: от выбора подходящих методов и подготовки данных до оценки результатов и обоснования сделанных выводов.

MLE-bench протестировали на мощнейшей на сегодняшний день модели OpenAI — "o1". Результаты показали, что "o1" решила 16,9% тестов. Только 40% людей, проходивших подобные тесты, смогли добиться аналогичного результата.

Успешное прохождение всех 75 тестов MLE-bench, по мнению разработчиков, может свидетельствовать о достижении уровня AGI. С подробностями нового теста можно ознакомиться в статье, загруженной в базу препринтов arXiv.

Источник: https://qnauka.ru/tehnologii/uchenye-razrabotali-etalonnyj-test-dlya-opredeleni/

3 0 385

Умно и интересно

Интересно об умно, умно об интересном

34 участника

Смотрите также

Оперативные новости

17:59 В Тунисе экипаж вертолета из россиян и белорусов удерживают уже третьи сутки 14:56 МВД опубликовало перечень характерных признаков, по которым можно распознать телефонных мошенников 14:35 Экс-председателю Солнцевского райсуда Москвы Матете добавили статью о наркотиках 13:38 Дроны и роботы смогут обмениваться данными без традиционных каналов связи благодаря квантовой запутанности 13:31 Мошенники обманули москвичку на 42,5 млн руб под видом замены ключей от домофона 11:25 Пропавших в Самарской области четверых детей нашли живыми

Голосование

А как вы считаете, спасет ли помощь Евросоюза Украину?

Нет, Украина исчезнет как государство в ближайшее время

Вмешательство ЕС ведет только к затягиванию конфликта

Украина потеряет часть территорий

Проголосовал 1 человек

Популярные каналы

Все о кино 46992 участника

Политика 35267 участников

Ньюсленд и его обитатели 130 подписчиков

Музыкальная битва 27841 участник

Back in the USSR 22085 участников

ПАРТИЯ "ВОЗРОЖДЕНИЕ ВЕЛИКОЙ РОССИИ ". 13868 участников

Клуб интеллектуалов 12387 участников

Политика - объективный и полноценный взгляд 11669 участников

А.Гершаник: эксперименты живьем 11628 участников

Интересные новости 11595 участников

Все каналы

Меню

Newsland.com – место, где обсуждают новости.

Социальный новостной агрегатор №1 в Рунете: самое важное о событиях в России и в мире. Newsland.com - это современная дискуссионная платформа для обмена информацией и мнениями.

В режиме 24/7 Newsland.com информирует о самом важном и интересном: политика, экономика, финансы, общество, социально значимые темы. Пользователь Newsland.com не только получает полную новостную картину, но и имеет возможность донести до аудитории собственную точку зрения. Наши пользователи сами формируют информационную повестку дня – публикуют новости, пишут статьи и комментарии.

Сайт ориентирован на взрослую аудиторию с активной жизненной позицией (35+).

При любом использовании материалов сайта пользователь обязан указать источник в виде гиперссылки на сайт newsland.com.

Новости, аналитика, прогнозы и другие материалы, представленные на данном сайте, не являются офертой или рекомендацией к покупке или продаже каких-либо активов.

Ответственность за содержание любых рекламных материалов, размещенных на портале, несет рекламодатель.

Ученые разработали эталонный тест для определения AGI

Смотрите также

GPT-4o - в чем отличие новой версии

Инсайдер: Сэма Альтмана уволили из-за работы над улучшенным ИИ

Комментарии

Оперативные новости

Голосование

Популярные каналы