Создатель бенчмарка ARC-AGI предсказал сроки появления AGI

Франсуа Шолле, создатель Keras и бенчмарка ARC-AGI, опубликовал тред в X ^[1], в котором раскрыл дорожную карту своих тестов на абстрактное мышление ^[2] и дал прогноз по срокам появления AGI. По словам Шолле, ARC-3 уже практически готов, ARC-4 в разработке и выйдет в начале 2027 года, ARC-5 тоже запланирован, а финальной версией станет ARC-6 или ARC-7. Цель — создавать бенчмарки до тех пор, пока не останется задач, с которыми справляется человек, но не справляется ИИ. Шолле сравнивает это с созданием AGI и прогнозирует дату в 2030 год.

Тред появился в день, когда Google DeepMind представила ^[3] обновлнный Gemini 3 Deep Think, набравший 84,6% на ARC-AGI-2. Для сравнения: при запуске бенчмарка в марте 2025-го лучшие модели показывали 1–4%, а группа из 400 человек в среднем набирала 60% (важно добавить, что любая задача бенчмарка была решена как минимум одним человеком).

Шолле подчеркнул, что ARC никогда не задумывался как “тест на AGI” — это исследовательский инструмент, направляющий ИИ-разработки в сторону гибкого интеллекта ^[4] (fluid intelligence). Он также отметил, что базовые LLM без test-time adaptation по-прежнему показывают очень низкие результаты на ARC, несмотря на рост вычислений в 50 000 раз с 2020 года. Прогресс обеспечила смена парадигмы — переход от статических моделей к системам, которые “думают” в процессе решения.

Отдельно Шолле высказался о влиянии ИИ на рынок труда: индикатором массовых сокращений он назвал кол-центры. По его данным, сейчас в США около 2,75 млн таких рабочих мест, а глобальный рынок вырос на 35% с 2016 года. Когда занятость в этом секторе упадет на 50%, по мнению Шолле, можно будет говорить о начале масштабной перестройки экономики. Впрочем, массовой безработицы из-за ИИ в ближайшие пять лет он не ожидает.

Ближайшим событием для ARC Prize станет запуск ARC-AGI-3 25 марта — первой версии бенчмарка с принципиально новым форматом. Вместо статических головоломок “задача → результат” в нем будут интерактивные среды, напоминающие видеоигры: более 1000 уровней в 150+ уникальных мирах, где ИИ-агент должен самостоятельно исследовать правила, ставить цели, запоминать и планировать. Инструкций нет — игрок (человек или ИИ) должен разобраться сам. Ключевая метрика — эффективность действий: не “решил или нет”, а “за сколько шагов”.

P.S. Поддержать меня можно подпиской на канал “сбежавшая нейросеть ^[5]“, где я рассказываю про ИИ с творческой стороны.

Автор: runaway_llm

Источник ^[6]

Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/25614

URLs in this post:

[1] тред в X: https://x.com/fchollet/status/2022086661170254203

[2] мышление: http://www.braintools.ru/thinking

[3] представила: https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-deep-think/

[4] интеллекта: http://www.braintools.ru/article/7605

[5] сбежавшая нейросеть: https://t.me/ai_exee

[6] Источник: https://habr.com/ru/news/996248/?utm_source=habrahabr&utm_medium=rss&utm_campaign=996248

Нажмите здесь для печати.