
Франсуа Шолле, создатель Keras и бенчмарка ARC-AGI, опубликовал тред в X, в котором раскрыл дорожную карту своих тестов на абстрактное мышление и дал прогноз по срокам появления AGI. По словам Шолле, ARC-3 уже практически готов, ARC-4 в разработке и выйдет в начале 2027 года, ARC-5 тоже запланирован, а финальной версией станет ARC-6 или ARC-7. Цель — создавать бенчмарки до тех пор, пока не останется задач, с которыми справляется человек, но не справляется ИИ. Шолле сравнивает это с созданием AGI и прогнозирует дату в 2030 год.
Тред появился в день, когда Google DeepMind представила обновлнный Gemini 3 Deep Think, набравший 84,6% на ARC-AGI-2. Для сравнения: при запуске бенчмарка в марте 2025-го лучшие модели показывали 1–4%, а группа из 400 человек в среднем набирала 60% (важно добавить, что любая задача бенчмарка была решена как минимум одним человеком).
Шолле подчеркнул, что ARC никогда не задумывался как “тест на AGI” — это исследовательский инструмент, направляющий ИИ-разработки в сторону гибкого интеллекта (fluid intelligence). Он также отметил, что базовые LLM без test-time adaptation по-прежнему показывают очень низкие результаты на ARC, несмотря на рост вычислений в 50 000 раз с 2020 года. Прогресс обеспечила смена парадигмы — переход от статических моделей к системам, которые “думают” в процессе решения.
Отдельно Шолле высказался о влиянии ИИ на рынок труда: индикатором массовых сокращений он назвал кол-центры. По его данным, сейчас в США около 2,75 млн таких рабочих мест, а глобальный рынок вырос на 35% с 2016 года. Когда занятость в этом секторе упадет на 50%, по мнению Шолле, можно будет говорить о начале масштабной перестройки экономики. Впрочем, массовой безработицы из-за ИИ в ближайшие пять лет он не ожидает.
Ближайшим событием для ARC Prize станет запуск ARC-AGI-3 25 марта — первой версии бенчмарка с принципиально новым форматом. Вместо статических головоломок “задача → результат” в нем будут интерактивные среды, напоминающие видеоигры: более 1000 уровней в 150+ уникальных мирах, где ИИ-агент должен самостоятельно исследовать правила, ставить цели, запоминать и планировать. Инструкций нет — игрок (человек или ИИ) должен разобраться сам. Ключевая метрика — эффективность действий: не “решил или нет”, а “за сколько шагов”.
P.S. Поддержать меня можно подпиской на канал “сбежавшая нейросеть“, где я рассказываю про ИИ с творческой стороны.
Автор: runaway_llm


