Падение бенчмарка ARC стало очередной жертвой неустанной оптимизации ИИ

Годами тест ARC считался практически непреодолимым препятствием для нейросетей, настоящим испытанием гибкого интеллекта ^[1], а не простого запоминания ^[2]. Но новые результаты показывают, что даже этот барьер рушится под неустанной оптимизационной работой современных лабораторий искусственного интеллекта.

«Корпус абстракции и рассуждений», позже переименованный в ARC-AGI, изначально был разработан для отделения истинного обучения ^[3] от статистического повторения ^[4]. Теперь его постигла та же участь, что и многие предыдущие бенчмарки: новые методы его просто подавляют.

Новые результаты компании Poetiq, занимающейся разработкой ИИ, свидетельствуют об успешном решении исходного бенчмарка ARC-AGI-1. В недавнем заявлении ^[5] компания утверждает, что её системы, построенные на моделях OpenAI и Google, достигли максимальной производительности на первом наборе данных. Более того, сообщается, что система превзошла средний человеческий результат в 60% на значительно более сложном наборе данных ARC-AGI-2.

Результаты Poetiq показывают, что исходный тест ARC-AGI-1 был в значительной степени решен, в то время как производительность на более сложном наборе данных ARC-AGI-2 теперь превышает средние человеческие показатели

Падение бенчмарка ARC стало очередной жертвой неустанной оптимизации ИИ - 3

Подход Poetiq сочетает в себе передовые языковые модели, включая Gemini 3 и GPT-5.1, с моделями с открытым исходным кодом, интегрированными в специализированную архитектуру. Согласно Poetiq ^[5] , система работает по итеративному циклу: генерирует предлагаемые решения, оценивает обратную связь и уточняет ответы посредством самопроверки перед отправкой финального результата.

Хотите быть в курсе важных новостей из мира ИИ? Подписывайтесь на наш Telegram‑канал BotHub AI News ^[6].

Источник ^[7]

Автор: MrRjxrby

Источник ^[8]

Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/22587

URLs in this post:

[1] интеллекта: http://www.braintools.ru/article/7605

[2] запоминания: http://www.braintools.ru/article/722

[3] обучения: http://www.braintools.ru/article/5125

[4] повторения: http://www.braintools.ru/article/4012

[5] заявлении: https://poetiq.ai/posts/arcagi_announcement/

[6] BotHub AI News: https://t.me/bothub

[7] Источник: https://the-decoder.com/the-arc-benchmarks-fall-marks-another-casualty-of-relentless-ai-optimization/

[8] Источник: https://habr.com/ru/companies/bothub/news/971754/?utm_source=habrahabr&utm_medium=rss&utm_campaign=971754

Нажмите здесь для печати.