- BrainTools - https://www.braintools.ru -

Падение бенчмарка ARC стало очередной жертвой неустанной оптимизации ИИ

Падение бенчмарка ARC стало очередной жертвой неустанной оптимизации ИИ - 1

Годами тест ARC считался практически непреодолимым препятствием для нейросетей, настоящим испытанием гибкого интеллекта [1], а не простого запоминания [2]. Но новые результаты показывают, что даже этот барьер рушится под неустанной оптимизационной работой современных лабораторий искусственного интеллекта.

«Корпус абстракции и рассуждений», позже переименованный в ARC-AGI, изначально был разработан для отделения истинного обучения [3] от статистического повторения [4]. Теперь его постигла та же участь, что и многие предыдущие бенчмарки: новые методы его просто подавляют.

Новые результаты компании Poetiq, занимающейся разработкой ИИ, свидетельствуют об успешном решении исходного бенчмарка ARC-AGI-1. В недавнем заявлении [5] компания утверждает, что её системы, построенные на моделях OpenAI и Google, достигли максимальной производительности на первом наборе данных. Более того, сообщается, что система превзошла средний человеческий результат в 60% на значительно более сложном наборе данных ARC-AGI-2.

Результаты Poetiq показывают, что исходный тест ARC-AGI-1 был в значительной степени решен, в то время как производительность на более сложном наборе данных ARC-AGI-2 теперь превышает средние человеческие показатели

Результаты Poetiq показывают, что исходный тест ARC-AGI-1 был в значительной степени решен, в то время как производительность на более сложном наборе данных ARC-AGI-2 теперь превышает средние человеческие показатели
Падение бенчмарка ARC стало очередной жертвой неустанной оптимизации ИИ - 3

Подход Poetiq сочетает в себе передовые языковые модели, включая Gemini 3 и GPT-5.1, с моделями с открытым исходным кодом, интегрированными в специализированную архитектуру. Согласно Poetiq [5] , система работает по итеративному циклу: генерирует предлагаемые решения, оценивает обратную связь и уточняет ответы посредством самопроверки перед отправкой финального результата.


Хотите быть в курсе важных новостей из мира ИИ? Подписывайтесь на наш Telegram‑канал BotHub AI News [6].

Источник [7]

Автор: MrRjxrby

Источник [8]


Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/22587

URLs in this post:

[1] интеллекта: http://www.braintools.ru/article/7605

[2] запоминания: http://www.braintools.ru/article/722

[3] обучения: http://www.braintools.ru/article/5125

[4] повторения: http://www.braintools.ru/article/4012

[5] заявлении: https://poetiq.ai/posts/arcagi_announcement/

[6] BotHub AI News: https://t.me/bothub

[7] Источник: https://the-decoder.com/the-arc-benchmarks-fall-marks-another-casualty-of-relentless-ai-optimization/

[8] Источник: https://habr.com/ru/companies/bothub/news/971754/?utm_source=habrahabr&utm_medium=rss&utm_campaign=971754

www.BrainTools.ru

Rambler's Top100