- BrainTools - https://www.braintools.ru -

Годами тест ARC считался практически непреодолимым препятствием для нейросетей, настоящим испытанием гибкого интеллекта [1], а не простого запоминания [2]. Но новые результаты показывают, что даже этот барьер рушится под неустанной оптимизационной работой современных лабораторий искусственного интеллекта.
«Корпус абстракции и рассуждений», позже переименованный в ARC-AGI, изначально был разработан для отделения истинного обучения [3] от статистического повторения [4]. Теперь его постигла та же участь, что и многие предыдущие бенчмарки: новые методы его просто подавляют.
Новые результаты компании Poetiq, занимающейся разработкой ИИ, свидетельствуют об успешном решении исходного бенчмарка ARC-AGI-1. В недавнем заявлении [5] компания утверждает, что её системы, построенные на моделях OpenAI и Google, достигли максимальной производительности на первом наборе данных. Более того, сообщается, что система превзошла средний человеческий результат в 60% на значительно более сложном наборе данных ARC-AGI-2.

Подход Poetiq сочетает в себе передовые языковые модели, включая Gemini 3 и GPT-5.1, с моделями с открытым исходным кодом, интегрированными в специализированную архитектуру. Согласно Poetiq [5] , система работает по итеративному циклу: генерирует предлагаемые решения, оценивает обратную связь и уточняет ответы посредством самопроверки перед отправкой финального результата.
Хотите быть в курсе важных новостей из мира ИИ? Подписывайтесь на наш Telegram‑канал BotHub AI News [6].
Источник [7]
Автор: MrRjxrby
Источник [8]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/22587
URLs in this post:
[1] интеллекта: http://www.braintools.ru/article/7605
[2] запоминания: http://www.braintools.ru/article/722
[3] обучения: http://www.braintools.ru/article/5125
[4] повторения: http://www.braintools.ru/article/4012
[5] заявлении: https://poetiq.ai/posts/arcagi_announcement/
[6] BotHub AI News: https://t.me/bothub
[7] Источник: https://the-decoder.com/the-arc-benchmarks-fall-marks-another-casualty-of-relentless-ai-optimization/
[8] Источник: https://habr.com/ru/companies/bothub/news/971754/?utm_source=habrahabr&utm_medium=rss&utm_campaign=971754
Нажмите здесь для печати.