бенчмарк AGI.

Люди набирают 100%, GPT-5.4 — 0,26%, а Google хватило всего лишь 3-бит

Седьмой выпуск еженедельных IT-новостей от OpenIDE: новый бенчмарк AGI, которому модели не смогли угодить, трёхбитная квантизация от Google, ACP-протокол в OpenIDE, GigaChat 3.1 и бесславный конец Sora.Вышел ARC-AGI-3. Люди — 100%, модели — меньше 2%Тест ARC-AGI-3

продолжить чтение

Rambler's Top100