
Институт Аллена по ИИ (Ai2) выложил в open-source семейство кодинг-агентов SERA. Речь идет о полноценном агентном стеке, заточенном под работу с реальными, грязными и большими кодовыми базами, а не синтетическими задачами из учебников.
Флагманская версия SERA-32B показывает 55%+ на SWE-Bench Verified, обгоняя не только открытые модели вроде Qwen3-Coder, но и некоторые закрытые коммерческие решения. Это особенно важно, потому что SWE-Bench проверяет не абстрактные навыки, а умение чинить баги в настоящих репозиториях, с зависимостями, тестами и контекстом.
Младшая модель SERA-8B набирает 29,4%, и для своего размера это очень сильный результат. По сути, Ai2 показывает, что полезный кодинг-агент не обязан быть монстром на десятки миллиардов параметров.
Отдельного внимания заслуживает экономика обучения. По словам команды, полный цикл тренировки агентов обошелся примерно в $400, что выглядит почти фантастикой на фоне привычных бюджетов. Добиться этого удалось за счет агрессивного использования синтетических данных, тщательно выстроенного пайплайна и фокуса не на «общем интеллекте», а на конкретной задаче – инженерной работе с кодом.
Еще один важный момент – полная открытость. В open-source выложены не только веса моделей, но и:
• скрипты обучения,
• агентная логика,
• инструменты интеграции с Claude Code,
• примеры работы с реальными репозиториями.
Фактически, Ai2 дает готовый конструктор для сборки собственного ИИ-разработчика. Его можно адаптировать под конкретный стек, компанию или даже один большой проект, не завязываясь на закрытые API и лицензии.
Делегируйте часть рутинных задач вместе с BotHub! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!
Автор: cognitronn


