Оказывается, у JetBrains есть свой CLI-агент Junie и он оказался лучшим в Terminal-Bench 2.0. cli.. cli. coding.. cli. coding. junie.. cli. coding. junie. llm.. cli. coding. junie. llm. Будущее здесь.. cli. coding. junie. llm. Будущее здесь. искусственный интеллект.. cli. coding. junie. llm. Будущее здесь. искусственный интеллект. Машинное обучение.. cli. coding. junie. llm. Будущее здесь. искусственный интеллект. Машинное обучение. Программирование.

Оказывается, JetBrains тихо развивает собственный агент для работы в терминале — Junie CLI. Инструмент не фигурирует в публичных анонсах, но именно он занял первое место в свежем бенчмарке Terminal-Bench 2.0, обойдя более известные решения.

Terminal-Bench — это прикладной бенчмарк для оценки агентных систем, работающих внутри терминального окружения. Агенту выдается контейнер с «сырой» средой и набор инженерных задач: выполнять shell-команды, писать и править скрипты, устанавливать зависимости, разбираться с ошибками окружения, дебажить и доводить систему до рабочего состояния.

Оказывается, у JetBrains есть свой CLI-агент Junie и он оказался лучшим в Terminal-Bench 2.0 - 1

В отличие от reasoning-бенчмарков, где оценивается качество рассуждений на синтетических задачах, Terminal-Bench проверяет именно инженерную компетенцию. Здесь важно не рассуждать, а последовательно действовать: планировать шаги, корректно взаимодействовать с инструментами, учитывать состояние среды и получать воспроизводимый результат.

Оказывается, у JetBrains есть свой CLI-агент Junie и он оказался лучшим в Terminal-Bench 2.0 - 2

Русскоязычное сообщество про AI в разработке

Оказывается, у JetBrains есть свой CLI-агент Junie и он оказался лучшим в Terminal-Bench 2.0 - 3

Друзья! Эту новость подготовила команда ТГК «AI for Devs» — канала, где мы рассказываем про AI-ассистентов, плагины для IDE, делимся практическими кейсами и свежими новостями из мира ИИ. Подписывайтесь, чтобы быть в курсе и ничего не упустить!

Автор: python_leader

Источник

Rambler's Top100