локальный агент.

Как я заставил 9B обгонять 30B: три месяца с local LLM агентом

Я дал qwen3.5-9B (8-bit) и qwen3-coder-30B (iq2_xxs) одну задачу — исправить падающие тесты в Python-проекте. 9B справился за 3 шага. 30B сделал 24 шага, потерял нить, повторил одни и те же вызовы инструментов и вернул уверенный неправильный ответ.У 30B больше параметров. Он проиграл.Причина не в модели — в harness’е. Три месяца я строил агентный CLI для локальных LLM и разбирался, почему маленькая модель с правильным окружением стабильно бьёт большую без него. Вот что нашёл.Типичный сценарий провалаЗадача: исправить падающие тесты в репозитории.

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

локальный агент.

Как я заставил 9B обгонять 30B: три месяца с local LLM агентом

Меню навигации

Рекомендуем

На главную

Главное

Рубрики

Методики

Информация

Из архивов

локальный агент.

Как я заставил 9B обгонять 30B: три месяца с local LLM агентом