Запускаем Qwen3.6 35B-A3B + opencode локально на RTX 4070 12GB — AI-ассистент для разработки без облака
Я давно слежу за развитием локальных LLM, но всегда упирался в одно и то же — либо модель маленькая и качество не устраивает, либо большая и не влезает в видеопамять. Всё изменилось когда я наткнулся на статью про MoE-модели и параметр -cmoe в llama.cpp.Расскажу как я запустил Qwen3.6 35B-A3B на RTX 4070 12GB с 32GB RAM, настроил его как AI-ассистент для реального проекта в opencode, и почему теперь эта модель у меня работает постоянно.Железо и ожиданияМоя конфигурация:GPU: RTX 4070 12GB VRAMRAM: 32GB DDR4CPU: 12 физических ядерOS: Windows 11 + WSL2 (Ubuntu)
Зелёные галочки лгут: почему AI пишет тесты, которые ничего не тестируют, и как это починить
Тесты зелёные, покрытие растёт, а багов меньше не становится. На QA-митапе инженер из крупной продуктовой компании показал механику: AI-агенты подгоняют моки, меняют ассерты, генерируют результаты, которые ничего не проверяют. Стек у команды — near-SOTA. Модель свежая. Агент — один из лидеров open-source.Значит, дело не в инструментах. А в чём именно — разбираю ниже: от кода до процесса и организации.Зелёные галочки лгутДокладчик описал паттерн, с которым сталкивался каждый, кто просил AI написать тесты:
Z.Ai снова обновили цены на свои подписки Coding Plan
Совсем недавно цены были такие: старая страница с тарифами z.ai на coding planА теперь цены выглядят уже не так приятно, я бы даже сказал, кусаются:
Структурно-ориентированная кодовая база для агента
Агент, который ничего не зналПри первом запуске агент не знает структуру проекта. Из-за этого возникают проблемы:Читает слишком много файлов и быстро расходует контекст.Или, наоборот, не находит нужные файлы и места в коде.Справочный файлОдин из способов снизить эти проблемы — создать справочный файл ./docs/reference.md, где описаны ключевые файлы проекта и их назначение.Минусы:Вручную поддерживать сложно.Если генерировать описание агентом, то для конкретной задачи в нём часто не хватает деталей.Кодовая база как собственная справка
Data Structure Protocol (DSP): как дать LLM-агентам «долговременную память» о большом репозитории
Есть паттерн, который видит кажд��й, кто работает с агентами: первые 5–15 минут уходят не на задачу, а на "ориентацию". Где точка входа? Откуда растут зависимости? Почему эта библиотека, а не другая? Кто считает это публичным API? В маленьком проекте раздражает. В большом — превращается в постоянный налог на токены и внимание.DSP (Data Structure Protocol) "выносит карту проекта наружу" — в простой, версионируемый, языковой граф, который живёт рядом с кодом и доступен агенту как постоянная память.k-kolomeitsev/data-structure-protocolЦель в архитектуре сформулирована так:
MCP сервер для заказа продуктов из ВкусВилла: сделай своего агента
Привет! Я Сабина из Центра экспертизы ИИ, ВкусВилл. И у нас есть новости.

