Как создать ИИ‑ассистента на кодовой базе компании: опыт команды музыкального сервиса Звук
Привет! Хочу рассказать про AI‑трек, который проектировала наша команда на UWDC 2026, масштабной конференции разработчиков на Урале.
Один роутер, три агента: как support, admin и маркетинг-боты живут на одном дешёвом инференсе
Спойлер: мы собрали это за 2-3 дня. Не потому что мы гении, а потому что когда инференс перестаёт стоить как чугунный мост, можно перестать экономить на агентах и начать их просто… плодить.Привет, это дев-команда. Последние пару вечеров мы занимались тем, что любой, кто делал ИИ-агента, узнает с полуслова: «а давайте ещё одного». Сначала был один support-бот. Потом ему понадобился «начальник». Потом мы поняли, что та же инфраструктура отлично тащит маркетинговых userbot’ов. Три разных агента, три роли — но общий мозг, общий слой инструментов и один кошелёк.
skill-compass: хук, который сам подсказывает Claude Code нужные скиллы
У Claude Code есть одна неприятная особенность, про которую редко говорят вслух. Можно навесить на агента огромную библиотеку скиллов — дизайн, проектирование API, миграции БД, ревью безопасности, отдельные наборы под каждый язык, — и всё это будет честно лежать в ~/.claude/skills/. Нужный скилл почти всегда там есть. Проблема не в том, что его нет. Проблема в том, что про него надо вспомнить в нужный момент.
Как мы превратили 700 студентов‑гуманитариев в продуктовые команды и получили 51 MVP за 8 недель
Что произойдёт, если обучать гуманитариев как стартапы: результаты эксперимента на 700 студентах
Картинки рвало полосами, а файлы при этом были чистыми
Три ночи я был уверен, что у меня сломан рендер.Вертикальные картинки — те самые 9:16, под обои телефона и под сторис, — на экране разъезжались горизонтальными полосами. Как будто старый телевизор поймал помехи. Квадрат рисуется нормально. Горизонталь — нормально. А вертикалку рвёт в труху.Три раза я её «починил». И все три раза чинил вообще не то.Правда оказалась дурацкой и красивой одновременно: файлы были в полном порядке. Рвало только то, как macOS показывала их на экране. Но к этому моменту я уже немного поседел.
Что происходит с LLM‑пайплайном, если провайдер падает посреди выполнения
В 2025 году каждый крупный провайдер LLM пережил минимум один значимый сбой. Большинство решений этой проблемы — gateway‑слой снаружи приложения: LiteLLM, Bifrost, Kong AI Gateway. Они перехватывают упавший HTTP‑запрос и повторяют его на другом провайдере.Это работает для одного вызова, но не работает для многошагового пайплайна — gateway не знает, что упавший запрос был вторым шагом из трёх. Он видит запрос, которому нужен retry, а не позицию в конечном автомате.В этой статье — как реализовать fallback провайдера как явный переход FSM на реальном стеке llm‑nano‑vm 0.8.6
Opus оркеструет, DeepSeek V4 пишет код: как собрать связку внутри Claude Code и сэкономить деньги
Однажды я открыл биллинг и просто посмотрел, на что уходят токены. Не на «подумать над архитектурой». А на переименование переменных, генерацию тестов по готовому ТЗ и прогон миграций. Всё это считалось по тарифу флагманской модели, хотя такую работу вытянет модель в десятки раз дешевле.Ниже – как развести действительно сложные задачи и рутину по двум моделям внутри Claude Code, не ставя ни одного стороннего форка. И три зоны, куда дешёвую модель я не пускаю принципиально. Что на самом деле сжигает токены
Golden Armada: трассировки как основа наблюдаемой AI-native системы
Введение В предыдущей статье я описал идею изменения парадигмы программирования в условиях, когда значительная часть кода начинает генерироваться LLM. 👉 Предыдущая статьяТам основная мысль была следующая: код перестаёт быть единственным источником истины, а роль разработчика смещается в сторону архитектуры, контрактов и ограничений. В этой статье я хочу показать следующий шаг — не концепцию, а реализацию. 🌲 От теории к наблюдаемой системе Если предыдущий текст был про “как должно быть”, то Golden Armada — это попытка ответить на вопрос:
Как я перестал исправлять ИИ код и начал проектировать под него архитектуру
Вместо вступленияЗа последний год я заметил странную закономерность. Когда кодовая база была небольшая, все было хорошо, но чем больше кода писал ИИ, тем меньше времени уходило на добавление фичей и больше — на исправление текущего кода. Это сильно раздражало.Я как будто ходил по кругу:Сначала мне казалось: сейчас заставлю ИИ самому для себя писать правила. Кол‑во правил росло, сложность росла. Сначала в них переставал ориентироваться я, потом ИИ.

