ai-агенты. - страница 11

Как я сделал AI‑директора для малого бизнеса и почему отказался от RAG

Уровень: senior backend, AI/ML Стек: FastAPI, SQLite, Claude Haiku 4.5, кастомный scheduler Что внутри: архитектура AI‑агента для команды 5–50 человек, типизированная память вместо vector RAG, граф знаний организации, ежедневный reflectionЧто такое Лира на пальцахМаленькая компания, человек 20. Гендир тонет в задачах. Помнить кто что обещал, отслеживать движение по целям, держать в голове десяток проектов одновременно. У больших корпораций для этого есть штат руководителей среднего звена и проджектов. У малых есть один директор, который пытается быть всем сразу.

продолжить чтение

1 миллион токенов в Opus 4.7 — маркетинг. Реально полезных — 300 тысяч. И сами Anthropic это подтверждают

В начале мая Кангвук Ли (CAIO Krafton) опубликовал в X разбор: двумя API-вызовами и 35 строками Python он вытащил из Codex AES-зашифрованный compaction-blob и реконструировал серверный промпт сжатия контекста. Тот оказался почти идентичен открытому промпту Codex CLI, который лежит в репозитории openai/codex в prompt.md и summary_prefix.md. Сам Ли в финале признаётся: ожидал найти «секретный соус», нашёл — почти то же, что в опенсорсе.Параллельно с этим у Anthropic с января 2026 живёт public beta серверной компакции compact_20260112

продолжить чтение

Короткий промпт ≠ дешёвый промпт: как оптимизация ломает prefix cache в LLM-агентах

Привет, Хабр! Меня зовут Сергей Нотевский, я AI Platform Lead в Битрикс24.Это третья статья серии про prefix caching: первая - про экономику кэширования и особенности разных провайдеров, вторая - про антипаттерны в простых сценариях. А здесь про то, как та же механика работает против вас в агентном цикле.TL;DRЕсли на каждом шаге менять tools, system prompt или ранние блоки context, prefix cache будет часто начинаться заново.Поэтому большой, но стабильный список tools иногда дешевле, чем маленький список, который постоянно пересобирается.

продолжить чтение

Почему бенчмарки в AI сломались — и что с этим делать в понедельник

В январе 2026 года Янн Лекун, уходя из Meta, сказал в интервью Financial Times про релиз Llama 4: «The results were fudged a little bit» (Fast Company, 6 января 2026). Команда показывала на LMArena одну версию модели, в продакшен ушла другая. На бенчмарке всё было правильно. В реальности код был хуже DeepSeek V3.Я хочу разобрать эту историю. Не потому что Meta — исключение. Потому что они — симптом.TL;DR.

продолжить чтение

Доставка со скоростью инференса

Это перевод статьи Питера Штайнбергера (@steipete

продолжить чтение

От ChatGPT к мультиагентному контент-пайплайну: как 5 AI-агентов пишут мне кейсы

Это не просто статья на Хабре. Это AI-сгенерированная статья на Хабре. Ха! Попались? Меня зовут Ксения Иванчикова, я развиваю медиа Generation AI. Еще год назад я писала умные промпты для ChatGPT в надежде получить глубокий и качественный контент — получалось так себе. Недавно я навайбкодила пайплайн из пяти AI-агентов: они берут 20-минутную запись доклада с YouTube, выдают готовый кейс и верстают контент на WordPress. Рассказываю про опыт создания контент-машинки, которая не делает нейрослоп. 

продолжить чтение

Два окна в работе с AI-агентами: архитектор и разработчик. Самый недооценённый паттерн

Самый рабочий паттерн в работе с AI-агентами на код — два окна. Одно с архитектором/проверяющим, второе с разработчиком. Можно собрать на одной модели: Claude в обоих окнах с разными системными промптами и сессиями. Можно смешать — у меня сейчас Claude Code в окне разработчика и GPT-5.5 в режиме высокого мышления в окне архитектора. Модель важна меньше, чем разделение ролей.Почему один агент почти всегда хуже двух, что делает каждое из окон, и где этот паттерн избыточен.Почему один агент — это плохо

продолжить чтение

Veai 5.10: общие скиллы и подсказки в чате

Главное в релизе – скиллы теперь подхватываются из dot-директорий других ассистентов. В чат добавили быструю документацию по ссылкам на код.Скиллы из dot-директорий других вендоровТипичная ситуация – в команде один работает на Claude Code, второй на Cursor, третий на Veai. У каждого своя папка под скиллы, и одни и те же инструкции расходятся по .claude, .cursor, .veai. Чтобы агент в Veai знал то же, что агент в Claude Code, скиллы приходилось копировать руками и потом следить, чтобы версии не разъехались.Теперь Veai ищет скиллы не только в .veai/skills/*/SKILL.md, но и в .*/skills/*/

продолжить чтение

Монтаж видео через Claude Code

Разбираю архитектуру открытого проекта от browser-use: как заставить LLM монтировать без необходимости «смотреть» видеоКогда речь заходит про обработку видео нейросетями, у большинства из нас в голове всплывает одна и та же картина: модель смотрит на кадры, что-то понимает на основе изображения, режет по визуальным признакам. На практике это упирается в простую арифметику. Часовое видео в 30 fps — это 108 000 кадров. Если каждый кадр стоит хотя бы 1500 токенов, получаем 162 миллиона токенов на одно видео. Никакая модель столько не возьмёт за один проход, а если резать на куски — теряется глобальный контекст.

продолжить чтение

Люди скупают Mac Mini M4, а SpaceX покупает Cursor за $60 млрд: ML-дайджест

продолжить чтение

1...91011121314...20...27