Свой инструмент для бенчмаркинга ИИ-агентов: архитектура, надёжность и интеграция с Airflow
Всем привет! Мы создаём GraphRAG-систему и нам постоянно приходится тестировать новые гипотезы: менять подходы к поиску по графу, обработку контекста, внешние интеграции и вспомогательные компоненты. Почти каждая такая гипотеза требует правок в коде или конфигурирования агента, а значит, быстро возникает несколько параллельных вариантов реализации, которые хочется сравнивать между собой.
Агентная экономика
Ежедневная деятельность любого бизнеса сопровождается постоянным заключением договоров. Значительную часть этого потока составляют закупки и поставки. Поскольку закупки занимают существенную долю расходов компании, прозрачность и управляемость этого процесса всегда находятся в фокусе внимания руководства.
Агент против агента: опыт участия в агентских соревнованиях BitGN PAC1 и AgentBeats
Егор СпиринРуководитель лаборатории прикладных агентов (ЛаПА) AI Talent Hub
Правильная агентская архитектура в 2026 г. Часть 2. Durable state: approvals, session context и background jobs
Продолжение статьи https://habr.com/ru/articles/1028290/ Твой ии-агент мог бы сыграть в сериале "Кибердеревня"В прошлой серии
Реальные данные о размерах подписок и качестве разнообразных моделей. Опыт Амбассадора AI
Доброго времени суток, я разработчик и амбассадор AI. Мой стаж работы в коммерческой разработке — 15 лет. Я работала в проектах с GLSL шейдерами, С/С++, Lua Jit, устав от компилятора, ушла в Front End, Digital Agency, Typescript, и сейчас продолжаю работать на Typescript.
DeepSeek v4 vs GLM 5.1: сравнительный бенчмарк агентов на реальных задачах разработки
На нашем замере DeepSeek v4 оказался примерно в полтора раза медленнее GLM 5.1 по скорости генерации - 29.81 против 47.65 токенов в секунду. DeepSeek v4:
Наглядный пример, зачем нужны агенты
Расскажу историю длиною в полгода на которой прекрасно прочувствовал все прелести современных инструментов и способов эксплуатации llm.

