Безопасность агентов, экономика GPU и метрики AI в разработке — что обсудим в Технотреке Conversations?
Как защитить кодовых агентов от атак? Почему ваша SOTA не доходит до прода? Сколько на самом деле стоит AI после MVP? Об этом и многом другом поговорим 25 и 26 июня на Conversations!2 дня, 4 трека – о генеративном ИИ в бизнес-процессах, продуктах, AI-native командах и в разработке, 65+ спикеров, 700+ участников, церемония награждения премии Generation AI Awards. И очень много экспертизы по GenAI.
Агент против агента: опыт участия в агентских соревнованиях BitGN PAC1 и AgentBeats
Егор СпиринРуководитель лаборатории прикладных агентов (ЛаПА) AI Talent Hub
Copilot больше не в моде: Microsoft представила AI-агента Scout на базе OpenClaw
Microsoft представила Scout — AI-агента для рабочих задач, который интегрирован в экосистему Microsoft 365. Нейросетевой помощник построен на базе OpenClaw, работает автономно, может держать в контексте задачи пользователя и следить за рабочим процессом.
Я сошёл с ума и сдаю свой браузер ИИ-агентам
Безумные цены, полная распродажа, я даже не знаю что происходит.
Evals для чайников. Как тестировать AI-агента, чтобы понимать, где именно он ломается
Большинство команд оценивают производительность AI-агентов через end-to-end метрики: success rate, количество токенов, tool usage, стоимость запроса, долю успешных задач. Это полезно для общего контроля ситуации, но почти бесполезно для реальной диагностики системы.
Агент читает 20 файлов ради одной функции. Лечим это графом кода: CodeGraph vs Graphify и другие невиданные твари
CodeGraph и Graphify решают разные задачи, хотя оба строят граф кода на tree-sitter. CodeGraph — лёгкий локальный индекс символов для рантайма агента. Graphify — граф знаний всего проекта, включая документы, PDF и медиа.CodeGraph работает 100% локально (SQLite + FTS5), без внешних API. Graphify код тоже парсит локально и бесплатно, а токены тратит только на документы и медиа — и то через модель твоей IDE-сессии, без отдельных ключей.Их бенчмарки CodeGraph: −57% токенов, −71% tool calls, −46% времени на 7 репозиториях. Это их цифры на их выборке, я не воспроизводил. Своё ощущение — заметно быстрее и точнее, но замеров не делал, честно.

