ai.
ElevenLabs представила революционный инструмент для работы с ИИ-агентами
Компания ElevenLabs представила революционный инструмент для работы с ИИ-агентами — Agent Workflows
Вредные советы: как угробить своего AI-агента
Ваш AI-агент ведет себя как капризный стажер и доказывает, что 2+2=5? Или вы уже третью неделю пытаетесь дообучить модель, а она делает вид, что не понимает, чего вы от нее хотите?Кажется, пора признать: классические подходы не работают. Пока одни AI-инженеры кропотливо готовят данные и тестируют их, другие непослушные инженеры открыли простую истину. Они всё делают наоборот: не тестируют агентов, кормят модель мусором и открывают ей полный доступ к конфиденциальным данным.И знаете что? У них получаются самые незабываемые агенты!Мы
Тencent представила мультимодальную модель, объединяющую зрение и язык в одном фреймворке
Компания Tencent анонсировала новую мультимодальную модель HunyuanVision
Google показала будущее медицины через команду ИИ-агентов
Google опубликовала 150-страничный отчёт о проекте Health AI Agents, включающий более 7 000 аннотаций и свыше 1 100 часов экспертов. Однако главное в документе — не цифры и метрики, а новая философия дизайна медицинских AI-систем. Вместо создания монолитного «Doctor-GPT» компания предлагает концепцию Personal Health Agent (PHA) — модульную систему из трёх специализированных агентов, каждый из которых выполняет свою роль.
Playwright Agents — тесты, которые “живут своей жизнью”
Недавно вышло видео “Playwright v1.56: From MCP to Playwright Agents” и на первый взгляд оно выглядит как революция:ИИ-агент, который сам понимает, что тестировать, сам пишет тесты, сам их чинит. Никаких локаторов, никаких апдейтов при каждом изменении DOM - просто запускаешь и смотришь, как тесты выполняются.Но если вы хоть раз поддерживали живой тестовый проект в крупной компании, то вы уже чувствуете, где тут подвох.💡 Что обещаютСоздатели Playwright Agents говорят о новом уровне автоматизации:
Тестирование качества работы RAG. Описание и сравнение метрик
В современном мире часто встречаются задачи с большим объемом данных, выполнение которых либо невозможно, либо сложно или затратно по времени/ресурсам автоматизировать обычными функциями и методами.Одним из способов решения для таких случаев является применение AI с использованием RAG.В этой статье мы постарались привести метрики для оценки качества работы подобных решений.RAG (Retrieval Augmented Generation) - генерация ответов с использованием внешнего источника данных.
Топ-3 ML-модели для продуктовой аналитики
В продуктовых исследованиях часто встаёт вопрос — как не просто описывать поведение пользователей, а управлять им: понимать, кто уйдёт в отток, кто готов к апсейлу, а кому стоит предложить скидку или новую фичу. ML-модели позволяют формализовать закономерности в данных и прогнозировать, как конкретный пользователь поведёт себя в будущем или как изменится его поведение под воздействием наших действий.В этой статье я собрал три типа моделей, которые часто используются в решении таких задач. Первая
Anthropic и IBM объединяются для работы с корпоративными клиентами в сфере искусственного интеллекта
Компания Anthropic объявила о партнёрстве с

