ai.

ElevenLabs представила революционный инструмент для работы с ИИ-агентами

Компания ElevenLabs представила революционный инструмент для работы с ИИ-агентами — Agent Workflows

Оставлено в

Вредные советы: как угробить своего AI-агента

Ваш AI-агент ведет себя как капризный стажер и доказывает, что 2+2=5? Или вы уже третью неделю пытаетесь дообучить модель, а она делает вид, что не понимает, чего вы от нее хотите?Кажется, пора признать: классические подходы не работают. Пока одни AI-инженеры кропотливо готовят данные и тестируют их, другие непослушные инженеры открыли простую истину. Они всё делают наоборот: не тестируют агентов, кормят модель мусором и открывают ей полный доступ к конфиденциальным данным.И знаете что? У них получаются самые незабываемые агенты!Мы

продолжить чтение

Оставлено в

Тencent представила мультимодальную модель, объединяющую зрение и язык в одном фреймворке

Компания Tencent анонсировала новую мультимодальную модель HunyuanVision

продолжить чтение

Оставлено в

Google показала будущее медицины через команду ИИ-агентов

Google опубликовала 150-страничный отчёт о проекте Health AI Agents, включающий более 7 000 аннотаций и свыше 1 100 часов экспертов. Однако главное в документе — не цифры и метрики, а новая философия дизайна медицинских AI-систем. Вместо создания монолитного «Doctor-GPT» компания предлагает концепцию Personal Health Agent (PHA) — модульную систему из трёх специализированных агентов, каждый из которых выполняет свою роль.

продолжить чтение

Оставлено в

Ученый Google получил Нобелевскую премию по физике 2025 года

продолжить чтение

Оставлено в

Playwright Agents — тесты, которые “живут своей жизнью”

Недавно вышло видео “Playwright v1.56: From MCP to Playwright Agents” и на первый взгляд оно выглядит как революция:ИИ-агент, который сам понимает, что тестировать, сам пишет тесты, сам их чинит. Никаких локаторов, никаких апдейтов при каждом изменении DOM - просто запускаешь и смотришь, как тесты выполняются.Но если вы хоть раз поддерживали живой тестовый проект в крупной компании, то вы уже чувствуете, где тут подвох.💡 Что обещаютСоздатели Playwright Agents говорят о новом уровне автоматизации:

продолжить чтение

Оставлено в

Тестирование качества работы RAG. Описание и сравнение метрик

В современном мире часто встречаются задачи с большим объемом данных, выполнение которых либо невозможно, либо сложно или затратно по времени/ресурсам автоматизировать обычными функциями и методами.Одним из способов решения для таких случаев является применение AI с использованием RAG.В этой статье мы постарались привести метрики для оценки качества работы подобных решений.RAG (Retrieval Augmented Generation) - генерация ответов с использованием внешнего источника данных.

продолжить чтение

Оставлено в

Топ-3 ML-модели для продуктовой аналитики

В продуктовых исследованиях часто встаёт вопрос — как не просто описывать поведение пользователей, а управлять им: понимать, кто уйдёт в отток, кто готов к апсейлу, а кому стоит предложить скидку или новую фичу. ML-модели позволяют формализовать закономерности в данных и прогнозировать, как конкретный пользователь поведёт себя в будущем или как изменится его поведение под воздействием наших действий.В этой статье я собрал три типа моделей, которые часто используются в решении таких задач. Первая

продолжить чтение