agentic ai.

Рекурсивные языковые модели (RLM) – парадигма 2026 года

Команда AI for Devs подготовила перевод большого исследовательского материала о рекурсивных языковых моделях (RLM). Авторы разбирают, почему простое увеличение контекстного окна больше не решает проблему долгоживущих агентов, и показывают альтернативу: обучение моделей активному управлению собственным контекстом через context folding и под-LLM. Статья основана на обширных экспериментах и даёт практический взгляд на то, каким может быть следующий шаг в развитии LLM-агентов.Как мы планируем управлять чрезвычайно длинными контекстами

продолжить чтение

GPT-4o: технический разбор модели, которая взрывает людям мозги

В 2025 году я встретила минимум трёх адекватных взрослых людей с образованием, которые после общения с GPT-4o реально ехали крышей. Один — разработчик с 10-летним стажем, начал строить "революционный стартап" за ночь, не спал трое суток, речь скачками. Второй — биоинженер, после двухнедельного марафона с 4o открыл "секрет сознания". Третий — преподаватель, впал в манию величия: "Я нашла способ обучать ИИ эмоциям!". Все трое были нормальными людьми. Что происходит с этой моделью технически? Давайте разберёмся — особенно после того, как выяснилось, что даже инвестор OpenAI пострадал.Известные кейсы: от подростка до инвестора

продолжить чтение

Исследование ИИ экосистемы разработки 1С

В статье приведен результат опроса сообщества 1С разработчиков на предмет применения ИИ в своей текущей деятельности.На конец 2025 года был проведен опрос сообщества на предмет использования ИИ. Цель — понять какие технологиимоделиподходыпрактики обрели популярность.Какие технологии «прижились» среди 1С разработчиков, а какие пока воспринимаются с опаской. Так получилось, что моя деятельность во многом связана с продвижением ИИ в среде 1С. Так вот, главный интерес заключается в том что получилось а что нет. А может некоторые практики и технологии упущены.

продолжить чтение

Как поднять точность RAG-агента: чек-лист и инструменты. Часть 2. Финал

В первой части я разбирал архитектуру AI-агента, выбор между RAG и GraphRAG на примере AI-юриста для техподдержки. Если пропустили – https://habr.com/ru/articles/975230/Во второй части решил уделить внимание тому, как добиться нормального качества поиска и точности ответов. Чтобы AI-агент не остался в песочнице и не превратился в очередной эксперимент "мы попробовали, не взлетело".Надеюсь мой опыт будет полезен и вы сэкономите себе деньги, нервы и время. А может быть и вовсе откажетесь от идеи создания агента — это тоже нормальный исход.

продолжить чтение

От RAG-Движка к AI Агенту за 5 Дней

Логотип проекта. Почему "Глобальный"?

продолжить чтение

ИИ-ученые 2025: SR-Scientist, DeepEvolve и Kosmos — чем отличаются и зачем. И почему выстрелил Kosmos

В 2025-м на наших глазах складывается новый класс инструментов - ИИ-Ученые (AI-Scientist). Если раньше алгоритмы ИИ могли только генерировать идеи или перерабатывать уже известные решения, то современные системы умеют не просто придумывать гипотезы, но и реализовывать их на практике, тестировать и совершенствовать из раза в раз. Речь не просто про чат-боты и Co-Pilot’ы, речь про агентные системы, которые сами ставят гипотезы, пишут и исполняют код, проверяют результаты и накапливают опыт. В чем сутьВ науке есть 3 сложных момента:понять, что уже известно

продолжить чтение

Актуальные вопросы по ИИ и перспективным технологиям

Эксперты Gartner дают краткие ответы на свежие вопросы клиентов о перспективных технологиях.1. Как реагировать на запуск модели Anthropic Claude Sonnet 4.5?Claude Sonnet 4.5 сигнализирует о намерении Anthropic сместить фокус к доменной специализации на всё более конкурентном рынке генеративных моделей (GenAI). Рекомендации Gartner:Лидерам в области ИИ:

продолжить чтение

Почему ИИ в программировании спотыкается в реальной работе: новый бенчмарк показал всю правду

продолжить чтение

Почему бокс — это мультиагентная система

Привет! ИИ-агенты — главная горячая тема этого года, но все наверняка видели как их ради хайпа пытаются затащить куда угодно, совсем не глядя на эффективность и какой-либо здравый смысл.В этой статье я расскажу о действительно полезном применении концепции агентов и попробую доказать, почему любой боксерский поединок является мультиагентной системой. Поговорим про system design бокса, про reinforcement learning, адаптивные алгоритмы, всевозможный вызов tools типа джебов или клинча, очереди сообщений и гарантию их доставки, graceful degradation агентов и многое другое.

продолжить чтение

PCW — новая метрика продуктивности разработчиков с ИИ

Команда AI for Devs подготовила перевод статьи о метрике Percentage of Code Written (PCW) от Windsurf. Эта метрика показывает, какой процент кода в проекте реально пришёл от ИИ. Авторы утверждают: PCW надёжнее привычных показателей вроде acceptance rate и отражает, насколько продукт действительно помогает разработчикам. А как вы думаете — можно ли измерить ценность ИИ в цифрах?Что такое Percentage of Code Written (PCW)?

продолжить чтение

123
Rambler's Top100