ai-агенты. - страница 8

SaaS умирает? Я сравнил 8 публикаций Q1 2026 с тем, что вижу внутри Kaiten

Последние месяцы я вижу одну и ту же мысль: SaaS умирает, AI-агенты забирают работу из интерфейсов, а компании перестают платить за пользовательские лицензии. На первый взгляд кажется, что так и есть.  Если агент может сам прочитать CRM, создать задачу, разобрать заявку, сходить в API и принести руководителю готовый статус, зачем держать десятки людей в системе? Пусть машина сама делает работу, а человек только проверяет. 

продолжить чтение

Как мы строим «человеко-агентную» организацию: приглашаем на честный разговор 27 мая

Человеко-агентная организация: новая парадигма

продолжить чтение

Почему ломается ваш AI-агент — и почему смена модели обычно его не чинит

Представьте внутреннего AI-агента, который помогает компании искать общие документы и управлять ими. Он работает. До тех пор, пока 12–15% запросов не начинают падать. Агент возвращает не тот документ, редактирует не тот файл, молча падает или уверенно ссылается на файл, которого не существует. Поиск по фото отказывает с той же частотой. Ошибки размазаны равномерно по пользователям, фичам и запросам.

продолжить чтение

Spec-driven development в микросервисах, часть 2: как archspec делает контекст сервисов явным

Вторая статья из цикла из трёх частей.Часть 1 — где LLM теряет межсервисный контекст и почему локальных спек недостаточно.

продолжить чтение

AI обнулил benchmark и пытался шантажировать инженера. И почему это решаемо

В прошлой главе я разобрал три провала чужих AI-агентов в проде - PocketOS, потерю production-базы Replit и сценарии GitHub Copilot, в которых агент действовал быстрее, чем человек успевал сказать стоп.Финал был честный: эти три - не про то, как делать правильно. Это места, где меня поймало бы, если бы я не прочитал разборы до того, как Lexis стал продуктом для людей.И я обещал в следующей главе перейти с уровня отдельные истории на уровень данных. Конкретно - две вещи.Первая: ProgramBench. Топ-модели, которые закрыли SWE-bench на 95%, на ProgramBench показывают 0% и 3%. Не упали на десять пунктов - обнулились.

продолжить чтение

Не надо встраивать ИИ в каждую корпоративную систему, это архитектурная ошибка

продолжить чтение

AI-агент для финансовых процессов: как мы научили ИИ считать числа из базы данных без галлюцинаций

ИИ-агент в «Первой Форме» работает со всеми типами бизнес-процессов: документы, регламенты, задачи, заявки, договоры. Текстовые вопросы он закрывал хорошо с самого начала. А вот финансовые — с галлюцинациями. Мы переделали подход — и теперь агент отвечает точно, с совпадением с SQL до рубля. Ниже — как именно это устроено.Почему RAG не умеет считать

продолжить чтение

Стяж одностороннего потока против маятникового раскола в процессе целенаправленного (и не только) наращивания ветвей

Привет Хабр. Надеюсь читатели поймут моё желание закрепить

продолжить чтение

Колесо потока против раскола

Привет Хабр. Надеюсь читатели поймут моё желание закрепить результат по алгоритмизации

продолжить чтение

Reasoning-модели сломали мой промпт-инжиниринг. Год переучиваюсь

Вторник, час ночи. Сижу пишу промпт чтобы вытащить из 40 PDF-ок с актами нужные поля в JSON. Задача рутинная, у меня под неё лежит проверенный шаблон. Развёрнутый CoT, три few-shot примера, роль «опытный финансовый аналитик с 15 лет опыта». Раньше работал как часы.Закидываю в GPT-5.5 с высоким мышлением. Получаю мусор. Половина полей не та, формат сломан, в выводе развёрнутое рассуждение которое я не просил.Думаю ладно, заглючило. Прогоняю ещё раз. То же самое.Удаляю промпт целиком. Пишу заново, тупо: «вытащи из приложенного текста поля X, Y, Z в виде JSON, никаких пояснений». Десять строк. Запускаю.Работает.

продолжить чтение

1...67891011...20...26