Production.

Модель не виновата: разбираем 3 громких ИИ-инцидента, которые случились из-за отсутствия архитектуры

Привет! На связи Катерина Лапаева, руководитель агентства в сфере AI – GIGASCHOOL. В мае наша команда проектировала AI-трек на одной из самых масштабных конференций для разработчиков на Урале – UWDC 2026, где мы запустили дискуссию. Обсудили, когда нужны большие языковые модели, а когда задачу проще, дешевле и надёжнее решить другими технологиями.

продолжить чтение

Оставлено в

AI‑агенты в проде: 6 архитектурных ошибок, из‑за которых они не доживают до запуска

Всем привет, меня зовут Сергей Прощаев, и в этой статье я расскажу про шесть архитектурных ошибок, из‑за которых AI‑агенты прекрасно ведут себя на демо и разваливаются в продакшене. Я Tech Lead и руководитель направления Java | Kotlin разработки в FinTech & E‑commerce и преподаю на курсах разработки и архитектуры в ОТУС.За последний год на архитектурных ревью и собеседованиях я увидел не один десяток «

продолжить чтение

Оставлено в

Evals для чайников. Как тестировать AI-агента, чтобы понимать, где именно он ломается

Большинство команд оценивают производительность AI-агентов через end-to-end метрики: success rate, количество токенов, tool usage, стоимость запроса, долю успешных задач. Это полезно для общего контроля ситуации, но почти бесполезно для реальной диагностики системы.

продолжить чтение

Оставлено в

Зачем backend разработчику Python, если он не собирается становиться data scientist

Начал смотреть в сторону Python не потому, что захотел стать data scientist.Мой основной опыт обычный back C#/.NET, банковские системы, REST API, микросервисы, Kafka, PostgreSQL, Docker/OpenShift, CI/CD и сопровождение. Позже добавилась Java/Spring Boot. То есть моя базовая картина мира это не notebooks и не обучение моделей а сервисы, интеграции, продакшен, логи и ответственность за результат.Но когда я начал разбираться с LLM быстро понял, вызвать модель можно почти из любого языка, а вот руками понять RAG, embeddings, локальные модели, чанкинг, evaluation и большинство новых AI инструментов проще всего через Python.

продолжить чтение

Оставлено в

Память на миллион, а толку ноль: как мы спасали ИИ-агента от «тупости»

Память на миллион токенов: почему контекст забивается и как его чиститьНа связи Сергей Смирнов, AI-инженер и основатель LLMStart.ru

продолжить чтение

Оставлено в

Почему ломается ваш AI-агент — и почему смена модели обычно его не чинит

Представьте внутреннего AI-агента, который помогает компании искать общие документы и управлять ими. Он работает. До тех пор, пока 12–15% запросов не начинают падать. Агент возвращает не тот документ, редактирует не тот файл, молча падает или уверенно ссылается на файл, которого не существует. Поиск по фото отказывает с той же частотой. Ошибки размазаны равномерно по пользователям, фичам и запросам.

продолжить чтение

Оставлено в

Production начинается там, где заканчивается вайбкодинг

В 2013 году мне казалось, что я отлично зарабатываю.Я уже около года фрилансил и получал что‑то порядка 100–120 тысяч рублей в месяц. Для того времени — очень неплохо.В голове математика была простая: аренда квартиры — около 25к, еда — около 15к.Значит, живу примерно на 40–50к, а всё остальное — свободные деньги.Поэтому покупка машины в кредит казалась нормальной идеей.Проблема была только в том, что я считал очень оптимистично.Я не учёл платную заочку. Не учёл лечение зубов, на которое как раз попал. И, конечно, не учёл, что машина — это не только ежемесячный платёж.

продолжить чтение

Оставлено в

Метрики упали в лужу

Нередкая ситуация, когда ваша модель спокойно себе крутится в проме, но внезапно прибегают аналитики с криками «у нас упало качество, посмотрите что может быть не так».Причин может быть множество, но сегодня я расскажу про одну из самых распространенных причин падения качества модели - Distribution shift.

продолжить чтение

Оставлено в

Мультиагентная система без LangChain: почему абстракции ломаются и как строить production на чистом Python

ВведениеLangChain обещает красивую жизнь: переключите модель одной строкой, подключите RAG за две, дайте агенту инструменты за три. На лендинге всё выглядит как конструктор LEGO — берёшь кубики, соединяешь, работает. На хакатоне это действительно так. В production — не совсем.Тезис «LangChain — overhead для production» не нов. Его обсуждают в каждом втором треде на Reddit и в комментариях на Хабре. Компания Octomind

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

Production.

Модель не виновата: разбираем 3 громких ИИ-инцидента, которые случились из-за отсутствия архитектуры

Не всё надо решать LLM. Где в продакшене побеждают бустинги, эмбеддинги и правила

AI‑агенты в проде: 6 архитектурных ошибок, из‑за которых они не доживают до запуска

Evals для чайников. Как тестировать AI-агента, чтобы понимать, где именно он ломается

Зачем backend разработчику Python, если он не собирается становиться data scientist

Память на миллион, а толку ноль: как мы спасали ИИ-агента от «тупости»

Почему ломается ваш AI-агент — и почему смена модели обычно его не чинит

Production начинается там, где заканчивается вайбкодинг

Метрики упали в лужу

Мультиагентная система без LangChain: почему абстракции ломаются и как строить production на чистом Python

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

Production.