fastapi.

Как заставить ИИ играть по правилам ролевой системы: архитектура авторитарного бэкенда для AI RPG

TL;DRСделать текстовую игру на базе LLM легко, если вас устраивает бесконечный неконтролируемый чат, который ломается через 30 ходов из-за модельного дрейфа и амнезии. Сделать полноценную RPG с детерминированными механиками, инвентарём, картой-графом и пермадезом — инженерная задача.Ниже — подробный разбор архитектурных решений, юнит-экономики, борьбы с гонками данных и инфраструктурных грабель, собранных при разработке проекта «Стирая Грань» (Beyond The Verge) — полностью русскоязычной AI RPG на стеке FastAPI + PostgreSQL/pgvector + Flutter Web.1. Фундаментальная проблема: Контекстное окно ≠ Игровая память

продолжить чтение

Оставлено в

Один за всех: как я в одиночку тащу фуллстек‑проект, который незаметно разросся до соцсети

Это не туториал и не «10 советов как стать 10x‑разработчиком». Это честный рассказ о том, каково в одиночку тянуть проект, который начинался как «сделаю себе небольшой сайтик про кино», а в какой‑то момент превратился в полноценную соцсеть с лентой, профилями, рейтингами, совместным просмотром и фоновыми задачами. Без команды, без инвестора, без тимлида, который скажет «так делать не надо». Только ты, IDE и продакшен, который почему‑то падает в два часа ночи. Делюсь стеком, организацией и граблями — без прикрас.Как я докатился до жизни такой

продолжить чтение

Оставлено в

Как мы за 54 дня собрали ИИ-хаб в мессенджере MAX. Часть 1 — обзор цикла

TL;DR54 дня назад у нас была идея — единый чат‑бот, через который можно работать с разными моделями ИИ. Сегодня в проде: бот в мессенджере MAX, 5903 пользователя, ~300 DAU, премиум‑подписка через ЮКассу с автоплатежами, 10+ моделей ИИ под одним интерфейсом, 6 модальностей ввода. Платежи запустили 5 мая 2026.Команда: нас двое плюс AI‑ассистент в роли парного программиста. IT‑ бэкграунд есть, но в коммерческой разработке мы не работали. С n8n до этого знакомились на уровне «10 нод поковырять». Сейчас в проекте около 20 связанных воркфлоу, в одном только Main — 271 нода.Это первая статья из цикла.

продолжить чтение

Оставлено в

FlakyDetector 2.0: Как я превратил сырое исследование в продакшен-инструмент с AST, ML и красивым дашбордом…

— История о том, почему половина ваших тестов падает «сама по себе», и как я научился находить виновников по исходному коду. Лид: Час на перезапуск билда — это норма?Представь: пятница, вечер. Ты запускаешь CI для последнего пулл-реквеста, идёшь наливать кофе, возвращаешься… а билд упал. Один тест. Ты перезапускаешь проходит. «Флаки», — вздыхаешь ты и ставишь лейбл flaky. На следующей неделе история повторяется. Потом ещё раз.Мы привыкли, что нестабильные тесты — это неизбежное зло

продолжить чтение

Оставлено в

Как я сделал AI‑директора для малого бизнеса и почему отказался от RAG

Уровень: senior backend, AI/ML Стек: FastAPI, SQLite, Claude Haiku 4.5, кастомный scheduler Что внутри: архитектура AI‑агента для команды 5–50 человек, типизированная память вместо vector RAG, граф знаний организации, ежедневный reflectionЧто такое Лира на пальцахМаленькая компания, человек 20. Гендир тонет в задачах. Помнить кто что обещал, отслеживать движение по целям, держать в голове десяток проектов одновременно. У больших корпораций для этого есть штат руководителей среднего звена и проджектов. У малых есть один директор, который пытается быть всем сразу.

продолжить чтение

Оставлено в

75 картинок ablation: как Reddit-критика заставила меня переосмыслить FLUX-LoRA пайплайн

TL;DR. Запустил pinock.io — бесплатную ленту AI-генерации животных в стиле советских спичечных коробков. Под капотом FLUX.2-klein + кастомная LoRA + двухпроходный «sandwich»-пайплайн. Получил детальный технический комментарий на r/StableDiffusion с двумя конкретными претензиями. Прогнал ablation: 5 вариантов × 5 категорий × 3 сида = 75 картинок. Нашёл дыры в собственном пайплайне — в том числе кириллицу в выходе LoRA (training-set leakage) и полный коллапс LoRA при scale=2.0

продолжить чтение

Оставлено в

Как подключить Langfuse к LLM через JWT?

Langfuse, помимо трассирования запросов, удобно использовать для prompt management и LLM‑as‑a-judge. Но в корпоративной среде он упирается в простую вещь: LF работает со статическим API key, а ваш inference gateway — нет. Если gateway требует короткоживущий JWT, Langfuse не умеет его получать. И в этот момент интеграция ломается.Мы столкнулись именно с такой ситуацией. Модели self‑hosted, OpenAI подобный API, но для доступа к нему на каждый запрос нужен JWT, который выдаётся централизованным провайдером. Langfuse в LLM Connection умеет передать API key и заголовки, но не сможет сам сходить в auth‑сервис, получить временный токен и подставить его в запрос.

продолжить чтение

Оставлено в

Мультиагентная система без LangChain: почему абстракции ломаются и как строить production на чистом Python

ВведениеLangChain обещает красивую жизнь: переключите модель одной строкой, подключите RAG за две, дайте агенту инструменты за три. На лендинге всё выглядит как конструктор LEGO — берёшь кубики, соединяешь, работает. На хакатоне это действительно так. В production — не совсем.Тезис «LangChain — overhead для production» не нов. Его обсуждают в каждом втором треде на Reddit и в комментариях на Хабре. Компания Octomind

продолжить чтение

Оставлено в

Open-source персистентная память для LLM

Последние полгода я занимаюсь задачей, которая поначалу казалась тривиальной: научить LLM помнить, с кем она разговаривает.Задача звучит просто. На практике — нет.Если вы строили чат-бот или AI-агента, вы знаете ощущение: пользователь написал, что он вегетарианец, а через три сообщения модель предлагает ему стейк-хаус. Или пациент сообщил об аллергии на пенициллин, а ассистент через час забыл и порекомендовал амоксициллин. В рамках одного контекстного окна всё работает. Но стоит начать новую сессию — чистый лист, модель не помнит ничего.Написал NGT Memory

продолжить чтение

Оставлено в

Добавляем в бизнес-портал Битрикс24 роботов для автоматизации

Привет! Меня зовут Игорь Росляков, я технический писатель. По приглашению руководителя направления «Маркет и интеграции» Сергея Вострикова

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

fastapi.

Как заставить ИИ играть по правилам ролевой системы: архитектура авторитарного бэкенда для AI RPG

Один за всех: как я в одиночку тащу фуллстек‑проект, который незаметно разросся до соцсети

Как мы за 54 дня собрали ИИ-хаб в мессенджере MAX. Часть 1 — обзор цикла

FlakyDetector 2.0: Как я превратил сырое исследование в продакшен-инструмент с AST, ML и красивым дашбордом…

Как я сделал AI‑директора для малого бизнеса и почему отказался от RAG

75 картинок ablation: как Reddit-критика заставила меня переосмыслить FLUX-LoRA пайплайн

Как подключить Langfuse к LLM через JWT?

Мультиагентная система без LangChain: почему абстракции ломаются и как строить production на чистом Python

Open-source персистентная память для LLM

Добавляем в бизнес-портал Битрикс24 роботов для автоматизации

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

fastapi.