Федеративное обучение в условиях дефицита памяти на Edge-устройствах. Часть 1
Если ваше устройство думает, что 1 ГБ — это ругательное слово, то этот доклад в двух частях для вас.
Возвращение блудного программиста (ч.2)
Предыстория тут. Первые ощущенияПервый шагШаг 2Снова шаг 2ОзарениеПросто ещё один проектЗаключениеПервые ощущения
Guardrails для LLM на Java: как приручить промпт‑инъекции и токсичные ответы
System prompt — это просьба. Guardrails — это принуждение.1. ВведениеКогда я впервые внедрял LLM в production-сервис, схема безопасности выглядела примерно так: написать хороший system prompt, поставить галочку «мы всё предусмотрели» и жить дальше. Жизнь не дала долго наслаждаться этим спокойствием — первый же тест показал, что пользователи довольно быстро находят способы заставить модель «забыть» всё, что мы написали в системном промпте.Проблема фундаментальная: system prompt — это инструкция, которую LLM старается выполнить, но не обязан
AI без Python: как исправить документацию и внедрить RAG в JVM-стеке
Привет, Хабр! Меня зовут Дмитрий Вдовин, я техлид команды Budget Tool. Мы отвечаем за продукт, через который в банке проходят процессы планирования и контроля расходов. Это внутренняя система, в которой формируются бюджеты, согласуются изменения и фиксируются расходы по направлениям. У нас много терминов, правил и нюансов. Например, чем OPEX отличается от CAPEX, зачем нужны кост-центры и группы расходов, что такое аллокация и реаллокация, как заполнять бюджет.
Асинхронность в Python для senior interview: от asyncio до выбора правильной реализации под задачу
Каждый Python-разработчик знает базовую формулу: asyncio нужен для I/O, потоки ну тоже иногда, процессы — для CPU-bound. На собеседовании такого ответа хватает ровно до первого уточняющего вопроса.А потом начинаются уже интересные вещи.Почему await не делает код параллельным?Почему асинхронный код всё равно может полностью положить event loop?Чем Task отличается от Future не на уровне "одно ждёт другое", а на уровне устройства рантайма?Что именно делает цикл событий, когда вы пишете await asyncio.sleep(1)?Почему в одном месте нужен create_task, в другом — TaskGroup
Как устроена архитектура факторов ранжирования в runtime поиска Ozon
Привет, Хабр! Меня зовут Лев. Я работаю в поиске Ozon. Сегодня я буду рассказывать про одну из составляющих поиска, а именно про ранжирование.В этой статье расскажу:
Интеграция coding-агента с MCP-сервером Idea
В IntelliJ Idea (а, значит, и в OpenIDE) есть встроенный MCP-сервер. Активируется он достаточно просто и позволяет расширять стандартную функциональность command-line кодинговых агентов, таких как платный Claude Code или бесплатный, но тоже весьма неплохой Qwen Code
Почему мы терпим факс в эпоху ИИ: Манифест Суверенной Инфраструктуры
Неделю назад мы опубликовали статью "Почему финтеху нужен капитальный ремонт", а до этого "
Больше чем ядро: как пет-проект вырос в мультитенантную платформу для создания AI-агентов
СодержаниеПролог. Краткость - сестра таланта... Часть 1. Концепт Часть 2A. Вайб-кодинг: философия и инструменты Часть 2B. Вайб-кодинг: практика взаимодействия Часть 3. Архитектура: первый блин комом Часть 4. Релиз и фичи Часть 5. Закат и рассвет Часть 6. Мультитенантная архитектура Часть 7: Сценарии — декларативная магия Часть 8. Эволюция системы плагинов: от модулей к экосистеме

