10% на LLM и 90% на инженерию: как российские компании используют ИИ
Привет, Хабр!Продолжаю делиться материалами живых дискуссий, которые идут на телеграм-канале Dev Q&A. На этот раз тема — выбор между open source и коммерческими LLM для корпоративных задач. Получилось собрать практиков, которые каждый день решают эту дилемму: Андрея Кувалдина («Транссеть»), Сергея Олькова («Диасофт»), Максима Семёнкина (CodeInside), Артема Панькова (Secret Agents), Владислава Кудинова (Veai), Константина Глазкова (СП.АРМ), Лорана Джейкобса (iPavlov AI-Systems) и Виталия Попова («Софтлайн Решения»).
Применение ИИ в бэкенд-разработке приложения Бургер Кинг: шаблоны, контекст и кодогенерация
Всем привет! Меня зовут Щепетков Константин, я TeamLead бэкенда мобильного приложения Бургер Кинг.
ML-проект моей мечты. Часть 1
Сегодня я хочу поговорить о том, как можно организовать код внутри своего проекта таким образом, чтобы всем было удобно им пользоваться. Считаю, что это важный этап разработки, который напрямую влияет на многие аспекты, в том числе на удовлетворённость от работы. Эта тема, по моему мнению, является
Изоляция контекста через субагенты: архитектурный паттерн для долгосрочной работы с Claude Code
Как превратить Claude Code из мощного ассистента в профессиональную платформу оркестрации с 33+ специализированными агентамиКонтекст: кто пишет и почему это важноИгорь Масленников. В IT с 2013 года. Много лет управлял классической IT-компанией DNA IT. Последние два года активно развиваю подразделение AI Dev Team — и вижу интересную тенденцию: всё больше клиентов выбирают именно это подразделение. Не потому что модно, а потому что быстрее (1-2 недели вместо 2-3 месяцев), дешевле (минус 80% от стоимости), и, как ни странно, качественнее благодаря автоматическим проверкам.
Google представила архитектуру Titans и фреймворк MIRAS
Google представили архитектуру Titans и фреймворк MIRAS, которые позволяют моделям ИИ работать гораздо быстрее и обрабатывать большие объемы данных за счет обновления основной памяти во время ее активной работы. В двух новых статьях,
Архитектура высоконагруженных RAG-систем: 10 стратегий оптимизации чанкинга и интеграция с Weaviate, Qwen – Llama -Gemma
Привет, Хабр! Это Андрей Носов, AI-архитектор в компании Raft, проектирую и внедряю высоконагруженные RAG-системы на предприятиях. Сегодня я расскажу о вызовах, которые мы преодолеваем каждый день, создавая такие системы, и сделаю акцент на чанкинге.
Приглашаем на ЮMoneyDay — бесплатную онлайн-конференцию про финтех и IT
5 и 6 декабря состоится ЮMoneyDay 2025 — бесплатная онлайн-конференция для разработчиков, аналитиков, инженеров, менеджеров и дизайнеров. Встречаемся в 11:00 мск.
Мульти-модельная оркестрация LLM: архитектура маршрутизации, которая снизила затраты в 117 раз
Как мы провели 12,000+ API-вызовов к 11 моделям, открыли правило 60-70, и построили систему маршрутизации с ROI 4,853xКонтекст: кто пишет и о чём эта статьяИгорь Масленников. В IT с 2013 года. Последние два года развиваю AI Dev Team в DNA IT — подразделение, которое работает на мульти-модельной архитектуре. Это техническая статья о том, как мы построили систему оркестрации LLM-моделей для платформы генерации образовательных курсов.Статья для тех, кто:Строит AI-продукты и упирается в стоимость APIДумает о мульти-модельной архитектуре, но не знает, с чего начать
Приглашаем на двухдневную онлайн-конференцию для IT-специалистов в финтехе
Бесплатная ежегодная онлайн-конференция ЮMoney Day состоится 5 и 6 декабря. Это уже седьмая конференция, где представители ЮMoney делятся опытом работы в финтехе. Вас ждёт более 20 докладов по разным направлениям: бэкенд, фронтенд, архитектура, тестирование, SQL и другие.
Под капотом современных AI-систем: разбираем железо
Как объединить по сети вычислители? Что происходит при компиляции кода для железа под капотом и какие есть нюансы при работе с AI в пространстве ядра? ИИ с ноги ворвался во все сферы разработки, работы — вагон и маленькая тележка. Но на чём и как она должна ехать? У каждой программы есть свои требования, универсальных советов нет.

