Production-ready архитектура AI-агента. Часть 1: ReAct, Advanced RAG, Tools, Prompts
Интересный получился 2025 год: с одной стороны нахлынула волна хайпа вокруг AI‑агентов, с другой стороны не меньшая волна скептицизма и критики остудила пыл многих. Мол, это всё дорогая игрушка — поиграли, забыли, выбросили. На примере разработки AI‑консультанта для своей компании поговорим о системном подходе к проектированию архитектуры production‑ready AI‑агентов, который мы применяем при создании агентских систем для бизнеса. Да-да, именно систем, включая всё критически необходимое для того, чтобы агенты не стали игрушкой, а приносили пользу и оправдывали своё назначение.Поехали...
Промышленная эволюция ИИ. Если машина оставит тебя без работы, виноват будешь ты
Стэнфордский университет сообщает, что из-за ИИ занятость выпускников вузов снизилась на 13%.Fortune пишет, что скоро до 90% кода будет написано ИИ. То есть даже программисты, представители высокоинтеллектуальной профессии, не застрахованы от того, чтобы быть заменёнными бездушными машинами.Кажется, что только ленивый не написал, не сказал или панически не проорал о том, что скоро наступит будущее, в котором у людей не будет работы из-за роботов и искусственного интеллекта.
Железный голод: почему ИИ съедает GPU и память
Потихоньку приближается 2026 год, который принесет много интересных событий в сфере ИИ (по крайней мере, так думаю я). Но и за 2025-й мы получили огромное количество отличных моделей в свое распоряжение. С одной стороны, здорово, что теперь можно легко создать текст, программу, изображение, видео и звук. С другой же стороны, такой стремительный прогресс в области искусственного интеллекта существенно повлиял и на аппаратное обеспечение - особенно на видеокарты и память.
Топовая китайская модель MiniMax M2.1 уже доступна бесплатно в Koda для VS Code и CLI
Команда MiniMax представила обновление своей модели — MiniMax M2.1, сделав основной упор на производительность в реальных сложных задачах, с которыми ежедневно сталкиваются разработчики и команды.Если в M2 ключевой фокус был на стоимости и доступности модели, то в M2.1 разработчики целенаправленно прокачали практическую применимость: мульти-язычное программирование, агентные сценарии и офисные workflow.Модель демонстрирует лидирующие результаты в:Rust, Java, Go, C++Kotlin, Objective-C

