ai-агенты.

Как создать AI‑агента на Java: связка Spring AI + MCP

Всем привет, меня зовут Сергей Прощаев, и в этой статье расскажу про то, как Java и Spring за последний год заметно подтянулись в теме, где долго и заслуженно лидировал Python, — продакшен AI‑агентов. Сразу обозначу позицию, чтобы не было разночтений. Я Tech Lead и руководитель направления Java | Kotlin разработки в FinTech & E‑commerce и преподаю на курсах разработки и архитектуры.

продолжить чтение

Разработчики больше не нужны? Новое исследование Anthropic на 400 000 сессий — и мой спор с ним

Anthropic выложила исследование на ~400 000 сессий Claude Code: успех с AI-агентами определяет не умение писать код, а понимание своего дела. Профессия почти не важна — у не-программистов 26% подтверждённого успеха против 30% у разработчиков.Эксперт в предметной области запускает в 2.4× больше действий агента на одну команду (12 против 5) и вчетверо чаще вытаскивает зашедшую в тупик сессию (15% против 4% у новичка).Половину этого я писал раньше: планируй, говори агенту «что», а не «как», и разбирайся в том, что делаешь. Приятно, когда данные сходятся с интуицией.

продолжить чтение

Loop Engineering: 14 шагов от промптера до архитектора систем

Два года работа c AI-агентами для написания кода выглядели одинаково: написать промпт, передать контекст, прочитать дифф, написать следующий промпт. Агент был инструментом, человек держал его за руку от начала до конца. Эта схема устаревает.Loop Engineering: сборка небольшой системы, которая сама находит задачу, передаёт её агенту, проверяет результат, фиксирует, что произошло, и решает, что делать дальше. Систему проектируют один раз, дальше она сама промптит агента.Материал собран из инженерной документации Anthropic, эссе Эдди Османи (Addy Osmani) о loop engineering и недавних замеров продуктивности. Три уровня:

продолжить чтение

Большая сила маленьких PR-ов в эру AI

Всем привет, меня зовут Михаил Поливаха, я являюсь техническим лидером проекта Axelix.В Axelix со временем добавляется всё больше и больше сторонних контрибьютеров, которых мы очень приветствуем. И всё больше и больше я сталкиваюсь с некоторым непониманием некоторых строгих гайдлайнов, которые установлены на проекте. Именно сегодня, речь пойдёт про размер PR-а.У нас есть собственный GitHub Action, который блокирует PR в том случае, если суммарное количество измененных строк кода превышает 500.

продолжить чтение

Skill of the week: Spring Data JDBC — качество Opus на модели за копейки

Ранее в рубрике Skill of the Week мы уже разбирали Skill для Spring Data JPA

продолжить чтение

Я нанял себе AI-пентестера: как LLM помогают мне искать уязвимости быстрее

продолжить чтение

Иллюзия контроля: почему промпты не защищают ИИ‑агентов

От Permission Boundary Bypass до языка Дика: почему безопасность агента должна жить в runtime, а не в system prompt.Эпоха простых чат‑ботов подошла к концу. Сегодня мы строим автономных ИИ‑агентов, которые через MCP

продолжить чтение

Evals: что должен знать каждый AI-инженер в 2026

В июле 2025 coding-агент в Replit проигнорировал явный запрет на изменения файлов (code-freeze) и удалил production-базу

продолжить чтение

AI предлагает, мержу я: почему я не даю агенту последний ход

Есть неприятная иллюзия: если модель стала сильнее, ей можно дать больше свободы. В кодинге это быстро выходит боком. Агент пишет много, уверенно, иногда даже красиво. Потом ты открываешь diff и понимаешь, что вместе с полезным кодом туда попало… ну, назовём это решениями, которые ты сам никогда бы не принял.У меня после нескольких таких заходов появилась простая граница.AI может предлагать. Мержу я.

продолжить чтение

MLE-bench: золото взято, а доказательства остались в -tmp

В апреле мой агент смог перешагнуть золотой порог на MLE-bench в агентских соревнованиях Berkeley RDI, а когда я решил показать «тот самый код, который взял золото» — понял, что не уверен, существует ли он вообще.Хабр, привет! Меня зовут Георгий, и в своей первой статье на площадке я решил разобраться, что же происходило на самом деле. Цифровой детектив: с чем я преодолел планку, где этот результат теперь (спойлер: нигде) и сколько смысла в этом «золоте». Это история о том, как я расследовал собственную «победу»Про сами агентские соревнования уже хорошо написали коллеги из AI Talent Hub — пост

продолжить чтение

123456...1020...26