llm-агент.

От Naive RAG до ReAct-агента: как мы строили корпоративного AI-помощника на open-source моделях (часть 2)

Привет, Хабр! Меня зовут Саша, я — старший AI-инженер в Лаборатории искусственного интеллекта «Честного знака». Наша команда развивает «Честного помощника» — мультиагентную LLM-систему для обработки документов, поиска информации по Confluence, Jira, GitLab и генерации текстов. Главная цель команды — повышать эффективность и качество работы сотрудников за счёт расширения числа специализированных агентов в нашей мультиагентной системе.

продолжить чтение

Пещера Аладдина для безопасника: 754 навыка для AI-агента и что будет, если использовать их для своего NGFW

Разбираемся с открытой библиотекой Agent Skills для кибербезопасности на 754 навыка, показываем, как она устроена, и проводим живой эксперимент: даём агенту Hermes два навыка и просим разобрать реальный IPS-лог и провести аудит правил файрвола – сначала на бесплатной модели Owl Alpha (из-за того что подобную модель при желании можно использовать локально), затем на платной Opus 4.8 (Cloude Security). Сравниваем, где проходит граница между «бесплатно» и «дорого, но качественно».Откуда взялась «пещера»В одну ночь у нас на столе оказались четыре вещи: открытый репозиторий

продолжить чтение

Как нам в Домклик LLM рефакторинг делала

Привет! Меня зовут Сергей, я Android-разработчик команды Новостроек в Домклик. Довольно давно наблюдаю за «сценой» ИИ в разработке, надо вовремя сменить профессию на электрика, эксперта в электрификации ИИ ЦОДов.Я постоянно вижу, как кто‑то навайбкодил новый (хорошо забытый) SaaS, или автоматизировал разработку новых фич, а может быть даже вообще заменил всю команду разработчиков в своём стартапе несколькими агентами. С другой стороны, так же часто я вижу и посты «Что делать — агент снёс мою продовую БД?!» и «Ищу опытного разработчика, сам я уже не в силах дорабатывать вайбкод».

продолжить чтение

Разобрал фишинг MAX, собрал в нём своего AI-секретаря. Гайд: Claw Bot + MCP

==== Месяц назад мне в личку прислали clk1.me/rD7P5E. Якобы видео с моим участием. Открыл в sandbox, начал ковырять. Под коротким редиректом оказалась инфраструктура из 179 доменов: фишинг-кит с собственной admin-panel, MITM-прокси к настоящему API мессенджера MAX. Разбирался дольше, чем планировал. Опкоды, формат фрейма, флаги push-подписки, антибот-эвристики. Внутреннее устройство мессенджера свалилось мне в голову как побочный эффект.

продолжить чтение

От Naive RAG до ReAct-агента: как мы строили корпоративного AI-помощника на open-source моделях (часть 1)

Привет, Хабр! Меня зовут Константинов Александр

продолжить чтение

Pollux: LLM-as-a-judge для русского

Прошло несколько лет с тех пор, как нейросетевые модели стали применимы в генерации текста. Сегодня языковые модели уверенно решают задачи написания кода, поддержки диалогов и планирования маршрутов. Тем не менее, до сих пор не сложилось универсального подхода для валидации LLM перед их внедрением в цифровые продукты.

продолжить чтение

Мы интегрировали ИИ-ассистента в систему защиты от утечек. Вот, что он умеет

Недавно мы внедрили в нашу систему защиты от утечек (DLP) «СёрчИнформ КИБ»

продолжить чтение

Короткий промпт ≠ дешёвый промпт: как оптимизация ломает prefix cache в LLM-агентах

Привет, Хабр! Меня зовут Сергей Нотевский, я AI Platform Lead в Битрикс24.Это третья статья серии про prefix caching: первая - про экономику кэширования и особенности разных провайдеров, вторая - про антипаттерны в простых сценариях. А здесь про то, как та же механика работает против вас в агентном цикле.TL;DRЕсли на каждом шаге менять tools, system prompt или ранние блоки context, prefix cache будет часто начинаться заново.Поэтому большой, но стабильный список tools иногда дешевле, чем маленький список, который постоянно пересобирается.

продолжить чтение

Cобрать агента для XAI и никогда больше не быть онлайн

Привет, друзья! Я, похоже, наконец пережила кризис пришествия агентов в нашу жизнь. Мне всегда безумно нравился процесс решения задач — этакий личный, удивительный мир, даже когда ты уже знаешь правило Лопиталя/Modus ponens/выберите то, которое заставило вас смеяться больше всего при изучении. А теперь, чтобы не выпасть из жизни, задачи просто приходится решать с кем-то. И этот кто-то LLM-Agent.

продолжить чтение

Как собрать пайплайн с LLM агентом использующим эмуляторы Android девайсов

Какую проблему решаемLLM пока не может хорошо обращаться с Е2Е автотестами потому что для этого нужно провести целый комплекс мероприятий. Сложность возникает уже на этапе запуска такого автотеста. В отличии от юнит автотестов, Е2Е автотесты почти всегда PageObject и целый проект со своей архитектурой на базе Selenium Appium Espresso и тд.Чем может быть полезна эта статьяВ данной статье я постараюсь описать подход с которым можно сделать агента использующего MCP инструменты для взаимодействия с эмуляторами. Заодно приведу простой пример чем отличается модель от агента и как они взаимодействуют между собой.Строим пайплайн

продолжить чтение

123456...10...12