От Naive RAG до ReAct-агента: как мы строили корпоративного AI-помощника на open-source моделях (часть 2)
Привет, Хабр! Меня зовут Саша, я — старший AI-инженер в Лаборатории искусственного интеллекта «Честного знака». Наша команда развивает «Честного помощника» — мультиагентную LLM-систему для обработки документов, поиска информации по Confluence, Jira, GitLab и генерации текстов. Главная цель команды — повышать эффективность и качество работы сотрудников за счёт расширения числа специализированных агентов в нашей мультиагентной системе.
Пещера Аладдина для безопасника: 754 навыка для AI-агента и что будет, если использовать их для своего NGFW
Разбираемся с открытой библиотекой Agent Skills для кибербезопасности на 754 навыка, показываем, как она устроена, и проводим живой эксперимент: даём агенту Hermes два навыка и просим разобрать реальный IPS-лог и провести аудит правил файрвола – сначала на бесплатной модели Owl Alpha (из-за того что подобную модель при желании можно использовать локально), затем на платной Opus 4.8 (Cloude Security). Сравниваем, где проходит граница между «бесплатно» и «дорого, но качественно».Откуда взялась «пещера»В одну ночь у нас на столе оказались четыре вещи: открытый репозиторий
Как нам в Домклик LLM рефакторинг делала
Привет! Меня зовут Сергей, я Android-разработчик команды Новостроек в Домклик. Довольно давно наблюдаю за «сценой» ИИ в разработке, надо вовремя сменить профессию на электрика, эксперта в электрификации ИИ ЦОДов.Я постоянно вижу, как кто‑то навайбкодил новый (хорошо забытый) SaaS, или автоматизировал разработку новых фич, а может быть даже вообще заменил всю команду разработчиков в своём стартапе несколькими агентами. С другой стороны, так же часто я вижу и посты «Что делать — агент снёс мою продовую БД?!» и «Ищу опытного разработчика, сам я уже не в силах дорабатывать вайбкод».
Разобрал фишинг MAX, собрал в нём своего AI-секретаря. Гайд: Claw Bot + MCP
==== Месяц назад мне в личку прислали clk1.me/rD7P5E. Якобы видео с моим участием. Открыл в sandbox, начал ковырять. Под коротким редиректом оказалась инфраструктура из 179 доменов: фишинг-кит с собственной admin-panel, MITM-прокси к настоящему API мессенджера MAX. Разбирался дольше, чем планировал. Опкоды, формат фрейма, флаги push-подписки, антибот-эвристики. Внутреннее устройство мессенджера свалилось мне в голову как побочный эффект.
От Naive RAG до ReAct-агента: как мы строили корпоративного AI-помощника на open-source моделях (часть 1)
Привет, Хабр! Меня зовут Константинов Александр
Pollux: LLM-as-a-judge для русского
Прошло несколько лет с тех пор, как нейросетевые модели стали применимы в генерации текста. Сегодня языковые модели уверенно решают задачи написания кода, поддержки диалогов и планирования маршрутов. Тем не менее, до сих пор не сложилось универсального подхода для валидации LLM перед их внедрением в цифровые продукты.
Мы интегрировали ИИ-ассистента в систему защиты от утечек. Вот, что он умеет
Недавно мы внедрили в нашу систему защиты от утечек (DLP) «СёрчИнформ КИБ»
Короткий промпт ≠ дешёвый промпт: как оптимизация ломает prefix cache в LLM-агентах
Привет, Хабр! Меня зовут Сергей Нотевский, я AI Platform Lead в Битрикс24.Это третья статья серии про prefix caching: первая - про экономику кэширования и особенности разных провайдеров, вторая - про антипаттерны в простых сценариях. А здесь про то, как та же механика работает против вас в агентном цикле.TL;DRЕсли на каждом шаге менять tools, system prompt или ранние блоки context, prefix cache будет часто начинаться заново.Поэтому большой, но стабильный список tools иногда дешевле, чем маленький список, который постоянно пересобирается.
Cобрать агента для XAI и никогда больше не быть онлайн
Привет, друзья! Я, похоже, наконец пережила кризис пришествия агентов в нашу жизнь. Мне всегда безумно нравился процесс решения задач — этакий личный, удивительный мир, даже когда ты уже знаешь правило Лопиталя/Modus ponens/выберите то, которое заставило вас смеяться больше всего при изучении. А теперь, чтобы не выпасть из жизни, задачи просто приходится решать с кем-то. И этот кто-то LLM-Agent.
Как собрать пайплайн с LLM агентом использующим эмуляторы Android девайсов
Какую проблему решаемLLM пока не может хорошо обращаться с Е2Е автотестами потому что для этого нужно провести целый комплекс мероприятий. Сложность возникает уже на этапе запуска такого автотеста. В отличии от юнит автотестов, Е2Е автотесты почти всегда PageObject и целый проект со своей архитектурой на базе Selenium Appium Espresso и тд.Чем может быть полезна эта статьяВ данной статье я постараюсь описать подход с которым можно сделать агента использующего MCP инструменты для взаимодействия с эмуляторами. Заодно приведу простой пример чем отличается модель от агента и как они взаимодействуют между собой.Строим пайплайн

