llm.

Агентность на практике: Codex CLI и российский AI-ландшафт

Привет, ХабрПосле знакомства с Codex CLI от OpenAI я решил провести практический тест: можно ли в российском ИИ-ландшафте собрать ChatGPT-подобный login UX для агентного CLI — запускаю клиент, логинюсь, сразу работаю с инференсом.Сначала разберу рынок и авторизацию: как я сравнил Яндекс и Сбер, и почему для нужного UX Яндекс оказался проще в реализации. А потом покажу самое вкусное: что пришлось чинить в runtime inference, чтобы агент вообще не умирал на первом ходе.TL;DRДля agentic CLI необходим воспроизводимый мост IDP login -> API token -> inference.

продолжить чтение

Оставлено в

Как я создавала AI-агента для проверки ТЗ: история одного эксперимента

продолжить чтение

Оставлено в

Исполняемые спецификации — эффективная работа с кодинг-агентами

Кодинг-агенты умеют быстро генерировать код, но результат часто расходится с ожиданиями. Естественный язык слишком неоднозначен для передачи точных требований, а классические unit-тесты с десятками ассертов тяжело читаемы.Хороший подход для работы с агентами базируется на принципах BDD (Behavior-Driven Development). Нам важно не то, как реализована задача, а как ведет себя система. Лучший способ передать это поведение машине и легко проверить человеку - исполняемые спецификации.Что такое паттерн "Исполняемая спецификация"

продолжить чтение

Оставлено в

ИИ‑агент внутри 1С

1C AI Agent — продукт, который не “поговорить”, а “сделать”Привет. Это первая публикация про наш новый продукт — 1C AI Agent.Если коротко: LLM — это уже нормальный рабочий инструмент, и с ним всё ок. Но нам хотелось сделать следующий шаг: чтобы в 1С можно было не только “спросить и получить текст”, а попросить и получить результат в базе — с понятным планом, проверками и ограничениями.Мы сделали иначе: агент внутри 1С получает задачу человеческими словами, раскладывает её на шаги и исполняет

продолжить чтение

Оставлено в

Grep-AST или Как мы заменили векторный поиск всего одной библиотекой

Всем привет! На связи София из команды применения больших языковых моделей ecom.tech

продолжить чтение

Оставлено в

Инструкция для человека vs инструкция для LLM-агента

Классическая ситуация.Приходит заказчик: «У нас есть регламент согласования договоров. Страничка текста. Сделайте AI-агента, который будет по нему работать».Звучит просто. Регламент есть, логика понятна. Осталось «написать промпт».Через месяц — провал. Агент делает ерунду, сотрудники его игнорируют, деньги потрачены.Почему? Потому что инструкция для человека и инструкция для LLM-агента — два совершенно разных документа. Разница не в формате. Разница в том, что человек додумывает, а машина — нет.Пример: 6 пунктов для менеджераВозьмём типичный процесс — согласование договора с контрагентом.

продолжить чтение

Оставлено в

Почему AI не может полноценно участвовать в разработке на С++

По данным отраслевых опросов, в 2025 году 84% разработчиков использовали ИИ-инструменты для написания, отладки и автоматизации кода. А в 2026 году ожидается, что более 80% компаний будут применять генеративный ИИ в разработке своих продуктов. Но у LLM есть ограничения, которые не позволяют им быть одинаково эффективными для всех языков программирования — например, для С++.Тему ограничений AI в пайплайне «плюсовой» разработки обсудили Андрей Золотых и Илья Казаков из YADRO

продолжить чтение

Оставлено в

Можно ли собрать BI-дашборды за 4 часа, если ты не аналитик? Эксперимент с MCP, PostgreSQL и Modus BI

Привет, Хабр! Я Дмитрий Клепиков, разработчик в команде Modus BI. Хотя моя основная работа напрямую не связана с аналитикой данных, мне стало интересно: может ли разработчик без профильного опыта пройти весь путь аналитика — от гипотез до BI-дашбордов — используя только LLM и MCP-серверы?Сейчас мы в команде разрабатываем собственный MCP-сервер для Modus BI, чтобы пользователи могли взаимодействовать с платформой через естественный язык без глубоких знаний в статистике и SQL. Прежде чем двигаться дальше с разработкой, я решил проверить на реальной задаче, насколько такой подход жизнеспособен.

продолжить чтение

Оставлено в

Битва агентов: как мы запустили автономный трейдинг на GPT-5.2, Claude 4.5 и DeepSeek в «Финам Арене»

Может ли современная LLM не просто «галлюцинировать» графиками, а реально управлять капиталом в условиях неопределенности? Мы в команде Trade API «Финама» решили прекратить споры и запустили «Финам Арену» — масштабный эксперимент по автономному трейдингу.Мы создали среду, в которой 6 топовых моделей сражаются друг с другом и с рыночными индексами в реальном времени. Без сантиментов и подсказок — только API и промпты.Гладиаторы: ростер 2026 годаВ этом забеге участвуют тяжеловесы, каждый со своей «философией» логики:Claude 4.5 Sonnet (Anthropic) — надеемся на его осторожность и глубокий контекст.

продолжить чтение

Оставлено в

Структурно-ориентированная кодовая база для агента

Агент, который ничего не зналПри первом запуске агент не знает структуру проекта. Из-за этого возникают проблемы:Читает слишком много файлов и быстро расходует контекст.Или, наоборот, не находит нужные файлы и места в коде.Справочный файлОдин из способов снизить эти проблемы — создать справочный файл ./docs/reference.md, где описаны ключевые файлы проекта и их назначение.Минусы:Вручную поддерживать сложно.Если генерировать описание агентом, то для конкретной задачи в нём часто не хватает деталей.Кодовая база как собственная справка

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

llm.

Агентность на практике: Codex CLI и российский AI-ландшафт

Как я создавала AI-агента для проверки ТЗ: история одного эксперимента

Исполняемые спецификации — эффективная работа с кодинг-агентами

ИИ‑агент внутри 1С

Grep-AST или Как мы заменили векторный поиск всего одной библиотекой

Инструкция для человека vs инструкция для LLM-агента

Почему AI не может полноценно участвовать в разработке на С++

Можно ли собрать BI-дашборды за 4 часа, если ты не аналитик? Эксперимент с MCP, PostgreSQL и Modus BI

Битва агентов: как мы запустили автономный трейдинг на GPT-5.2, Claude 4.5 и DeepSeek в «Финам Арене»

Структурно-ориентированная кодовая база для агента

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

llm.