llm. - страница 8

llm.

Агентность на практике: Codex CLI и российский AI-ландшафт

Привет, ХабрПосле знакомства с Codex CLI от OpenAI я решил провести практический тест: можно ли в российском ИИ-ландшафте собрать ChatGPT-подобный login UX для агентного CLI — запускаю клиент, логинюсь, сразу работаю с инференсом.Сначала разберу рынок и авторизацию: как я сравнил Яндекс и Сбер, и почему для нужного UX Яндекс оказался проще в реализации. А потом покажу самое вкусное: что пришлось чинить в runtime inference, чтобы агент вообще не умирал на первом ходе.TL;DRДля agentic CLI необходим воспроизводимый мост IDP login -> API token -> inference.

продолжить чтение

Как я создавала AI-агента для проверки ТЗ: история одного эксперимента

продолжить чтение

Исполняемые спецификации — эффективная работа с кодинг-агентами

Кодинг-агенты умеют быстро генерировать код, но результат часто расходится с ожиданиями. Естественный язык слишком неоднозначен для передачи точных требований, а классические unit-тесты с десятками ассертов тяжело читаемы.Хороший подход для работы с агентами базируется на принципах BDD (Behavior-Driven Development). Нам важно не то, как реализована задача, а как ведет себя система. Лучший способ передать это поведение машине и легко проверить человеку - исполняемые спецификации.Что такое паттерн "Исполняемая спецификация"

продолжить чтение

ИИ‑агент внутри 1С

1C AI Agent — продукт, который не “поговорить”, а “сделать”Привет. Это первая публикация про наш новый продукт — 1C AI Agent.Если коротко: LLM — это уже нормальный рабочий инструмент, и с ним всё ок. Но нам хотелось сделать следующий шаг: чтобы в 1С можно было не только “спросить и получить текст”, а попросить и получить результат в базе — с понятным планом, проверками и ограничениями.Мы сделали иначе: агент внутри 1С получает задачу человеческими словами, раскладывает её на шаги и исполняет

продолжить чтение

Grep-AST или Как мы заменили векторный поиск всего одной библиотекой

Всем привет! На связи София из команды применения больших языковых моделей ecom.tech

продолжить чтение

Инструкция для человека vs инструкция для LLM-агента

Классическая ситуация.Приходит заказчик: «У нас есть регламент согласования договоров. Страничка текста. Сделайте AI-агента, который будет по нему работать».Звучит просто. Регламент есть, логика понятна. Осталось «написать промпт».Через месяц — провал. Агент делает ерунду, сотрудники его игнорируют, деньги потрачены.Почему? Потому что инструкция для человека и инструкция для LLM-агента — два совершенно разных документа. Разница не в формате. Разница в том, что человек додумывает, а машина — нет.Пример: 6 пунктов для менеджераВозьмём типичный процесс — согласование договора с контрагентом.

продолжить чтение

Почему AI не может полноценно участвовать в разработке на С++

По данным отраслевых опросов, в 2025 году 84% разработчиков использовали ИИ-инструменты для написания, отладки и автоматизации кода. А в 2026 году ожидается, что более 80% компаний будут применять генеративный ИИ в разработке своих продуктов. Но у LLM есть ограничения, которые не позволяют им быть одинаково эффективными для всех языков программирования — например, для С++.Тему ограничений AI в пайплайне «плюсовой» разработки обсудили Андрей Золотых и Илья Казаков из YADRO

продолжить чтение

Можно ли собрать BI-дашборды за 4 часа, если ты не аналитик? Эксперимент с MCP, PostgreSQL и Modus BI

Привет, Хабр! Я Дмитрий Клепиков, разработчик в команде Modus BI. Хотя моя основная работа напрямую не связана с аналитикой данных, мне стало интересно: может ли разработчик без профильного опыта пройти весь путь аналитика — от гипотез до BI-дашбордов — используя только LLM и MCP-серверы?Сейчас мы в команде разрабатываем собственный MCP-сервер для Modus BI, чтобы пользователи могли взаимодействовать с платформой через естественный язык без глубоких знаний в статистике и SQL. Прежде чем двигаться дальше с разработкой, я решил проверить на реальной задаче, насколько такой подход жизнеспособен.

продолжить чтение

Битва агентов: как мы запустили автономный трейдинг на GPT-5.2, Claude 4.5 и DeepSeek в «Финам Арене»

Может ли современная LLM не просто «галлюцинировать» графиками, а реально управлять капиталом в условиях неопределенности? Мы в команде Trade API «Финама» решили прекратить споры и запустили «Финам Арену» — масштабный эксперимент по автономному трейдингу.Мы создали среду, в которой 6 топовых моделей сражаются друг с другом и с рыночными индексами в реальном времени. Без сантиментов и подсказок — только API и промпты.Гладиаторы: ростер 2026 годаВ этом забеге участвуют тяжеловесы, каждый со своей «философией» логики:Claude 4.5 Sonnet (Anthropic) — надеемся на его осторожность и глубокий контекст.

продолжить чтение

Структурно-ориентированная кодовая база для агента

Агент, который ничего не зналПри первом запуске агент не знает структуру проекта. Из-за этого возникают проблемы:Читает слишком много файлов и быстро расходует контекст.Или, наоборот, не находит нужные файлы и места в коде.Справочный файлОдин из способов снизить эти проблемы — создать справочный файл ./docs/reference.md, где описаны ключевые файлы проекта и их назначение.Минусы:Вручную поддерживать сложно.Если генерировать описание агентом, то для конкретной задачи в нём часто не хватает деталей.Кодовая база как собственная справка

продолжить чтение

Rambler's Top100