- BrainTools - https://www.braintools.ru -

Битва агентов: как мы запустили автономный трейдинг на GPT-5.2, Claude 4.5 и DeepSeek в «Финам Арене»

Может ли современная LLM не просто «галлюцинировать» графиками, а реально управлять капиталом в условиях неопределенности? Мы в команде Trade API «Финама» решили прекратить споры и запустили «Финам Арену» — масштабный эксперимент по автономному трейдингу.

Мы создали среду, в которой 6 топовых моделей сражаются друг с другом и с рыночными индексами в реальном времени. Без сантиментов и подсказок — только API и промпты.

Гладиаторы: ростер 2026 года

В этом забеге участвуют тяжеловесы, каждый со своей «философией» логики:

  • Claude 4.5 Sonnet (Anthropic) — надеемся на его осторожность и глубокий контекст.

  • GPT-5.2 (OpenAI) — проверим, насколько он хорош в мультимодальном анализе рынка.

  • Gemini 3 Flash Preview (Google) — ставка на скорость и интеграцию с внешним поиском.

  • DeepSeek v3.2 — темная лошадка с феноменальной математической базой.

  • Qwen3 Max — мощный игрок из Китая, показывающий отличные результаты в логике [1].

  • Grok 4.1 Fast (xAI) — ожидаем агрессивных стратегий в духе Илона Маска.

Как это работает под капотом (Agentic Workflow)

Мы не просто спрашиваем ИИ: «Что купить?». Мы построили агентную инфраструктуру, где модель выступает в роли полноценного управляющего. Каждому агенту доступны:

  • Market Intelligence: стрим котировок и исторических данных через Finam Trade API.

  • News Feed: агрегатор новостей «Финама» по РФ и глобальным рынкам.

  • Search Tool: доступ к вебу для поиска фундаментальных показателей и отчетов компаний.

  • Math Engine: калькулятор для расчета индикаторов (RSI, MACD, скользящие средние).

  • Execution Layer: модуль выставления и контроля биржевых заявок.

Условия эксперимента: два фронта

Модели получили стартовый капитал и список из 10 ликвидных тикеров на каждом рынке:

  • РФ (100 000 ₽): Сбер, Газпром, Яндекс, МТС, X5, Аэрофлот, Алроса, Россети, Самолет, ДВМП.

  • США ($10 000): NVIDIA, Apple, Microsoft, Tesla, Walmart, PepsiCo, Coinbase, Ford, American Airlines, Broadcom.

Benchmark: главный судья — не только доходность относительно друг друга, но и сравнение с индексами МосБиржи и S&P 500. Сможет ли «��олодный разум» нейросети побить пассивное инвестирование?

Что мы хотим проверить?

Проект «Финам Арена» — это не просто шоу. Мы ищем ответы на критические для индустрии вопросы:

  • BUY&HOLD или ИИ? Оправдают ли себя затраты на токены в сравнении с доходностью обычного индексного фонда.

  • Decision Making под давлением: как модели ведут себя при резких рыночных просадках. Будут ли они «паниковать» или хладнокровно усредняться?

  • Риск-менеджмент: насколько эффективно агенты управляют кредитным плечом (если мы им его разрешим).

Как следить за битвой?

Результаты каждого трейдера обновляются в реальном времени на нашем дашборде [2]. Там можно посмотреть не только эквити, но и логику принятия решений — мы сохраняем цепочки рассуждений (Chain-of-Thought) моделей.

В ближайшее время мы начнем публиковать детальные разборы самых странных и гениальных сделок наших подопечных.

Автор: Finam_Broker

Источник [3]


Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/26482

URLs in this post:

[1] логике: http://www.braintools.ru/article/7640

[2] дашборде: https://api.finam.ru/arena/

[3] Источник: https://habr.com/ru/companies/finam_broker/articles/1005638/?utm_source=habrahabr&utm_medium=rss&utm_campaign=1005638

www.BrainTools.ru

Rambler's Top100