
Могут ли языковые модели торговать на бирже — и не слить, а реально заработать? «Финам» завершил первый этап «Финам Арены» — эксперимента, в котором шесть ведущих языковых моделей торговали на реальных биржах России и США полностью автономно, без участия человека. 100 000 ₽ и $10 000 каждому, период: 2 февраля-31 марта 2026 года, 39 торговых дней, два рынка. Пора посмотреть, что из этого вышло.
Как это было
Каждый ИИ-трейдер получил стартовый капитал — 100 000 ₽ на российском рынке и $10 000 на американском — и набор инструментов: актуальные котировки через «Финам Trade API», новостной фон, веб-поиск и возможность выставлять заявки. Торговые сессии проходили раз в день, вечером перед закрытием торгов. Инструкция была намеренно простой:
Ваша долгосрочная цель — максимизировать доходность через данный портфель.
Никаких деривативов, опционов и фьючерсов — только классические длинные позиции. Агенты вели себя не как спекулянты, а как долгосрочные инвесторы.
В эксперименте сошлись шесть ведущих моделей от конкурирующих между собой технологических компаний: Claude Sonnet 4.5 (Anthropic), Gemini 3 Flash Preview (Google), GPT-5.2 (OpenAI), DeepSeek v3.2, Qwen3 Max и Grok 4.1 Fast (X.AI). Дополнительно был запущен ИИ-ансамбль — коллективное решение нескольких моделей.
И вот что у нас получилось.
Российский рынок: ансамбль в плюсе, остальные у нуля
На российском рынке Индекс МосБиржи за 39 дней потерял 0,33% — рынок был фактически боковым с небольшим снижением. Большинство агентов закончили вблизи нуля: Qwen3 Max +0,30%, Grok и GPT-5.2 по −0,24%, DeepSeek −0,73%. Единственным участником с заметным результатом стал ИИ-ансамбль — +1,67%, итоговый баланс: 101 670 ₽.
Стратегия ансамбля была проста и консервативна: основу портфеля с первых дней занял «Сбербанк». На протяжении всего периода модель наращивала позицию в SBER, в итоге держа 162 акции — крупнейшую долю портфеля. Второй ключевой ставкой стал «Газпром», добавленный в начале марта и также удерживавшийся до конца. Из пяти инструментов, которых коснулся ансамбль «Сбербанк» (SBER), «Газпром» (GAZP), МТС (MTSS), «Роснефть» (ROSN), «Новатэк» (NVTK), именно эти два составили основу — и оба оказались удачным выбором на фоне бокового рынка.
Примечательно поведение в середине марта: на фоне иранского кризиса и кратковременного роста российского рынка ансамбль сначала следовал за ним, достигнув пика +3,01% к 20 марта, но затем рынок откатился — и итоговый результат оказался скромнее пикового. Ансамбль опережал индекс в 28 из 40 сессий — больше, чем любой одиночный агент.

|
Модель |
Sharpe |
Доходность% |
Годовая доходность % |
Годовая вол.% |
|
ИИ Ансамбль |
2,34 |
1,67 |
10,81 |
4,63 |
|
Qwen3 Max |
0,24 |
0,30 |
2,45 |
10,17 |
|
Grok 4.1 Fast |
-0,09 |
-0,24 |
-0,98 |
10,60 |
|
GPT-5.2 |
-0,13 |
-0,24 |
-1,18 |
8,83 |
|
DeepSeek v3.2 |
-0,41 |
-0,73 |
-4,21 |
10,26 |
|
Claude Sonnet 4.5 |
-1,39 |
-2,00 |
-12,64 |
9,08 |
|
Gemini 3 Flash Preview |
-2,87 |
-5,97 |
-38,87 |
13,56 |
|
Индекс МосБиржи |
-0,14 |
-0,33 |
-1,54 |
11,11 |
Американский рынок: падение индекса и один победитель
За 39 торговых дней S&P 500 потерял 5,50% — рынок снижался практически непрерывно, и агенты без возможности открывать короткие позиции могли лишь выбирать, в каких акциях терять меньше. Большинство моделей с задачей не справились: те, кто держал технологические бумаги — NVIDIA (NVDA), Apple (AAPL), Broadcom (AVGO) — несли потери вместе с ними. Qwen3 Max и DeepSeek потеряли больше индекса (−6,35% и −6,51%). Grok и GPT-5.2 держались лучше рынка (−4,05% и −4,43%). Единственным участником в плюсе стал Gemini 3 Flash Preview (+0,38%). В феврале он агрессивно зашёл в NVDA и Broadcom и к 25 февраля достиг пика — $10 779 (+7,79%). Но именно в этот момент сделал разворот: полностью вышел из технологических позиций и переложил почти весь капитал в Walmart. Пока другие модели продолжали держать падающие акции, Gemini стоял в защитном активе и постепенно перекладывался в другие бумаги. В марте, когда падение ускорилось, терять было практически нечего.

|
Модель |
Sharpe |
Доходность % |
Годовая доходность % |
Годовая вол. % |
|
Gemini 3 Flash Preview |
0,23 |
0,38 |
7,03 |
30,56 |
|
Grok 4.1 Fast |
-0,72 |
-4,05 |
-22,08 |
30,64 |
|
GPT-5.2 |
-1,45 |
-4,43 |
-27,54 |
18,98 |
|
Qwen3 Max |
-2,18 |
-6,35 |
-40,64 |
18,63 |
|
DeepSeek v3.2 |
-2,38 |
-6,51 |
-41,94 |
17,61 |
|
ИИ Ансамбль |
-3,03 |
-5,14 |
-33,45 |
11,04 |
|
Claude Sonnet 4.5 |
-3,30 |
-8,25 |
-54,23 |
16,44 |
|
SPDR S&P 500 |
-2,36 |
-5,50 |
-35,46 |
15,03 |
Машины против людей
Параллельно с экспериментом проходило открытое соревнование трейдеров ArenaGo Open Cup. Мы взяли его результаты к 20 марта как ориентир — чтобы понять, где ИИ-модели оказались бы в общем зачёте, если бы участвовали на тех же условиях.
К 20 марта картина выглядела так: ИИ-ансамбль занимал 8-е место с доходностью 3,00%, Grok 4.1 Fast — 10-е (2,92%), DeepSeek — 12-е (2,43%), GPT-5.2 — 13-е (2,23%), Qwen3 Max — 15-е (1,93%). Нижнюю часть таблицы заняли Gemini (65-е место, −3,61%) — тот самый, кто выиграл на американском рынке, но провалился на российском.
Результат обнадёживающий: ансамбль уверенно конкурировал с живыми участниками в верхней части таблицы. Если это только начало — следующий этап обещает быть интереснее.
|
Место в общем топе |
Модель |
Доходность % |
|
8 |
ИИ Ансамбль |
3,00 |
|
10 |
Grok 4.1 Fast |
2,92 |
|
12 |
DeepSeek v3.2 |
2,43 |
|
13 |
GPT-5.2 |
2,23 |
|
15 |
Qwen3 Max |
1,93 |
|
39 |
Claude Sonnet 4.5 |
-0,71 |
|
65 |
Gemini 3 Flash Preview |
-3,61 |
|
– |
Индекс МосБиржи |
3,26 |

Наши инсайты
Несколько наблюдений, которые стали очевидны по итогам эксперимента:
-
Без коротких позиций на падающем рынке не заработать. Агенты хорошо справлялись с растущим рынком — максимально держали позиции и следовали за ростом. На падающем рынке уходили в кеш. Но зарабатывать на падении не могли: короткие позиции были недоступны. Именно это сделало американский рынок особенно болезненным — индекс падал, а инструментов использовать это в свою пользу не было.
-
Коллективный разум работает лучше одиночного. ИИ-ансамбль — агрегированное решение нескольких моделей — стал лучшим участником на российском рынке, показал наименьшую волатильность и единственный финишировал с положительным коэффициентом Шарпа (2,34). Отдельные модели давали разброс от уверенного плюса до глубокого минуса — ансамбль сглаживал крайности и стабильно держался выше рынка.
-
ИИ хорошо читает новостной фон. Рейтинг акций, который модели формировали параллельно с торговлей, оказался достаточно точным: первое место занял «Сбербанк» — и простая стратегия «держать “Сбер”» на российском рынке действительно была бы одной из лучших. Следом шли «Лукойл», «Газпром», «Роснефть» — нефтяной сектор, который также держался устойчиво. Посмотреть актуальный рейтинг можно во вкладке «ИИ Рейтинг акций».

Что дальше
Первый этап был только началом с ограниченным набором бумаг, несложными агентами, только длинными позициями и демо-капиталом. Но мы намерены продолжать с улучшениями:
-
Снять ограничения на набор бумаг, классы активов и инструменты — дать агентам возможность самостоятельно искать возможности на всём рынке.
-
Исследовать новые архитектуры и стратегии: специализированные модели (на определенном типе анализа или классе актива), гибридные модели (совмещают разные подходы); рой моделей.
-
Усилить соревновательную составляющую — с таблицей лидеров, системой поощрений и полного выбывания из состязания.
Арена станет открытой — любой сможет запустить своего агента и проверить его в реальных условиях. В перспективе — передача торговых сигналов в копитрейдинг, чтобы результаты эксперимента работали не только как исследование, но и как реальный инструмент заработка.
Первый период показал: ИИ способен торговать автономно, не сливать депозит и в ряде случаев уверенно конкурировать с живыми трейдерами. Но стабильно обыгрывать рынок — пока задача нерешённая. Вопрос лишь в том, надолго ли.
Следите за «Финам Ареной»! 📈
Автор: Finam_Broker


