Grok 4 Fast — новая модель от xAI. ai.. ai. grok.. ai. grok. Grok4Fast.. ai. grok. Grok4Fast. llm.. ai. grok. Grok4Fast. llm. openrouter.. ai. grok. Grok4Fast. llm. openrouter. reasoning.. ai. grok. Grok4Fast. llm. openrouter. reasoning. vercel.. ai. grok. Grok4Fast. llm. openrouter. reasoning. vercel. xAI.. ai. grok. Grok4Fast. llm. openrouter. reasoning. vercel. xAI. генеративный ии.

Команда AI for Devs подготовила перевод анонса Grok 4 Fast — новой модели xAI, которая сочетает быстрые ответы и глубокие рассуждения, снижает стоимость токенов на 98% и впервые становится доступной всем пользователям без ограничений.

Мы рады представить Grok 4 Fast — шаг вперёд в создании моделей для экономичного рассуждения. Построенная на опыте xAI с Grok 4, Grok 4 Fast обеспечивает производительность уровня передовых решений как для бизнеса, так и для конечных пользователей — при выдающейся эффективности по числу токенов. Эта модель раздвигает границы для компактных и быстрых ИИ, делая качественные рассуждения доступными большему числу пользователей и разработчиков. Grok 4 Fast предлагает передовую экономичность (SOTA), современные возможности поиска в интернете и X, контекстное окно на 2 миллиона токенов и единую архитектуру, объединяющую режимы рассуждений и прямого ответа в одной модели.

Новый уровень доступного интеллекта

Grok 4 Fast открывает новую страницу в создании доступных по стоимости систем искусственного интеллекта, опережая Grok 3 Mini на тестах на рассуждение и значительно снижая затраты на токены.

Benchmark pass@1	Grok 4 Fast	Grok 4	Grok 3 Mini (High)	GPT-5 (High)	GPT-5 Mini (High)
GPQA Diamond	85.7%	87.5%	79.0%	85.7%	82.3%
AIME 2025 (без инструментов)	92.0%	91.7%	83.0%	94.6%	91.1%
HMMT 2025 (без инструментов)	93.3%	90.0%	74.0%	93.3%	87.8%
HLE (без инструментов)	20.0%	25.4%	11.0%	24.8%	16.7%
LiveCodeBench (янв-май)	80.0%	79.0%	70.0%	86.8%	77.4%

Мы использовали масштабное обучение с подкреплением (reinforcement learning), чтобы максимально повысить «плотность интеллекта» Grok 4 Fast. В наших тестах модель показала результаты, сопоставимые с Grok 4, при этом в среднем используя на 40% меньше thinking-токенов.

Эта 40%-ная прибавка к эффективности по токенам в сочетании с заметно более низкой ценой за токен позволяет сократить стоимость достижения того же уровня на передовых бенчмарках на 98% по сравнению с Grok 4. Независимый обзор от Artificial Analysis подтвердил, что Grok 4 Fast демонстрирует лучший в своём классе показатель соотношения «цена-интеллект» среди всех публично доступных моделей на Artificial Analysis Intelligence Index.

Нативная работа с инструментами и передовой поиск

Grok 4 Fast обучался по схеме end-to-end с использованием обучения с подкреплением (RL), специально ориентированного на работу с инструментами. Он отлично справляется с задачей выбора момента, когда нужно вызвать инструмент — например, выполнить код или открыть браузер.

Grok 4 Fast демонстрирует передовые агентные возможности поиска: он легко серфит веб и X, дополняя запросы актуальными данными в реальном времени. Модель умеет переходить по ссылкам, обрабатывать медиа (включая изображения и видео на X) и синтезировать результаты с молниеносной скоростью.

Benchmark pass@1	Grok 4 Fast	Grok 4	Grok 3 (без рассуждений)
BrowseComp	44.9%	43.0%	—
SimpleQA	95.0%	94.0%	82.0%
Reka Research Eval	66.0%	58.0%	37.0%
BrowseComp (zh)	51.2%	45.0%	10.8%
X Bench Deepsearch (zh)	74.0%	66.0%	27.0%
X Browse*	58.0%	53.2%	20.8%

*X Browse — внутренний бенчмарк, оценивающий многошаговый поиск и возможности навигации агента в X.

Передовой уровень общего пост-тренинга

Grok 4 Fast также задаёт новую планку эффективности в решении задач общего назначения. Мы рады поделиться результатами модели на LMArena, где она проходила закрытое тестирование в Search и Text Arena.

В Search Arena LMArena модель grok-4-fast-search (кодовое имя: menlo) заняла первое место с результатом 1163 Elo, опередив ближайшего конкурента o3-search на 17 пунктов. Высокая эффективность рассуждений и «плотность интеллекта» позволяют Grok 4 Fast обгонять гораздо более крупные модели в реальных задачах, связанных с поиском.

Единая модель: рассуждения и быстрые ответы

Раньше для режима рассуждений и для быстрых ответов использовались разные модели. Grok 4 Fast представляет единую архитектуру, в которой рассуждения (длинные цепочки мыслей) и короткие ответы обрабатываются одними и теми же весами модели, а поведение настраивается с помощью системных промтов. Такой подход снижает полную задержку ответа и уменьшает количество токенов, делая Grok 4 Fast отличным решением для задач, требующих реакции в реальном времени.

На grok.com это выражается в плавных переходах: для простых запросов модель отвечает мгновенно, а для сложных включает расширенный режим рассуждений. В API xAI разработчики могут гибко настраивать это поведение, выбирая баланс между скоростью и глубиной.

Grok 4 Fast уже доступен всем пользователям. В режимах Fast и Auto вы заметите значительное ускорение поиска и получения информации. Кроме того, для сложных запросов в Auto-режиме будет использоваться именно Grok 4 Fast, что обеспечит гораздо более быструю работу без потери качества. Впервые все пользователи, включая бесплатных, получили доступ к нашей последней модели без ограничений — важный шаг к демократизации продвинутого ИИ.

Grok 4 Fast на OpenRouter, Vercel AI Gateway и в xAI API

Ограниченное время Grok 4 Fast будет доступен бесплатно на OpenRouter и Vercel AI Gateway.

Мы также выпускаем Grok 4 Fast в виде двух моделей:

grok-4-fast-reasoning
grok-4-fast-non-reasoning

Каждая из них поддерживает контекстное окно в 2 млн токенов. Это позволяет разработчикам тонко настраивать вычислительные ресурсы под конкретные сценарии.

Цены на использование grok-4-fast-reasoning и grok-4-fast-non-reasoning в xAI API:

Тип токена	<128k токенов	≥128k токенов
Входные токены	$0.20 / 1M	$0.40 / 1M
Выходные токены	$0.50 / 1M	$1.00 / 1M
Кэшированные входные токены	$0.05 / 1M	—

Русскоязычное сообщество про AI в разработке

Друзья! Эту статью перевела команда ТГК «AI for Devs» — канала, где мы рассказываем про AI-ассистентов, плагины для IDE, делимся практическими кейсами и свежими новостями из мира ИИ. Подписывайтесь, чтобы быть в курсе и ничего не упустить!

Автор: python_leader

Источник

Запись добавлена: 21.09.2025 в 07:31
Оставлено в

Grok 4 Fast — новая модель от xAI

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

Новый уровень доступного интеллекта

Нативная работа с инструментами и передовой поиск

Передовой уровень общего пост-тренинга

Единая модель: рассуждения и быстрые ответы

Grok 4 Fast на OpenRouter, Vercel AI Gateway и в xAI API

Русскоязычное сообщество про AI в разработке

Grok 4 Fast — новая модель от xAI

Меню навигации

Рекомендуем

На главную

Главное

Рубрики

Методики

Информация

Из архивов

Новый уровень доступного интеллекта

Нативная работа с инструментами и передовой поиск

Передовой уровень общего пост-тренинга

Единая модель: рассуждения и быстрые ответы

Grok 4 Fast на OpenRouter, Vercel AI Gateway и в xAI API

Русскоязычное сообщество про AI в разработке