Grok 3 Mini накаляет обстановку, поскольку ценовые войны AI еще больше снижают стоимость моделей

xAI делает рывок в сторону эффективного AI с выпуском Grok 3 Mini, своей новейшей языковой модели. И Grok 3, и его собрат Mini доступны через API xAI. В настоящее время семейство Grok 3 включает шесть вариантов: Grok 3, Grok 3 Fast и четыре версии Grok 3 Mini, доступные в медленном и быстром вариантах, каждый из которых обладает либо низкой, либо высокой способностью к рассуждению.

По данным xAI, Grok 3 Mini был специально разработан для обеспечения скорости и доступности, при этом сохраняя встроенный процесс рассуждений — заметное отличие от более крупного Grok 3, который работает без явных рассуждений.

xAI утверждает, что Grok 3 Mini ^[1] лидирует в рейтингах по математике ^[2], программированию и научным тестам на уровне колледжа, при этом он в пять раз дешевле других моделей рассуждений. Несмотря на меньший размер, xAI утверждает, что он даже превосходит более дорогие флагманские модели в нескольких областях.

Сравнительная таблица: модели ИИ с ценами и показателями производительности в тестах, включая AIME, GPQA, LiveCodeBench и MMLU-Pro. — Grok 3 Mini сочетает в себе высокую производительность в тестах с низкой стоимостью, набрав 93% баллов по математике (AIME 2024) и демонстрируя стабильно высокие результаты в тестах | Изображение: xAI

Давление на ценообразование в сфере ИИ не ослабевает, особенно после недавнего снижения цен Google на Gemini 2.5 Flash ^[3]. Grok 3 Mini только подогревает обстановку. Одна примечательная особенность: xAI отправляет полный след рассуждений с каждым ответом API. Это призвано дать разработчикам больше прозрачности в поведении ^[4] модели, хотя, как показывают текущие исследования, эти кажущиеся «мыслительные процессы» иногда могут вводить в заблуждение ^[5] .

Хотя Grok 3 Mini является новым дополнением к модельному ряду, обе модели — Grok 3 и Mini — теперь доступны разработчикам через API xAI ^[6] с интеграцией в существующие инструментальные цепочки для упрощения процесса внедрения.

Grok 3 ^[1] по-прежнему нацелен на сложные задачи, требующие глубоких знаний мира и экспертных знаний в предметной области, а xAI называет его самой мощной моделью, доступной без специального компонента рассуждения.

Команда Artificial Analysis провела сравнительный анализ ^[7] семейства Grok 3 и выделила Grok 3 Mini Reasoning (high) за его соотношение цена/производительность. Согласно их «Индексу интеллекта ^[8] в области искусственного анализа», Grok 3 Mini Reasoning (high) фактически превосходит такие модели, как Deepseek R1 ^[9] и Claude 3.7 Sonne ^[10] t (бюджет рассуждений 64k) — и все это при сохранении значительного преимущества в стоимости.

С ценой $0,3 за миллион входных токенов и $0,5 за миллион выходных токенов, это почти на порядок ниже таких моделей, как o4-mini от OpenAI или Gemini 2.5 Pro от Google ^[11] . Для тех, кому нужна большая скорость, доступна более быстрая версия по цене $0,6/$4 за миллион токенов.

Диаграмма рассеяния: модели ИИ, построенные на основе индекса и цены искусственного интеллекта, Grok 3 mini выделен в зеленом оптимальном квадранте. — Grok 3 Mini обеспечивает индекс интеллекта около 67 при низкой стоимости. | Изображение: Искусственный анализ

Результаты здесь сосредоточены на метрике «интеллект», которая объединяет шесть различных тестов. Подробная разбивка для каждого из них уже в пути, хотя — как всегда — результаты тестов не обязательно отражают реальную производительность. Меньшие модели особенно могут выдавать впечатляющие цифры, которые не всегда переносятся на повседневное использование.

Что касается чистой скорости, Grok 3 превосходит своего более ориентированного на рассуждения аналога Mini: на стандартных конечных точках Grok 3 генерирует 500 токенов примерно за 9,5 секунд, тогда как Grok 3 Mini Reasoning занимает 27,4 секунды.

Artificial Analysis помещает Grok 3 и Grok 3 Mini Reasoning (high) в пятерку лучших в своих категориях — без рассуждений и с рассуждениями — и отмечает, что с этими релизами xAI прочно занял место среди лидеров в текущем ландшафте моделей AI.

Источник ^[12]

Автор: dilnaz_04

Источник ^[13]

Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/14421

URLs in this post:

[1] Grok 3 Mini: https://docs.x.ai/docs/models?cluster=us-east-1#detailed-pricing-for-all-grok-models

[2] математике: http://www.braintools.ru/article/7620

[3] недавнего снижения цен Google на Gemini 2.5 Flash: https://the-decoder.com/googles-gemini-2-5-flash-gives-you-speed-when-you-need-it-and-reasoning-when-you-can-afford-it/

[4] поведении: http://www.braintools.ru/article/9372

[5] «мыслительные процессы» иногда могут вводить в заблуждение: https://the-decoder.com/anthropic-study-finds-language-models-often-hide-their-reasoning-process/

[6] API xAI: https://docs.x.ai/docs/overview

[7] Artificial Analysis провела сравнительный анализ: https://x.com/ArtificialAnlys/status/1913057626117820438

[8] интеллекта: http://www.braintools.ru/article/7605

[9] Deepseek R1: https://the-decoder.com/deepseeks-latest-r1-zero-model-matches-openais-o1-in-reasoning-benchmarks/

[10] Claude 3.7 Sonne: https://the-decoder.com/anthropic-launches-claude-3-7-sonnet-hybrid-ai-model-and-claude-code-programming-tool/

[11] Gemini 2.5 Pro от Google: https://the-decoder.com/gemini-2-5-pro-google-has-finally-caught-up/

[12] Источник: https://the-decoder.com/grok-3-mini-turns-up-the-heat-as-ai-price-wars-push-model-costs-even-lower/

[13] Источник: https://habr.com/ru/companies/bothub/news/902492/?utm_source=habrahabr&utm_medium=rss&utm_campaign=902492

Нажмите здесь для печати.