- BrainTools - https://www.braintools.ru -

Искусственный интеллект нового поколения: как Grok 3 Маска опередил ведущие AI-системы

Илон Маск представил новую модель искусственного интеллекта [1] Grok 3 [2] от стартапа xAI [2], утверждая, что она превосходит ведущих конкурентов по ключевым техническим показателям. Этот шаг существенно усиливает гонку за создание более мощных AI-систем.

Искусственный интеллект нового поколения: как Grok 3 Маска опередил ведущие AI-системы - 1

Запуск Grok 3 произошел спустя всего несколько дней после неудачной попытки Маска приобрести OpenAI за $97,4 миллиарда [3]. Во время трансляции на платформе X, Маск заявил, что Grok 3 «на порядок мощнее, чем Grok 2», и выделил её способность решать сложные задачи.

Ранние тесты подтверждают некоторые заявления xAI. Модель возглавила рейтинг Chatbot Arena [4], превзойдя GPT-4o [5] от OpenAI, Google Gemini [6] и V3 от DeepSeek [7] в слепых тестах пользователей. Согласно опубликованным данным, Grok 3 показывает лучшие результаты в математике [8] (AIME ’24), научном мышлении [9] (GPQA) и задачах программирования.

Grok 3 возглавляет рейтинг Chatbot Arena с оценкой около 1400, значительно превосходя другие крупные AI-модели в слепом тестировании пользователей. (Источник: xAI)

Grok 3 возглавляет рейтинг Chatbot Arena с оценкой около 1400, значительно превосходя другие крупные AI-модели в слепом тестировании пользователей. (Источник: xAI)

«Grok 3 демонстрирует передовые способности к логическому мышлению [10]. Мало какие модели справляются с этим стабильно. Модели OpenAI с этим справляются, но DeepSeek-R1, Gemini 2.0 Flash Thinking и Claude — нет», — написал бывший исследователь OpenAI Андрей Карпати [11] на X после тестирования.

Создание модели потребовало огромных вычислительных мощностей. xAI удвоила кластер GPU до 200 000 чипов Nvidia, расположенных в новом дата-центре в Мемфисе. Это подчеркивает растущие требования к вычислительным ресурсам для разработки передовых AI-систем.

Искусственный интеллект нового поколения: как Grok 3 Маска опередил ведущие AI-системы - 3

Одним из ключевых новшеств Grok 3 стала функция «DeepSearch», которая сочетает веб-поиск с возможностями анализа, позволяя модели извлекать и обрабатывать информацию из различных источников. Также есть режимы для решения сложных задач, такие как «Think», который показывает ход рассуждений модели, и режим «Big Brain», выделяющий больше ресурсов на сложные задачи.

«Самое важное в AI — это скорость обучения [12]. А @xai учится быстрее всех», — написал ветеран техиндустрии Роберт Скобл, ссылаясь на разговор с сооснователем Apple Siri Томом Грубером.

Однако тесты выявили и недостатки. Карпати отметил, что модель иногда выдумывает ссылки и испытывает трудности с юмором [13] и задачами, связанными с этическими вопросами. Эти проблемы характерны для большинства современных AI-систем и подчеркивают сложность создания искусственного интеллекта, который мыслит на уровне человека.

В ключевых показателях производительности Grok 3 и его уменьшенная версия показали лучшие результаты по тестам по математике, науке и программированию по сравнению с конкурентами от Google, OpenAI, Anthropic и DeepSeek. Полноразмерная модель Grok 3 (темно-синий) особенно отличилась в научных рассуждениях. (Источник: xAI)

В ключевых показателях производительности Grok 3 и его уменьшенная версия показали лучшие результаты по тестам по математике, науке [14] и программированию по сравнению с конкурентами от Google, OpenAI, Anthropic и DeepSeek. Полноразмерная модель Grok 3 (темно-синий) особенно отличилась в научных рассуждениях. (Источник: xAI)

Генеральный директор Scale.ai [15] Александр Ванг [16] высоко оценил Grok 3, заявив в Twitter: Это новая лучшая модель в мире от команды @xai Он отметил её превосходство в ряде тестов и выразил желание сотрудничать с xAI.

Grok 3 будет доступна по подписке Premium+ на платформе X за $40 в месяц, а также через новый сервис SuperGrok за $30 в месяц. В ближайшие недели планируется запуск API для корпоративных клиентов.

Этот запуск усиливает конкуренцию на рынке AI, особенно в свете того, что китайский стартап DeepSeek недавно представил сопоставимую модель с меньшими вычислительными требованиями. Это также поднимает вопросы о том, насколько устойчива текущая гонка за вычислительные мощности, так как компании вкладывают миллиарды долларов в оборудование для развития AI.

Маск подчеркнул, что Grok 3 всё ещё находится в стадии бета-тестирования, и улучшения ожидаются «почти каждый день». В ближайшие недели компания планирует добавить голосовое взаимодействие, а предыдущая модель Grok 2 станет доступной с открытым кодом после стабилизации новой версии.

Однако самым примечательным в запуске Grok 3, возможно, является не её технические характеристики или результаты тестов, а то, что она символизирует: нарастающее напряжение между Маском [17] и его бывшими коллегами из OpenAI. Спустя всего несколько дней после неудачной попытки приобрести OpenAI за $97,4 миллиарда, Маск представил модель, которая бросает вызов её лидерству [18] — доказав, что даже отвергнутый сооснователь может стать серьёзным конкурентом в гонке за доминирование в сфере AI.

Источник [19]

Автор: cognitronn

Источник [20]


Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/12361

URLs in this post:

[1] интеллекта: http://www.braintools.ru/article/7605

[2] Grok 3: https://x.ai/

[3] приобрести OpenAI за $97,4 миллиарда: https://www.nytimes.com/2025/02/14/technology/openai-elon-musk.html

[4] Chatbot Arena: https://lmarena.ai/?leaderboard

[5] GPT-4o: https://openai.com/index/hello-gpt-4o/

[6] Gemini: https://deepmind.google/technologies/gemini/

[7] DeepSeek: https://github.com/deepseek-ai/DeepSeek-V3

[8] математике: http://www.braintools.ru/article/7620

[9] мышлении: http://www.braintools.ru/thinking

[10] логическому мышлению: http://www.braintools.ru/thinking/typology/logical-thinking

[11] Андрей Карпати: https://x.com/karpathy/status/1891720635363254772

[12] обучения: http://www.braintools.ru/article/5125

[13] юмором: http://www.braintools.ru/article/3517

[14] науке: http://www.braintools.ru/article/7634

[15] Scale.ai: http://Scale.ai

[16] Александр Ванг: https://x.com/alexandr_wang/status/1891714169629524126

[17] нарастающее напряжение между Маском: https://venturebeat.com/ai/elon-musk-sues-openai-again-alleging-shakespearean-betrayal-of-ai-mission/

[18] лидерству: http://www.braintools.ru/article/1165

[19] Источник: https://venturebeat.com/ai/elon-musk-just-released-an-ai-thats-smarter-than-chatgpt-heres-why-that-matters/

[20] Источник: https://habr.com/ru/companies/bothub/news/884040/?utm_source=habrahabr&utm_medium=rss&utm_campaign=884040

www.BrainTools.ru

Rambler's Top100