Gemini 3 Pro стал первым ИИ, достигшим уровня IQ 130
Превью-версия Gemini 3 Pro набрала 130 баллов в оффлайн-бенчмарке Mensa, который является специальной версией знаменитого теста на IQ, адаптированного для оценки ИИ. В основу положен классический тест Mensa Norway, однако задачи написаны заново и не раскрываются, чтобы не допустить дообучения новых моделей специально под эти вопросы. Моделям с компьютерным зрением тест показывают в виде картинок, всем остальным — поясняют текстом смысл задачи. Вот сводная таблица, в которой даны результаты моделей в оффлайн-бенчмарке и Mensa Norway:
Вышел Grok 4.1 от xAI
Компания xAI официально объявила о выпуске Grok 4.1. По данным компании, Grok 4.1 значительно улучшает качество взаимодействия за счёт расширенных творческих, эмоциональных и совместных возможностей. Модель стала лучше воспринимать тонкие намерения пользователя, придерживается более целостного стиля общения и сохраняет «личность», при этом не теряя точности и надёжности, характерных для предыдущих поколений Grok.
xAI выпустила Grok 4.1 — новый ИИ сразу доступен бесплатно
xAI выпустила Grok 4.1, обновленную модель своего ведущего ИИ, который уже доступен в веб-версии и мобильных приложениях на iOS и Android. Модель доступна в быстром и рассуждающем режиме — переключение происходит автоматически, но при необходимости можно нажать Think Harder и включить рассуждения вручную. Grok 4.1 сразу же доступен бесплатно, конкретные лимиты xAI не раскрывает, но в первых отзывах на Reddit говорят, что беседовали с моделью десятки минут, не получив никаких ограничений.Grok 4.1 ставит новый рекорд в рейтинге LMArena: 1483 очка для рассуждающей версии и 1465 очков — для чат-варианта.
Когда две головы лучше, чем одна: ученые экспериментируют с коллективной работой нейросетей
Привет, Хабр! Меня зовут Кирилл Пшинник, я научный сотрудник Университета Иннополис и CEO Онлайн-Университета «Зерокодер», а также автор книги «Искусственный интеллект: путь к новому миру». Как можно понять, я интересуюсь нейросетями и разными сторонами их использования: читаю новости, научные работы, пишу статьи сам. Сегодня я хочу рассказать о японском стартапе Sakana AI, который изобрел open-source фреймворк TreeQuest. Он позволяет использовать сразу несколько разных больших языковых моделей для того, чтобы получить более точный результат. Но начну я с голубей.
Grok 4 — самая умная модель? Обзор новой нейросети от Илона Маска
В июле этого года Илон Маск и команда xAI выпустили Grok 4 — свою новую «самую умную модель в мире».
Grok 4 встал на путь исправления — больше никаких ссылок на мнение своего «хозяина»
Компания xAI ответила на критику, касающуюся ответов Grok 4, внеся изменения в системный промт. В официальном заявлении компания признала, что модель иногда предоставляла неточные или нежелательные ответы, что часто было связано с использованием высказываний Илона Маска или xAI в качестве основы для ответов на открытые вопросы.
Grok 4 от xAI: самый умный ИИ на планете?
«Это самый умный ИИ на планете» — так начали презентацию Grok 4 от xAI. Илон Маск лично представил свою новую модель и заявил, что впервые искусственный интеллект способен решать сложные задачи, в том числе инженерные, ответы на которые нельзя просто найти ни в интернете, ни в учебниках.Смелое заявление, правда? Давайте разберёмся, что такого сделали Илон Маск и его команда. В этой статье вы узнаете: — чем Grok 4 отличается от других нейросетей; — как именно его обучали и почему это важно; — какие рекордные результаты он показал в тестах;

