gemini 3.1 pro.

Вышел бенчмарк ARC-AGI-3: люди набирают 100%, GPT-5.4 — 0,26%

ARC Prize Foundation опубликовала

продолжить чтение

ChatGPT 5.4 Pro: обзор, бенчмарки, сравнение

Помните, как пару лет назад мы восхищались тем, что нейросеть может написать связный абзац? А год назад – что она осилила код без синтаксической ошибки? Сегодня планка взлетела так высоко, что уникальные способности моделей превращаются в стандартный пакет услуг.

продолжить чтение

Gemini 3.1 Pro: Что нового? Как использовать нейросеть в России без VPN

Подробный разбор возможностей нейросети Gemini 3.1 Pro: видео, текст, генерация изображений и музыки. Узнайте, как использовать Gemini в России без VPN, купить подписку и писать промпты.Gemini 3.1 Pro в России

продолжить чтение

Галлюцинации недели: Gemini 3.1 Pro, Sonnet 4.6 в бою и новый дом llama.cpp

Google бросает перчатку, Anthropic сканирует чужой код, а моделям выдают фудтраки и деньги на бизнес. Приглядимся ко всему по порядку.Google выпустил Gemini 3.1 Pro. Как обычно, мы видим красивые бенчмарки: ARC-AGI-2 вырос с 31% до 77%, SWE-Bench Verified 80,6%. По соотношению цены и заявленного качества модель очень интересная, а ещё она умеет такое.В реальной работе не всё гладко. Бывший сотрудник Google на

продолжить чтение

Как читать новости об ИИ и отличать прорыв от пресс-релиза. И как относиться к заголовкам про «ИИ отнимет работу»

Схема: из чего состоит релиз модели LLM (пост → model/system card → методика → цена → независимые

продолжить чтение

Gemini 3.1 Pro: обзор, бенчмарки, сравнение

Прогремел очередной релиз, Google DeepMind 19 февраля 2026 года выпустила свою новую модель - Gemini 3.1 Pro.

продолжить чтение

ChatGPT vs Gemini: какая нейросеть реально лучше?

Неделя выдалась достаточно насыщенной. На ней нам представили Claude Sonnet 4.6 и Gemini 3.1 Pro. OpenAI же, по моему личному мнению, немного отстает от них, хотя не так давно была выпущена ChatGPT 5.3 Codex для агентного программирования. В комментариях под некоторыми из выложенных мной новостей иногда наблюдается разброс мнений, мол, Gemini плохо себя показывает, а вот ChatGPT – вещь, но в других моих материалах люди думают ровно наоборот.Сидя и раздумывая над этим, мне пришла в голову идея – сравнить ChatGPT и Gemini в достаточно рутинных задачах

продолжить чтение

Gemini 3.1 Pro обошел Claude и GPT в рейтинге интеллекта, но главный сюрприз – в цене

Согласно свежим данным Artificial Analysis, модель Gemini 3.1 Pro Preview не только возглавила рейтинг Intelligence Index (показатель совокупного интеллекта), но и превзошла конкурентов по соотношению цены и качества.Цифры говорят сами за себя. Чтобы прогнать модель через все тесты Intelligence Index, Gemini потребовалось всего 56 млн токенов. Для сравнения: GPT-5.2 (версия xhigh – максимальный уровень размышлений) съел 130 млн, а Claude Opus 4.6 (max) – 58 млн. Разница с Opus невелика, но тут в дело вступает ценообразование.

продолжить чтение

Gemini 3.1 Pro: Google выкатила новую «базовую» модель для сложных задач и агентных сценариев

Google продолжает прокачивать линейку Gemini и сегодня выкатила Gemini 3.1 Pro — модель, которую позиционируют как «базовую умную силу» для задач, где обычного ответа «вот ссылка / вот краткий совет» уже не хватает. Речь про многошаговые рассуждения, сведение данных в единую картину, объяснения сложных тем «с картинкой в голове» и генерацию более «инженерного» результата, а не просто текста. Неделю назад Google обновила Gemini 3 Deep Think

продолжить чтение

Google выпустила Gemini 3.1 Pro — лучший ИИ в большинстве бенчмарков

Google выпустила Gemini 3.1 Pro — новую флагманскую модель семейства Gemini. На бенчмарке ARC-AGI-2, который оценивает способность решать незнакомые логические задачи, модель набрала верифицированные 77,1%— при среднем результате человека около 60%. У предшественника Gemini 3 Pro, вышедшего в ноябре, было 31,1%.

продолжить чтение