Стартап из шести выходцев DeepMind обошел Gemini 3 на главном бенчмарке абстрактного мышления ARC-AGI-2
Команда Poetiq из Майами преодолела
Глава Google DeepMind: AGI на горизонте, риск для человечества — «значительный»
Генеральный директор Google DeepMind Демис Хассабис заявил
Новая модель ChatGPT будет называться Garlic. Она выйдет на следующей неделе
OpenAI работает над новой крупной языковой моделью под внутренним названием Garlic («Чеснок»), пытаясь отвоевать позиции в гонке искусственного интеллекта у Google, сообщает The Information.
Gemini 3 Flash, ядерный синтез и «пузырь ИИ»: программные заявления Сундара Пичаи
В подкасте Google AI: Release Notes глава компании Сундар Пичаи рассказал
Gemini 3 Pro стал первым ИИ, достигшим уровня IQ 130
Превью-версия Gemini 3 Pro набрала 130 баллов в оффлайн-бенчмарке Mensa, который является специальной версией знаменитого теста на IQ, адаптированного для оценки ИИ. В основу положен классический тест Mensa Norway, однако задачи написаны заново и не раскрываются, чтобы не допустить дообучения новых моделей специально под эти вопросы. Моделям с компьютерным зрением тест показывают в виде картинок, всем остальным — поясняют текстом смысл задачи. Вот сводная таблица, в которой даны результаты моделей в оффлайн-бенчмарке и Mensa Norway:
Nano Banana Pro — почему это прорывная модель генерации и редактирования изображений? Проверяем на реальных примерах
20 ноября состоялся официальный
Нейро-дайджест: ключевые события мира AI за 3-ю неделю ноября 2025
Привет! Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.Меня зовут Вандер
Google Antigravity и Gemini 3 Pro: что реально меняется в разработке и почему это не убийца Cursor
A demo of Google’s new Antigravity agentic developer tool. (Image credit: Google)18 ноября 2025 года Google показал связку из двух продуктов: новую флагманскую модель Gemini 3 Pro и agent-first IDE Google Antigravity. Классический концепт
Artificial Analysis обновили свой Intelligence Index
В новых тестах неожиданно выстрелил Gemini 3 Pro Preview. По половине бенчмарков у модели не просто небольшой прирост, а заметный скачок вперёд.Фактические знания и галлюцинацииGemini 3 Pro Preview занимает 1-е место в 5 из 10 тестов Artificial Analysis Intelligence Index:GPQA Diamond, MMLU‑Pro, HLE, LiveCodeBench и SciCode.Самый показательный результат — 37% в Humanity's Last Exam (сложный экзамен «на последнюю попытку человечества»). Это на 10+ п.п. выше предыдущего лучшего результата — для такого класса задач это большой отрыв, а не статистический шум.»Отдельно модель лидирует в AA‑Omniscience, новом комплексном бенчмарке знаний и галлюцинаций:

