- BrainTools - https://www.braintools.ru -

Gemini 2.5 Pro от Google прошел Pokémon Blue

Самая дорогая модель искусственного интеллекта [1] от Google, похоже, преодолела важный рубеж: она победила в видеоигре 29-летней давности. Вчера вечером генеральный директор Google Сундар Пичаи с триумфом опубликовал на X [2]: «Какой финиш! Gemini 2.5 Pro только что прошел Pokémon Blue!»

Gemini 2.5 Pro от Google прошел Pokémon Blue - 1

Для ясности: прямая трансляция Gemini Plays Pokemon [3] была создана «30-летним инженером-программистом, не связанным с Google», которого зовут Джоэл Зи. [4] Но руководители Google приветствуют это начинание.

Например, Логан Килпатрик, руководитель отдела разработки Google AI Studio, в прошлом месяце написал [5], что Gemini «добилась большого прогресса в прохождении Pokémon» и заработала свой пятый значок (следующая лучшая модель пока имеет только 3), что заставило Пичаи пошутить: [6] «Мы работаем над API, искусственным интеллектом [7] покемонов»

Почему Pokémon? Еще в феврале Anthropic подчеркнула прогресс [8], которого достигли ее модели искусственного интеллекта Claude в «Pokémon Red», написав, что «расширенное мышление [9] и обучение [10] агентов» Claude дают ему «значительный толчок» для «более неожиданных» задач, таких как прохождение игры. («Pokémon Red» и «Blue» — это разные версии игры GameBoy [11], впервые выпущенной в 1996 году и связанной с давней франшизой Pokémon). Есть даже канал Claude Plays Pokemon на Twitch [12], который Джоэл Зи назвал источником вдохновения.

Несмотря на прогресс, Claude, похоже, пока не победил «Pokémon Red». Означает ли это, что Gemini объективно лучше в этой игре? На своей странице Twitch Джоэл Зи призвал зрителей: «Пожалуйста, не считайте это эталоном того, насколько хорошо LLM может играть в Pokemon. Вы не можете делать прямых сравнений — у Gemini и Claude разные инструменты, и они получают разную информацию».

Обеим моделям AI нужна помощь в игре — вот тут-то и вступают в дело вышеупомянутые агентские упряжки [13], предоставляя моделям игровые скриншоты с наложенной на них дополнительной информацией, позволяя модели решать, как реагировать [14] (что может включать вызов специализированных агентов), а затем нажимать кнопку, соответствующую инструкции AI.

Источник [15]

Автор: dilnaz_04

Источник [16]


Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/14895

URLs in this post:

[1] Самая дорогая модель искусственного интеллекта: https://techcrunch.com/2025/04/04/gemini-2-5-pro-is-googles-most-expensive-ai-model-yet/

[2] с триумфом опубликовал на X: https://x.com/sundarpichai/status/1918455766542930004?t=8NLgn42y3kAqUbZVhg4zLw&s=19

[3] прямая трансляция Gemini Plays Pokemon: https://www.twitch.tv/gemini_plays_pokemon

[4] Джоэл Зи.: https://bsky.app/profile/jcz.dev

[5] в прошлом месяце написал: https://x.com/OfficialLoganK/status/1913365614397182096

[6] :: https://x.com/sundarpichai/status/1913464625393524967

[7] интеллектом: http://www.braintools.ru/article/7605

[8] Anthropic подчеркнула прогресс: https://www.anthropic.com/research/visible-extended-thinking

[9] мышление: http://www.braintools.ru/thinking

[10] обучение: http://www.braintools.ru/article/5125

[11] игры GameBoy: https://en.wikipedia.org/wiki/Pok%C3%A9mon_Red,_Blue,_and_Yellow

[12] канал Claude Plays Pokemon на Twitch: https://www.twitch.tv/claudeplayspokemon

[13] вышеупомянутые агентские упряжки: https://www.lesswrong.com/posts/7mqp8uRnnPdbBzJZE/is-gemini-now-better-than-claude-at-pokemon

[14] реагировать: http://www.braintools.ru/article/1549

[15] Источник: https://techcrunch.com/2025/05/03/googles-gemini-has-beaten-pokemon-blue-with-a-little-help/

[16] Источник: https://habr.com/ru/companies/bothub/news/906694/?utm_source=habrahabr&utm_medium=rss&utm_campaign=906694

www.BrainTools.ru

Rambler's Top100