навигация по сайту

Gemini от Google прошёл Pokémon Blue (не без помощи)

На днях CEO Google Сундар Пичаи опубликовал в X победный пост с текстом: Какой финал! Gemini 2.5 Pro только что прошёл Pokémon Blue!

Для ясности: стрим под названием Gemini Plays Pokemon был создан вовсе не Google, а, как он сам себя описывает, 30-летним инженером-программистом, не связанным с компанией, известным как Joel Z. Тем не менее, руководство Google явно следило за процессом с интересом.

К примеру, Логан Килпатрик, руководитель продукта Google AI Studio, ещё в прошлом месяце отмечал, что Gemini хорошо продвигается в прохождении Pokemon и уже получил пятый значок (в то время как следующая по успеху модель имела всего три, пусть и с другим набором инструментов). Пичаи тогда с юмором добавил Работаем над API — Artificial Pokémon Intelligence :).

Примечание редакции H2F:Pokémon Blue — классическая ролевая игра для портативной консоли Game Boy. Игра вышла в 1996 году и стала началом легендарной франшизы. Игрок управляет тренером покемонов, исследует мир, сражается и собирает карманных монстров. Основная цель игры — собрать всех 151 покемонов и 8 значков, одолеть Элитную четвёрку и стать чемпионом Лиги покемонов.

Почему именно Pokemon? В феврале компания Anthropic рассказывала о том, как её ИИ-модель Claude справляется с игрой Pokemon Red, объясняя, что расширенное мышление и ИИ-агент заметно повышают её способности при решении нестандартных задач — вроде прохождения классических игр (Pokémon Red и Pokémon Blue — разные версии одной и той же игры для GameBoy).

Среди источников вдохновения Joel Z упомянул Twitch-канал Claude Plays Pokémon — похожий эксперимент с моделью Anthropic.

Несмотря на все успехи, Claude до сих пор не прошёл Pokemon Red целиком. Значит ли это, что Gemini лучше?

«Не стоит воспринимать это как эталон оценки того, насколько хорошо языковая модель может играть в Pokémon. Их нельзя напрямую сравнивать — у Gemini и Claude разные инструменты и разные вводные данные»Joel Z

И Gemini, и Claude нуждаются в помощи, чтобы проходить игру. Здесь вступают в дело так называемые агенты — они передают ИИ скриншоты с наложенной информацией, позволяют анализировать происходящее и выбирать следующее действие. После этого имитируется нужное нажатие кнопки — уже от имени модели.

Joel Z также признал, что для завершения игры использовались и другие вмешательства, но настаивает, что это не жульничество.

«Мои вмешательства улучшали общее качество принятия решений у Gemini. Я не давал конкретных советов — не было ни гайдов, ни прямых указаний по сложным участкам вроде Mt. Moon. Максимум — подсказка, что для получения Lift Key нужно дважды поговорить с персонажем Rocket Grunt. Это баг, который потом исправили в Pokémon Yellow»

Joel Z добавил, что Gemini Plays Pokémon продолжит активно развиваться.

Похожие новости

Последние новости