L’IA o3 d’OpenAI cale sur Pokémon Rouge après 80 h

En théorie, on pouvait penser qu’une IA de dernière génération surclasserait Pokémon Rouge en un clin d’œil. Pourtant, après plus de 80 heures de diffusion en continu sur Twitch, o3 — la nouvelle intelligence artificielle d’OpenAI axée sur le « raisonnement stratégique » — n’a décroché que deux badges : celui de Brocélôme, suivi d’Ankama. L’expérience, loin d’être un exploit de speedrun, se transforme en véritable test d’endurance qui met en lumière les limites actuelles du machine learning dans le domaine des jeux vidéo classiques.

Un marathon inattendu

Le 27 mai, une foule nombreuse s’est rassemblée sur la chaîne Twitch officielle d’OpenAI pour observer chaque mouvement de o3 dans Kanto. Rapidement, le public a constaté le rythme extraordinairement lent de l’IA :

  • Lancement de la partie et choix du Pokémon de départ pris plus de cinq minutes.
  • Premières captures achevées après 12 heures de jeu, avec beaucoup de détours.
  • Badge de Brocélôme à 48 heures, badge d’Ankama à 80 heures.
  • Navigation vers Carmin-sur-Mer entrecoupée d’analyses poussées, souvent retardées par des calculs d’optimisation de statistiques.

Chaque décision – attaquer, fuir, soigner ou acheter des Potions – fait l’objet d’une délibération d’au moins deux minutes. En comparaison, un joueur humain expérimenté peut enchaîner les combats et ajuster son équipe en temps réel.

Les mécaniques qui freinent o3

Pokémon Rouge n’est pas qu’un simple RPG : c’est un casse-tête stratégique où s’entremêlent gestion d’équipe, correspondance des types, séquençage des combats et exploration d’une carte regorgeant de raccourcis et de zones cachées. Pour un humain, mémoriser le parcours vers la Cascade Indigo et anticiper l’ordre de type de l’Arène de Jadielle relève de l’habitude. Pour o3, chaque croisement de routes et chaque rencontre aléatoire impliquent l’analyse instantanée des probabilités et la mise à jour d’une base de données interne.

Screenshot from Pokémon Red Version
Screenshot from Pokémon Red Version

Résultat : l’IA hésite au moindre challenge. Face à Misty, la championne d’eau, o3 a recalculé les forces et faiblesses de ses Pokémon pendant plus de dix minutes avant de démarrer le combat.

Leçons du passé

Ce n’est pas la première fois que Pokémon Rouge sert de laboratoire grandeur nature pour l’intelligence artificielle. En 2014, le phénomène Twitch Plays Pokémon a mobilisé des milliers de spectateurs, mais la partie collective et anarchique a mis 16 jours pour venir à bout du jeu. Plus récemment, d’autres IA comme Google Gemini sur Pokémon Bleu ou Claude d’Anthropic sur Pokémon Jaune ont rencontré des embûches similaires : l’imprévisibilité d’un RNG, une hiérarchie de priorités mouvantes et la frustration inhérente aux échecs répétés.

Screenshot from Pokémon Red Version
Screenshot from Pokémon Red Version

Ces expériences soulignent une vérité persistante : si le calcul numérique est puissant, il se heurte encore à la créativité et à l’initiative spontanée des joueurs humains.

Les enjeux de l’intuition

Au cœur du problème se trouve la notion d’intuition, forgée par l’expérience. Un Dresseur de Kanto chevronné sait instinctivement qu’il faut parfois sacrifier un Pokémon sous-entraîné pour économiser des objets, ou encore qu’un détour par la Caverne Taupiqueur offre le bon type contre les Pokémon de l’Arène de Céladopole. Une IA, en revanche, transforme chaque choix en projet de recherche interne : « Quels sont les dégâts moyens de Laser Glace contre Stari ? », « Combien de PP reste-t-il sur Tornade ? »… Autant de requêtes qui alourdissent le rythme et diluent l’action.

Screenshot from Pokémon Red Version
Screenshot from Pokémon Red Version

Et pour les joueurs humains ?

Rassurez-vous : malgré le battage médiatique autour de l’IA, ce sont bien les Dresseurs humains qui conservent l’avantage dans la région de Kanto. o3 offre un spectacle fascinant, prouvant qu’il faut encore des heures de calcul pour remplacer l’agilité cognitive d’une personne au pad. Intuition, adaptation et prise de risque ne sont pas au point remplacées par les algorithmes… du moins pas avant la prochaine génération de modèles.

À suivre : connectez-vous sur la chaîne Twitch d’OpenAI pour suivre en direct la quête de o3 vers le Pokédex complet et mesurer par vous-même jusqu’où l’IA peut repousser ses propres limites.

Comments

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *