L’IA o3 d’OpenAI cale sur Pokémon Rouge après 80 h

En théorie, on pouvait penser qu’une IA de dernière génération surclasserait Pokémon Rouge en un clin d’œil. Pourtant, après plus de 80 heures de diffusion en continu sur Twitch, o3 — la nouvelle intelligence artificielle d’OpenAI axée sur le « raisonnement stratégique » — n’a décroché que deux badges : celui de Brocélôme, suivi d’Ankama. L’expérience, loin d’être un exploit de speedrun, se transforme en véritable test d’endurance qui met en lumière les limites actuelles du machine learning dans le domaine des jeux vidéo classiques.

Un marathon inattendu

Le 27 mai, une foule nombreuse s’est rassemblée sur la chaîne Twitch officielle d’OpenAI pour observer chaque mouvement de o3 dans Kanto. Rapidement, le public a constaté le rythme extraordinairement lent de l’IA :

Lancement de la partie et choix du Pokémon de départ pris plus de cinq minutes.
Premières captures achevées après 12 heures de jeu, avec beaucoup de détours.
Badge de Brocélôme à 48 heures, badge d’Ankama à 80 heures.
Navigation vers Carmin-sur-Mer entrecoupée d’analyses poussées, souvent retardées par des calculs d’optimisation de statistiques.

Chaque décision – attaquer, fuir, soigner ou acheter des Potions – fait l’objet d’une délibération d’au moins deux minutes. En comparaison, un joueur humain expérimenté peut enchaîner les combats et ajuster son équipe en temps réel.

Les mécaniques qui freinent o3

Pokémon Rouge n’est pas qu’un simple RPG : c’est un casse-tête stratégique où s’entremêlent gestion d’équipe, correspondance des types, séquençage des combats et exploration d’une carte regorgeant de raccourcis et de zones cachées. Pour un humain, mémoriser le parcours vers la Cascade Indigo et anticiper l’ordre de type de l’Arène de Jadielle relève de l’habitude. Pour o3, chaque croisement de routes et chaque rencontre aléatoire impliquent l’analyse instantanée des probabilités et la mise à jour d’une base de données interne.

Résultat : l’IA hésite au moindre challenge. Face à Misty, la championne d’eau, o3 a recalculé les forces et faiblesses de ses Pokémon pendant plus de dix minutes avant de démarrer le combat.

Leçons du passé

Ce n’est pas la première fois que Pokémon Rouge sert de laboratoire grandeur nature pour l’intelligence artificielle. En 2014, le phénomène Twitch Plays Pokémon a mobilisé des milliers de spectateurs, mais la partie collective et anarchique a mis 16 jours pour venir à bout du jeu. Plus récemment, d’autres IA comme Google Gemini sur Pokémon Bleu ou Claude d’Anthropic sur Pokémon Jaune ont rencontré des embûches similaires : l’imprévisibilité d’un RNG, une hiérarchie de priorités mouvantes et la frustration inhérente aux échecs répétés.

Ces expériences soulignent une vérité persistante : si le calcul numérique est puissant, il se heurte encore à la créativité et à l’initiative spontanée des joueurs humains.

Les enjeux de l’intuition

Au cœur du problème se trouve la notion d’intuition, forgée par l’expérience. Un Dresseur de Kanto chevronné sait instinctivement qu’il faut parfois sacrifier un Pokémon sous-entraîné pour économiser des objets, ou encore qu’un détour par la Caverne Taupiqueur offre le bon type contre les Pokémon de l’Arène de Céladopole. Une IA, en revanche, transforme chaque choix en projet de recherche interne : « Quels sont les dégâts moyens de Laser Glace contre Stari ? », « Combien de PP reste-t-il sur Tornade ? »… Autant de requêtes qui alourdissent le rythme et diluent l’action.

Et pour les joueurs humains ?

Rassurez-vous : malgré le battage médiatique autour de l’IA, ce sont bien les Dresseurs humains qui conservent l’avantage dans la région de Kanto. o3 offre un spectacle fascinant, prouvant qu’il faut encore des heures de calcul pour remplacer l’agilité cognitive d’une personne au pad. Intuition, adaptation et prise de risque ne sont pas au point remplacées par les algorithmes… du moins pas avant la prochaine génération de modèles.

À suivre : connectez-vous sur la chaîne Twitch d’OpenAI pour suivre en direct la quête de o3 vers le Pokédex complet et mesurer par vous-même jusqu’où l’IA peut repousser ses propres limites.

L’IA o3 d’OpenAI cale sur Pokémon Rouge après 80 h

Un marathon inattendu

Les mécaniques qui freinent o3

Leçons du passé

Les enjeux de l’intuition

Et pour les joueurs humains ?

Comments

Laisser un commentaire Annuler la réponse

More posts

Marvel’s Wolverine transforme la guérison de Logan en vrai pari de combat

Timberborn : maîtriser barrages, sluices et badwater pour irriguer

Dread Delusion : comment bâtir son build – Delusions, sorts et armes

Silent Hill: Townfall doit tuer le fan-service dans ses monstres