Scendendo più nel dettaglio, secondo un report interno di Google DeepMind, Gemini 2.5 Pro entra in uno stato di “panico” quando uno dei suoi Pokémon sta per lasciarci le penne. In quei momenti, il modello abbandona alcune strategie e subisce un degrado qualitativo nelle capacità di ragionamento, tanto che gli spettatori su Twitch riescono a individuare i segnali di smarrimento del sistema.
Dall’altra parte, Claude di Anthropic ha mostrato comportamenti altrettanto singolari. Imparata la regola per cui, in caso di sconfitta completa, il gioco riporta il personaggio all’ultimo Centro Pokémon visitato, l’AI ha ragionato male: bloccata all’interno delle grotte di Monte Luna, ha provato a sconfiggere volontariamente tutti i propri Pokémon, sperando di spostarsi magicamente all’uscita, anziché tornare al Centro più recente. Il risultato è stato dunque un improbabile suicidio di squadra, con il pubblico inchiodato allo schermo in un misto di terrore e ilarità.
Non tutto, però, lascia a desiderare. Gemini 2.5 Pro ha dimostrato prestazioni sorprendenti nei puzzle a massi lungo Via Vittoria. Grazie a strumenti creati con un minimo supporto umano, il modello ha risolto al primo colpo complessi ostacoli basati su leggi fisiche. Bastava una descrizione dei principi del movimento dei massi e un criterio per verificare la correttezza del percorso, e l’AI trovava la soluzione ottimale.
Il report sottolinea che Gemini ha quasi autonomamente sviluppato questi tool, aprendo scenari in cui futuri modelli potrebbero generare soluzioni senza alcun intervento esterno. Chissà, forse il prossimo aggiornamento includerà un modulo anti-panico, capace di "calmare" sé stesso nei momenti critici. In ogni caso, potete vedere le due intelligenze artificiali giocare in tempo reale ai link in basso. Vi anticipiamo che di sicuro l'AI è più brava a Minecraft.