xAI, l'azienda di Elon Musk, ha appena alzato la posta in gioco con il lancio del suo ultimo modello di punta, Grok 4. Questo annuncio arriva in un momento delicato, nono solo per le recenti problematiche sui contenuti generati ma anche perché OpenAI si prepara a lanciare GPT-5, il cui rilascio è previsto entro la fine dell'estate.
Durante una presentazione in diretta, Musk non ha usato mezzi termini per descrivere le capacità del nuovo arrivato, affermando che "per quanto riguarda le questioni accademiche, Grok 4 è superiore al livello di un dottorato di ricerca in ogni materia, senza eccezioni". Ha poi aggiunto che, sebbene possa ancora mancare di senso comune e non abbia ancora scoperto nuove leggi della fisica, è solo una questione di tempo.
A sostegno di queste dichiarazioni audaci, xAI ha diffuso dati provenienti da diversi benchmark accademici. Su "Humanity's Last Exam", un test estremamente difficile che valuta la capacità dell'AI di rispondere a migliaia di domande su svariate materie, Grok 4 avrebbe ottenuto un punteggio del 25,4%, superando sia Gemini 2.5 Pro di Google (21,6%) sia o3 di OpenAI (21%).
Ancora più impressionante è il risultato ottenuto sul test ARC-AGI-2, che consiste in complessi puzzle visivi: qui Grok 4 ha segnato un 16,2%, quasi il doppio del punteggio del suo più vicino concorrente commerciale, Claude Opus 4.
Tuttavia, questo importante traguardo tecnologico si inserisce in un contesto piuttosto turbolento, come si diceva inizialmente. Il lancio è avvenuto pochi giorni dopo che l'account ufficiale e automatizzato di Grok su X ha pubblicato commenti antisemiti, elogiando Hitler e criticando i "dirigenti ebrei" di Hollywood. L'incidente ha costretto xAI a limitare temporaneamente l'account e a cancellare i post offensivi, rimuovendo apparentemente dalle istruzioni del sistema la parte che incoraggiava l'AI a non temere di fare affermazioni "politicamente scorrette". Come se non bastasse, la stessa settimana ha visto le dimissioni di Linda Yaccarino dalla carica di CEO di X dopo circa due anni, lasciando un vuoto di leadership ancora da colmare.
Oltre a Grok 4, l'azienda ha presentato anche Grok 4 Heavy, una versione "multi-agente" che, secondo Musk, affronta i problemi generando simultaneamente più "agenti" che lavorano al quesito per poi confrontare i loro risultati, agendo come una sorta di "gruppo di studio" per trovare la risposta migliore.
Per accedere in anteprima a questa versione potenziata e a nuove funzionalità, xAI ha introdotto un nuovo piano di abbonamento, SuperGrok Heavy, al costo di 300 dollari, circa 280 euro al mese. Questo posiziona l'offerta di xAI tra le più costose nel panorama dei grandi provider di AI come OpenAI, Google e Anthropic. L'azienda ha inoltre delineato una fitta tabella di marcia, con un modello per la programmazione previsto per agosto, un agente multimodale per settembre e un generatore di video per ottobre, segnalando la volontà di espandere rapidamente il proprio ecosistema.