Il chatbot Grok di xAI, la società guidata da Elon Musk, è tornato sotto i riflettori per alcuni motivi imbarazzanti, parliamo di particolari "allucinazioni" che non sono passate inosservate. Per diverse ore, nella giornata di mercoledì, l’AI ha diffuso contenuti incentrati sulla teoria del “genocidio bianco” in Sudafrica, introducendo questo tema in risposte scollegate tra loro e, in alcuni casi, del tutto surreali.
Secondo quanto riferito dalla stessa xAI, alla base del comportamento anomalo c’è stata una “modifica non autorizzata” del prompt di sistema di Grok, ovvero l’insieme di istruzioni fondamentali che guidano le risposte del modello. La società ha precisato che tale intervento contraddiceva le politiche interne e i valori fondamentali del gruppo. In risposta, è stata avviata un’indagine interna che ha portato a una serie di contromisure. Ecco il post che conferma quanto scritto.
Tra le nuove azioni adottate spiccano la decisione di pubblicare su GitHub i prompt di sistema di Grok, per garantire maggiore trasparenza, l’istituzione di un team di monitoraggio attivo 24 ore su 24 e l’introduzione di restrizioni più severe che impediscano ai dipendenti di modificare i prompt senza una revisione approvata.
Ma cosa è successo nello specifico? L’episodio di mercoledì è stato caratterizzato da una serie di risposte assurde da parte di Grok: dalla menzione dei contadini bianchi sudafricani in risposta a un video di un gatto che beve, fino a improbabili riferimenti al brano “Kill the Boer” durante una conversazione su Spongebob. Il tono utilizzato, talvolta caricaturale, ha suscitato ulteriori perplessità. Persino Sam Altman, CEO di OpenAI e rivale diretto di xAI, ha ironizzato pubblicamente sullo scivolone del chatbot.
Non si tratta del primo caso in cui la responsabilità di un comportamento scorretto di Grok viene attribuita a un singolo individuo. Già a febbraio, xAI aveva accusato un ex dipendente proveniente da OpenAI di aver alterato i prompt per escludere contenuti critici nei confronti di Elon Musk e Donald Trump, senza che alcun responsabile interno ne fosse stato informato. Anche allora, le dichiarazioni ufficiali parlavano di “azioni non autorizzate” e di una vulnerabilità nel sistema di controllo interno.