A un solo mese dall'annuncio sul palco del Google I/O 2025, la traduzione vocale in tempo reale di Google Meet è ufficialmente disponibile anche in Italia. Il rollout, sorprendentemente rapido per gli standard del settore, porta nel nostro Paese una delle novità più impressionanti annunciate durante la conferenza di maggio: la possibilità di tradurre istantaneamente la voce da inglese a italiano e viceversa, con un effetto realistico che conserva timbro, tono, inflessione ed emozione dell'interlocutore.
L'attivazione è iniziata il 12 giugno in occasione del Google Cloud Summit di Milano, ma la funzione è disponibile ovunque nel mondo per chiunque voglia comunicare tra inglese e italiano tramite Meet. Si tratta, a tutti gli effetti, di un sistema di "doppiaggio live", reso possibile grazie all'uso combinato dei modelli di intelligenza artificiale Gemini e del motore audio neurale AudioLM, sviluppato da Google DeepMind.
TRADUZIONE VOCALE SU GOOGLE MEETA differenza dei tradizionali sistemi di sottotitolazione automatica o trascrizione, la nuova funzione di Meet genera una vera e propria voce artificiale che riproduce fedelmente l'originale. Quando attivata, la tecnologia ascolta l'audio in entrata, traduce in tempo reale e restituisce la voce tradotta con caratteristiche vocali coerenti con quelle del parlante, creando un'esperienza naturale e coinvolgente. L'effetto è quello di un voice-over fluido, con un leggero sottofondo della voce originale per mantenere un riferimento umano.
Il tempo di latenza è minimo, paragonabile a una breve pausa di conversazione, e la qualità audio è tale da rendere la traduzione uno strumento pienamente integrato nelle dinamiche di dialogo. La funzione è attualmente disponibile per le combinazioni inglese-italiano e inglese-spagnolo, mentre il supporto per tedesco e portoghese arriverà entro l'estate. L'obiettivo è arrivare a decine di lingue entro il 2026.
COME ATTIVARE LA TRADUZIONE SIMULTANEAPer utilizzare la traduzione simultanea su Google Meet è necessario avviare una riunione, selezionare "Strumenti di riunione", quindi "Traduzione vocale", e scegliere le lingue da configurare. Una volta cliccato su "Abilita la traduzione per tutti", i partecipanti vedranno comparire un badge in alto a destra che indica la funzione attiva.
Per disattivarla, basta tornare negli strumenti di riunione e selezionare "Spegni la traduzione per tutti". L'attivazione iniziale richiede un consenso esplicito alla traduzione della propria voce, in linea con le regole di trattamento dei dati personali. Google specifica che la funzione può essere attivata solo dagli abbonati al piano Google AI Pro; una volta abilitata, però, tutti i partecipanti con accesso alla funzione possono utilizzarla.
DISTRIBUZIONE GRADUALE, GIÀ OPERATIVA PER UTENTI PROAttualmente, la traduzione vocale è disponibile esclusivamente per gli utenti iscritti ai piani a pagamento AI Pro (21,99 euro al mese dopo un mese gratuito) e AI Ultra (249,99 dollari al mese, al momento solo negli Stati Uniti). Il piano prevede un'espansione graduale, che coinvolgerà presto anche gli utenti Workspace aziendali, prima di raggiungere tutta la base consumer. Questa strategia serve non solo a ottimizzare le risorse, ma anche a raccogliere feedback reali in vista del lancio su larga scala.
Secondo Google, la funzione sarà particolarmente utile in ambito educativo, professionale e nei contesti internazionali, dove la possibilità di comprendere e farsi comprendere in tempo reale può fare la differenza in termini di produttività, collaborazione e inclusività. Il doppiaggio AI di Google Meet rappresenta infatti un'evoluzione sostanziale rispetto agli approcci testuali, capace di preservare l'intonazione emotiva e quindi la profondità della comunicazione umana.
Nonostante l'avanzamento tecnologico, la funzione non è esente da limiti. Google stessa segnala che la traduzione automatica potrebbe incorrere in errori grammaticali, cambi di genere nei sostantivi o accenti inaspettati. In particolare, modi di dire, metafore o riferimenti culturali rischiano di essere tradotti in modo letterale e inappropriato, perdendo il senso originario. Inoltre, la qualità della traduzione può essere influenzata da una rete instabile o da voci sovrapposte. Per questi motivi, Google sottolinea che la funzione, pur innovativa, non può sostituire del tutto la mediazione linguistica e culturale umana, soprattutto in ambiti sensibili come l'istruzione, il lavoro o la comunicazione legale.
Dal punto di vista della privacy, l'intero sistema è stato progettato per essere conforme al GDPR e al Digital Markets Act. L'elaborazione vocale avviene in modo trasparente, con crittografia end-to-end e controlli granulari sui consensi. Il rilascio in Italia è stato citato da Google come esempio di implementazione conforme alle regole europee, con un'attivazione più rapida rispetto ad altri mercati. Lo stesso CEO, Sundar Pichai, intervenuto all'I/O 2025, ha ribadito la centralità della collaborazione con le autorità europee, pur riconoscendo le difficoltà imposte da una regolamentazione stringente.
Tra le prossime tappe della roadmap figura l'integrazione con Gemini Live, l'assistente AI multimodale di Google, che rappresenterà un ulteriore salto qualitativo nella direzione di una comunicazione realmente universale. Oltre alla traduzione vocale, Gemini Live sarà infatti in grado di interpretare e tradurre in tempo reale anche elementi visivi condivisi durante una videochiamata, come presentazioni, immagini, grafici o documenti. Questo permetterà di abbattere non solo le barriere linguistiche, ma anche quelle legate alla comprensione contestuale dei contenuti, rendendo le interazioni più efficaci anche in ambiti complessi come la formazione, il lavoro o la consulenza specialistica.
L'obiettivo dichiarato da Google è quello di arrivare entro il 2026 a supportare decine di lingue, offrendo una piattaforma di comunicazione virtuale che sia non solo tecnicamente avanzata, ma anche realmente accessibile, naturale e inclusiva per persone di culture e background differenti.