Google ha presentato una nuova generazione di strumenti basati sull’AI durante il suo evento annuale per sviluppatori, Google I/O. Tra le novità spicca Veo 3, il primo modello dell’azienda in grado di generare video con audio sincronizzato, capace di ricreare scene complesse come una città trafficata con sottofondo realistico o un paesaggio naturale accompagnato dal canto degli uccelli. Ma le novità non finiscono qui: accanto a Veo 3, il colosso di Mountain View ha anche svelato Imagen 4, il suo più avanzato generatore di immagini.
Veo 3 rappresenta un significativo passo avanti rispetto ai modelli precedenti: oltre a gestire il suono in maniera coerente con le immagini, offre una maggiore precisione nella sincronizzazione labiale e una simulazione più realistica della fisica del mondo reale. Tuttavia, al momento è accessibile solo agli abbonati Gemini Ultra negli Stati Uniti tramite l'app Gemini e agli utenti aziendali su Vertex AI. Lo stesso vale per Flow, il nuovo strumento che combina le capacità di Veo, Imagen e Gemini in un'unica interfaccia per realizzare clip cinematografiche a partire da semplici descrizioni testuali.
Nonostante l’arrivo di Veo 3, Google non ha messo da parte la versione precedente. Veo 2 continua a essere supportato e permette agli utenti di utilizzare immagini di riferimento per costruire scene, controllare l’angolazione della telecamera, regolare lo zoom e modificare il formato del video da verticale a orizzontale. Si possono anche aggiungere o eliminare elementi visivi a piacimento, un'opzione utile per chi desidera maggiore flessibilità.
Parallelamente, Imagen 4 alza l’asticella della generazione di immagini, riuscendo a riprodurre con eccezionale nitidezza dettagli minuziosi come tessuti elaborati e pellicce. È in grado di generare immagini sia fotorealistiche che astratte in formati diversi, fino a una risoluzione massima di 2.000 pixel. Uno dei miglioramenti più apprezzabili è nella gestione della tipografia, ambito in cui i modelli precedenti mostravano ancora limiti. Imagen 4 è già disponibile tramite l'app Gemini, Vertex AI e all’interno delle applicazioni Workspace, come Docs e Slides. È prevista anche una versione ottimizzata, dieci volte più veloce di Imagen 3, in arrivo a breve.
Infine, Google ha introdotto il portale SynthID Detector. Questo servizio consente agli utenti di caricare media sospetti per verificarne l’origine: il sistema controlla se contiene SynthID, una tecnologia di watermarking invisibile che Google ha sviluppato e in parte reso open source. Tuttavia, non tutti i generatori di immagini adottano questa tecnologia, per cui il riconoscimento non è garantito su ogni contenuto.