OpenAI ha deciso di rafforzare il suo impegno verso gli sviluppatori con una serie di aggiornamenti pensati per potenziare la creazione di applicazioni basate su AI. Con l’annuncio più recente introduce miglioramenti importanti sia a Codex, l’agente di programmazione proprietario, sia agli strumenti per agenti vocali, offrendo nuove funzionalità e una maggiore flessibilità nella gestione dei flussi di lavoro.
Una delle novità principali riguarda Codex, che da oggi diventa accessibile anche agli utenti ChatGPT Plus, con limiti di utilizzo generosi, sebbene soggetti a restrizioni temporanee durante i picchi di richiesta. La svolta più interessante è la possibilità, ora attivabile, di connettere Codex a internet. Questo consente di installare dipendenze, aggiornare pacchetti, eseguire test online e molto altro ancora. La funzione è disattivata di default, ma può essere attivata in modo selettivo, con controllo sui domini accessibili. Attualmente è disponibile per gli utenti Plus, Pro e Teams, mentre sarà a breve disponibile anche per le aziende con piano Enterprise.
Codex compie anche un passo avanti sul fronte dell’usabilità quotidiana: ora può modificare pull request già esistenti, e ricevere comandi vocali dagli utenti, rendendo l’interazione ancora più naturale. Sono inoltre stati introdotti diversi miglioramenti tecnici. Tra i più rilevanti: il supporto ai file binari per operazioni come rinomina o eliminazione, messaggi di errore più chiari durante i setup, e un aumento del limite di confronto tra task da 1 a 5 megabyte. Anche i tempi massimi di esecuzione degli script di setup sono stati raddoppiati, passando da 5 a 10 minuti.
OpenAI ha inoltre rifinito l’esperienza GitHub e, dopo aver risolto alcuni problemi di notifica, ha riattivato le Live Activities su iOS. Da segnalare anche la rimozione dell’obbligo di autenticazione a due fattori per chi accede tramite SSO o login social, una semplificazione significativa per molti team.
Parallelamente, OpenAI ha reso disponibile una nuova versione del proprio Agents SDK, ora anche in TypeScript. Il pacchetto introduce funzionalità fondamentali per la creazione di agenti vocali sofisticati, come il controllo manuale dei passaggi (human-in-the-loop), la possibilità di sospendere l’esecuzione di strumenti, archiviare lo stato dell’agente, e approvare o rifiutare le azioni prima della ripresa.
Sul versante della voce, l’aggiornamento del modello speech-to-speech punta a migliorare la comprensione delle istruzioni, la coerenza nelle chiamate agli strumenti e la gestione delle interruzioni. Tra le nuove opzioni c’è anche la possibilità di regolare la velocità di parlato durante ogni sessione. Il modello aggiornato è accessibile attraverso le API Realtime e Chat Completions, rispettivamente con i tag gpt-4o-realtime-preview-2025-06-03 e gpt-4o-audio-preview-2025-06-03.
Infine, anche la dashboard Traces è stata potenziata e ora offre supporto per le sessioni Realtime API, con una visualizzazione completa dell’interazione vocale, compresi audio in entrata e uscita, chiamate agli strumenti e interruzioni.