La possibilità di concedere permessi così ampi ha spinto Anthropic a evidenziare i rischi legati alla sicurezza. Nella nota di lancio, la società ha spiegato di voler sfruttare questa fase di ricerca per identificare e mitigare minacce emergenti, in particolare gli attacchi di tipo prompt injection, in cui un sito web può nascondere istruzioni malevole capaci di manipolare l'agente. Proprio su questo fronte, la scorsa settimana il team di sicurezza di Brave aveva segnalato una vulnerabilità simile nel browser Comet di Perplexity.
Anthropic afferma di avere già introdotto difese specifiche che hanno ridotto il tasso di successo degli attacchi da oltre il 23% a poco più dell'11%. Inoltre, l'azienda ha impostato restrizioni di default che impediscono all'agente di accedere a siti di servizi finanziari, contenuti per adulti o materiale piratato, e ha previsto un sistema di autorizzazione esplicita per tutte le azioni considerate a rischio, come pubblicare contenuti, effettuare acquisti o condividere dati personali.
L'integrazione di agenti AI nei browser rappresenta un nuovo terreno di competizione tra i laboratori di intelligenza artificiale. Perplexity ha già lanciato Comet, un browser con un assistente integrato, mentre OpenAI sarebbe vicina a presentare un progetto simile, e Google ha introdotto negli ultimi mesi le prime funzioni basate su Gemini dentro Chrome.
Lo scenario è reso ancora più complesso dal procedimento antitrust che coinvolge Google, in cui un giudice federale potrebbe imporre la vendita di Chrome. Nel frattempo Perplexity ha presentato un'offerta non sollecitata da 34,5 miliardi di dollari per acquistarlo, mentre il CEO di OpenAI, Sam Altman, si è detto pronto a valutare un'operazione simile.
Quello presentato da Anthropic non è il primo tentativo di costruire un sistema capace di agire direttamente sui dispositivi degli utenti. Già nell'ottobre 2024 l'azienda aveva sperimentato un agente in grado di controllare il PC, ma i test ne avevano evidenziato lentezza e scarsa affidabilità. Da allora le capacità di questi sistemi si sono notevolmente evolute.
Gli agenti integrati nei browser più recenti, come Comet e ChatGPT Agent, oggi riescono a gestire con buona affidabilità attività semplici e ripetitive, pur mostrando ancora limiti nel trattare compiti complessi. Con Claude for Chrome, Anthropic punta a proseguire su questa traiettoria, verificando sul campo sia i potenziali benefici sia le criticità legate a un uso esteso di agenti AI all'interno del browser.