Radar e vibrazioni: ecco come le telefonate possono essere intercettate a distanza

https://www.hdblog.it/smartphone/articoli/n629310/radar-vibrazioni-intercettazione-distanza/

HDblog.it Aug 25, 2025 · 4 mins read
Radar e vibrazioni: ecco come le telefonate possono essere intercettate a distanza
Share this

Non servono microspie né intercettazioni tradizionali: le vibrazioni impercettibili prodotte dalla capsula auricolare di uno smartphone possono bastare, se captate da un radar a onde millimetriche, per ricostruire tutta o parte di una conversazione telefonica. Lo ha dimostrato un gruppo di ricercatori della Penn State University, che ha sperimentato una nuova forma di sorveglianza a distanza definita "wireless-tapping". Utilizzando sensori radar piazzati fino a tre metri dal telefono e adattando un modello di riconoscimento vocale basato su intelligenza artificiale, i ricercatori sono riusciti a ottenere trascrizioni con un'accuratezza intorno al 60% su un vocabolario di 10.000 parole.

Lo studio, pubblicato negli atti della 18th ACM Conference on Security and Privacy in Wireless and Mobile Networks (WiSec 2025), amplia un lavoro avviato nel 2022, quando lo stesso team aveva dimostrato di poter identificare senza fili dieci parole, lettere e numeri predefiniti con un'accuratezza fino all'83%.

"Quando parliamo al telefono, tendiamo a ignorare le vibrazioni che provengono dall'auricolare e fanno vibrare l'intero dispositivo", ha spiegato Suryoday Basak, dottorando in informatica e primo autore della ricerca. "Se catturiamo queste stesse vibrazioni usando radar a distanza e sfruttiamo il machine learning per interpretare ciò che viene detto, con l'aiuto dei segnali contestuali possiamo arrivare a ricostruire intere conversazioni. Capendo ciò che è tecnicamente possibile, possiamo contribuire a rendere il pubblico più consapevole dei potenziali rischi".

LA TECNICA: RADAR MILLIMETRICI E MODELLI AI ADATTATI

Basak e il suo supervisore, Mahanth Gowda, professore associato di informatica e ingegneria e co-autore dello studio, hanno utilizzato un sensore radar a onde millimetriche, la stessa tecnologia impiegata nelle auto a guida autonoma, nei sistemi di rilevamento dei movimenti e nelle reti 5G. L'obiettivo era verificare la fattibilità di dispositivi compatti che in futuro potrebbero essere miniaturizzati fino a entrare in oggetti comuni, come una penna. I ricercatori hanno precisato che l'allestimento sperimentale è stato sviluppato esclusivamente a fini di ricerca, in previsione di ciò che attori malevoli potrebbero potenzialmente costruire.

Per trasformare le vibrazioni in trascrizioni, il team ha adattato "Whisper", un modello open-source di riconoscimento vocale su larga scala basato su intelligenza artificiale. "Negli ultimi tre anni si è registrata un'enorme esplosione nelle capacità dell'AI e nei modelli open-source di riconoscimento vocale", ha osservato Basak. "Possiamo sfruttare questi modelli, ma sono pensati più per la voce pulita o per casi d'uso quotidiani, quindi dobbiamo adattarli a riconoscere dati radar di bassa qualità e pieni di rumore".

DAI SEGNALI RUMOROSI AL TESTO

Per passare da dati rumorosi a parlato comprensibile senza riaddestrare l'intera rete, i ricercatori hanno applicato una tecnica di adattamento chiamata low-rank adaptation, che permette di specializzare il modello ai dati radar intervenendo solo sull'1% dei parametri di Whisper. In pratica, il sensore a onde millimetriche, posizionato a pochi piedi dal telefono, cattura le sottili vibrazioni della superficie del dispositivo mentre l'audio della chiamata viene riprodotto dall'auricolare. Il segnale così ottenuto viene poi elaborato dal modello personalizzato, producendo trascrizioni con un'accuratezza fino al 60%.

Secondo i ricercatori, l'accuratezza può aumentare ulteriormente in presenza di conoscenze pregresse sul contenuto della conversazione: correzioni manuali basate sul contesto, come la sostituzione mirata di parole o frasi, possono affinare la trascrizione. "Il risultato sono trascrizioni di conversazioni, con un margine di errore atteso, ma rappresentano un netto miglioramento rispetto alla versione del 2022, che restituiva solo poche parole", ha spiegato Gowda. "E anche l'individuazione parziale di parole chiave può essere utile in un contesto di sicurezza".

DAL LABIALE ALLA PRIVACY: COSA SIGNIFICA QUESTO STUDIO

Il gruppo ha paragonato il proprio metodo alla lettura del labiale. Quest'ultima permette di cogliere solo il 30-40% delle parole pronunciate, ma chi la pratica si affida ai segnali contestuali per ricostruire l'intero messaggio. "Così come chi legge il labiale riesce a interpretare una conversazione partendo da informazioni limitate, anche il nostro modello, combinato con il contesto, può consentire di inferire parti di una telefonata da qualche metro di distanza", ha sottolineato Basak.

"Lo scopo del nostro lavoro era esplorare se questi strumenti potessero essere usati da malintenzionati per ascoltare conversazioni telefoniche a distanza. I nostri risultati suggeriscono che questo è tecnicamente possibile in determinate condizioni, e speriamo che servano a sensibilizzare il pubblico a prestare maggiore attenzione durante le chiamate più delicate".

Lo studio, sostenuto dalla U.S. National Science Foundation, mette in evidenza come vibrazioni quasi impercettibili possano trasformarsi, se intercettate con strumenti avanzati, in informazioni sensibili. Una prospettiva che apre interrogativi non solo scientifici ma anche sociali e normativi.