Honor Magic V5 re delle traduzioni: velocità da cloud con la privacy di un modello locale

https://www.hdblog.it/smartphone/articoli/n630210/honor-ai-su-magic-v5-cosa-fa/

HDblog.it Sep 02, 2025 · 2 mins read
Honor Magic V5 re delle traduzioni: velocità da cloud con la privacy di un modello locale
Share this

Honor comunica di aver lanciato sul recentissimo pieghevole Magic V5 (qui la recensione) il suo primo modello linguistico vocale di grandi dimensioni on device. L'azienda ha conseguito progressi nel riconoscimento vocale in streaming a bassa latenza e nella distribuzione efficiente di modelli su larga scala. Due ricerche correlate hanno ricevuto premi a Interspeech 2025, conferenza mondiale sull’elaborazione del linguaggio parlato.

La nuova tecnologia di Honor affronta il dilemma tra privacy e prestazioni. Molte soluzioni di traduzione tradizionali si basano infatti sul cloud, il che genera problemi di privacy soprattutto nel caso di conversazioni sensibili. L'alternativa è la traduzione on device, che tuttavia può essere lenta o poco accurata a causa di limitazioni tecniche dei dispositivi. Honor, con Magic V5, promette un’esperienza del tutto simile a quella che si ottiene in cloud in termini di prestazioni ed efficacia ma con la privacy che può essere garantita solo dalle operazioni elaborate sul dispositivo.

Le soluzioni di Honor migliorano l’efficienza della memoria, riducendo l’ingombro da 3-4 GB a 800 MB, risparmiando il 75% della memoria: ciò avviene integrando sei pacchetti linguistici (cinese, inglese, tedesco, francese, spagnolo e italiano) ed eliminando la necessità di altrettanti download separati da 500 MB ciascuno, con un risparmio finale, dunque, di circa 2,78 GB. La tecnologia consente traduzioni in tempo reale “speak-as-you-go”, aumentando del 38% la velocità di elaborazione e del 16% l’accuratezza rispetto ai metodi tradizionali.

Interspeech 2025 convalida una ricerca innovativa. Il primo articolo - “MFLA: Monotonic Finite Look-ahead Attention for Streaming Speech Recognition” - affronta il riconoscimento vocale in streaming a bassa latenza e alta precisione sui dispositivi. Honor integra un sensore basato su CIF (Continuous Integrate-and-Fire) con la strategia Wait-k. Mentre le strategie Wait-k tradizionali sono limitate nel riconoscimento vocale automatico (ASR) a causa del parlato continuo e dei costi computazionali elevati, Honor introduce un predittore basato su CIF. Questo predittore mappa le caratteristiche acustiche continue alle decisioni di confine discrete della strategia Wait-k, adattando con successo questo approccio a bassa latenza dal testo al parlato.

Il secondo articolo - “Novel Parasitic Dual-Scale Modeling for Efficient and Accurate Multilingual Speech Translation” - supera i limiti dell’inferenza in tempo reale per discorsi di grandi dimensioni su dispositivi con risorse limitate. Introduce una strategia di accelerazione del campionamento speculativo a doppia scala, sviluppata con la Shanghai Jiao Tong University, che aumenta del 38% la velocità di inferenza senza compromettere le prestazioni, ed è implementabile su dispositivi edge.