Google ha annunciato una nuova tecnologia che permette di rilevare e bloccare lo spam in Gmail. Il sistema di classificazione del testo, denominato RETVec (Resilient & Efficient Text Vectorizer), sfrutta l’intelligenza artificiale per identificare i “caratteri spazzatura” usati dai cybercriminali per aggirare le protezioni tradizionali.
Nuovo filtro IA per Gmail
I filtri per le email di Gmail, così come quelli per i commenti di YouTube o le recensioni del Play Store, sfruttano diversi modelli di classificazione del testo per rilevare contenuti pericolosi, come phishing, commenti inappropriati e truffe. I cybercriminali cercando di aggirarli tramite tecniche di “adversarial text manipulation”, ad esempio usando omoglifi, caratteri invisibili e emoji.
Il nuovo sistema di classificazione del testo RETVec permette invece di migliorare la rilevazione dello spam del 38% e di ridurre i falsi positivi del 19,4%. Richiede inoltre meno risorse di calcolo, in quanto il modello è piuttosto piccolo (circa 200.000 parametri).
RETVec (il codice sorgente è su GitHub) è addestrato per riconoscere le manipolazioni a livello di carattere tra cui inserimento, cancellazione, errori di battitura, omoglifi e sostituzione LEET. Funziona con oltre 100 lingue senza la necessità di una lookup table o un vocabolario di dimensioni fisse.
Considerate le ridotte dimensioni e le poche risorse di calcolo necessarie, RETVec può funzionare sia server-side (come su Gmail) o direttamente sul dispositivo. Gli sviluppatori possono inoltre convertire il modello in TF Lite per mobile, mentre per le web app è disponibile un layer TensorflowJS. Google ha pubblicato una demo che usa RETVec per rilevare le emozioni in un messaggio di testo.