Al pari di quanto fatto da numerose altre aziende tech, anche Mozilla sta cercando di implementare il più possibile l’intelligenza artificiale nel suo browser Firefox, in special modo per offrire una migliore accessibilità.
Firefox con didascalie di immagini generate dall’IA
In un post su Mozilla Hacks condiviso nelle scorse ore, Tarek ZIade ha per l’appunto spiegato come Firefox sfrutterà l’intelligenza artificiale per migliorare l’accessibilità, offrendo didascalie di immagini generate dall’IA per le persone che si affidano a tecnologie assistive.
Le didascalie delle immagini o “testo alternativo” forniscono il contesto necessario ai lettori, ma purtroppo viene spesso ignorato il testo alternativo, con il risultato che quasi la metà di tutte le immagini mancano di descrizioni adeguate. Con gli ultimi progressi dell’IA, invece, diventa possibile eseguire un modello di apprendimento automatico locale per generare automaticamente didascalie senza inviare informazioni potenzialmente sensibili ai server.
Alla luce di ciò, la relase 130 di Firefox verrà rilasciata nel Nightly Channel con una nuova funzionalità per l’editor PDF che genererà testo alternativo utilizzando piccoli modelli di apprendimento automatico basati su Transformer. Mozilla dichiara che la funzione non richiederà un particolare impegno di risorse, pertanto dovrebbe essere fruibile senza il benché minimo problema anche sui device meno potenti.
Secondo il post, inoltre, i piccoli modelli possono generare testo alternativo con oltre 200 milioni di parametri, occupando meno di 200 MB di spazio su disco e fornendo l’output in pochi secondi.
Ci sono diversi vantaggi nell’usare un modello locale. Oltre a una migliore privacy, gli utenti ottengono una migliore efficienza delle risorse, più trasparenza, meno emissioni di CO2 e aggiornamenti con cadenza più frequenze e con miglioramenti di volta in volta.