Facebook, AI per immagini accessibili

Facebook sta dispiegando la propria opera di ricerca sull’intelligenza artificiale per rendere il social network più accessibile, così da permettere anche a utenti ciechi ed ipovedenti di apprezzare il contenuto delle immagini caricate.

Così come Twitter, che di recente ha introdotto la possibilità di aggiungere delle descrizioni testuali alle immagini condivise, anche la soluzione di Facebook si affida al testo alternativo per le immagini, consolidato standard W3C: a differenza di Twitter, e della gran parte del Web, il social network genererà automaticamente le descrizioni da dare in pasto agli screen reader.

Facebook, che da tempo investe risorse nella ricerca in materia di reti neurali per il riconoscimento delle immagini, riferisce di aver impiegato 10 mesi per addestrare il sistema e affinarlo. Un aspetto fondamentale, spiega Facebook, è l’individuazione degli aspetti interessanti delle immagini da descrivere, correlati all’intenzione di colui che le ha condivise. Alla base della tecnologia c’è una rete neurale convolutiva per il riconoscimento delle immagini, che apprende sulla base di un’infinità di esempi e di un’infinità di parametri usati per descrivere le immagini. Facebook ha scelto di metterla all’opera su un centinaio di concetti , vale a dire oggetti e situazioni che ricorrono nelle immagini condivise dagli utenti, come ad esempio le caratteristiche fisiche delle persone, i cibi, i paesaggi, a loro volta caratterizzati da diversi attributi, anche metatestuali (ad esempio, il fatto che si tratti di un autoscatto).

Colti gli elementi chiave dell’immagine, il sistema di AI di Facebook procede a descriverli in linguaggio naturale : si è deciso di farlo concentrare in primo luogo sulle persone, con il numero dei visi rilevati e il loro atteggiamento, poi la presenza di oggetti e infine il contesto. Per non trasmettere la sensazione che la descrizione dell’immagine sia accurata come se la descrivesse un essere umano, la formula scelta da Facebook per il testo alternativo esordisce con una formula ricorrente: “L’immagine potrebbe contenere”.

Per il momento, le descrizioni delle immagini saranno disponibili in inglese negli USA, nel Regno Unito, in Canada, Australia e Nuova Zelanda, per dispositivi iOS e relativi screen reader. Facebook promette di estendere presto la funzione ad altre piattaforme, altre lingue e altri mercati.

Gaia Bottà

Annulla

Stai citando questo messaggio:

NaN undefined

La tua email sarà utilizzata per comunicarti se qualcuno risponde al tuo commento e non sarà pubblicata. Dichiari di avere preso visione e di accettare quanto previsto dalla informativa privacy.
Pubblicando questo commento dai il consenso affinché un cookie salvi i tuoi dati (nome, email, sito web) per il prossimo commento.

Iscrivimi alla newsletter gratuita di Punto Informatico Tutte le mattine direttamente nella tua casella email tutte le novità del mondo digitale e tech