Codifiche, Unicode sorpassa ASCII

È passato poco più di un mese dal rilascio della versione 5.1 di Unicode, e ora per il consorzio che sostiene lo standard per la codifica universale c’è un’altra buona notizia: secondo i dati diffusi da Google, uno dei principali sostenitori online del formato, Unicode è la codifica più spesso impostata per le pagine web analizzate del motore. Un primato che per il momento è risicato, ma che potrebbe presto diventare ben più consistente.

L'andamento delle codifiche sui siti web secondo Google “Proprio lo scorso dicembre è stata raggiunta una tappa importante nell’evoluzione del web – si legge sul blog ufficiale di Google – Per la prima volta abbiamo notato che la codifica più spesso adottata dalle pagine è Unicode, che per una curiosa coincidenza ha superato ASCII e Western European nell’arco di 10 giorni”. Da tempo Google adotta Unicode per i propri servizi, e anzi provvede a “tradurre” le pagine che i suoi crawler individuano e che presentano altre codifiche, prima di indicizzarle nei suoi database.

Da notare anche la velocità con la quale Unicode sta venendo gradualmente introdotta sui siti: la curva della crescita è molto ripida , e in pochi mesi si potrebbe osservare un notevole aumento nel numero di siti che adottano questa codifica.

ASCII e Western Europe sono dunque destinati all’oblio: nel primo caso la codifica prevede praticamente solo i caratteri dalla A alla Z senza neppure gli accenti, nel secondo ci sono gli accenti ma mancano glifi e ideogrammi. Unicode, invece, grazie alla sua natura, supporta i simboli e gli alfabeti delle lingue più disparate : coreano, cinese, giapponese, arabo, ma anche le lingue nordeuropee o il russo. In totale sono oltre 100mila i simboli catalogati da Unicode, e crescono ad ogni nuova release: solo nell’ultima ci sono stati 1.624 “nuovi ingressi”.

A dimostrazione dell’universalità di Unicode, c’è da registrare anche il calo di altre codifiche come quella cinese (GB2312) o giapponese (SJIS), entrambe riferite a lingue caratterizzate dall’uso di ideogrammi per la scrittura: ma la natura espandibile ed aggiornabile di Unicode, e del suo gemello Universal Character Set , fa sempre nuovi proseliti tra programmatori e webmaster, ben lieti di semplificarsi il lavoro e nel contempo rendere sempre più universale la fruizione del proprio lavoro.

Luca Annunziata

Annulla

Stai citando questo messaggio:

La tua email sarà utilizzata per comunicarti se qualcuno risponde al tuo commento e non sarà pubblicata. Dichiari di avere preso visione e di accettare quanto previsto dalla informativa privacy.
Pubblicando questo commento dai il consenso affinché un cookie salvi i tuoi dati (nome, email, sito web) per il prossimo commento.

Iscrivimi alla newsletter gratuita di Punto Informatico Tutte le mattine direttamente nella tua casella email tutte le novità del mondo digitale e tech