Codifiche, Unicode sorpassa ASCII

Codifiche, Unicode sorpassa ASCII

Lo certifica Google: ora è la codifica più usata su Internet. Un successo annunciato e che migliora l'interoperabilità del web
Lo certifica Google: ora è la codifica più usata su Internet. Un successo annunciato e che migliora l'interoperabilità del web

È passato poco più di un mese dal rilascio della versione 5.1 di Unicode, e ora per il consorzio che sostiene lo standard per la codifica universale c’è un’altra buona notizia: secondo i dati diffusi da Google, uno dei principali sostenitori online del formato, Unicode è la codifica più spesso impostata per le pagine web analizzate del motore. Un primato che per il momento è risicato, ma che potrebbe presto diventare ben più consistente.

L'andamento delle codifiche sui siti web secondo Google “Proprio lo scorso dicembre è stata raggiunta una tappa importante nell’evoluzione del web – si legge sul blog ufficiale di Google – Per la prima volta abbiamo notato che la codifica più spesso adottata dalle pagine è Unicode, che per una curiosa coincidenza ha superato ASCII e Western European nell’arco di 10 giorni”. Da tempo Google adotta Unicode per i propri servizi, e anzi provvede a “tradurre” le pagine che i suoi crawler individuano e che presentano altre codifiche, prima di indicizzarle nei suoi database.

Da notare anche la velocità con la quale Unicode sta venendo gradualmente introdotta sui siti: la curva della crescita è molto ripida , e in pochi mesi si potrebbe osservare un notevole aumento nel numero di siti che adottano questa codifica.

ASCII e Western Europe sono dunque destinati all’oblio: nel primo caso la codifica prevede praticamente solo i caratteri dalla A alla Z senza neppure gli accenti, nel secondo ci sono gli accenti ma mancano glifi e ideogrammi. Unicode, invece, grazie alla sua natura, supporta i simboli e gli alfabeti delle lingue più disparate : coreano, cinese, giapponese, arabo, ma anche le lingue nordeuropee o il russo. In totale sono oltre 100mila i simboli catalogati da Unicode, e crescono ad ogni nuova release: solo nell’ultima ci sono stati 1.624 “nuovi ingressi”.

A dimostrazione dell’universalità di Unicode, c’è da registrare anche il calo di altre codifiche come quella cinese (GB2312) o giapponese (SJIS), entrambe riferite a lingue caratterizzate dall’uso di ideogrammi per la scrittura: ma la natura espandibile ed aggiornabile di Unicode, e del suo gemello Universal Character Set , fa sempre nuovi proseliti tra programmatori e webmaster, ben lieti di semplificarsi il lavoro e nel contempo rendere sempre più universale la fruizione del proprio lavoro.

Luca Annunziata

Link copiato negli appunti

Ti potrebbe interessare

Pubblicato il
7 mag 2008
Link copiato negli appunti