Gabriella Tesoro

Link mio, dopo un anno non ti conosco

Una ricerca ha analizzato dopo quanto tempo un link cessa di essere efficace. Il mondo del Web cambia velocemente e le URL cambiano, o muoiono, con lui

Roma - Chesapeake Digital Preservation Group ha documentato, negli ultimi cinque anni, la conservazione degli archivi online dei documenti pubblici dei suoi quattro membri: le biblioteche di Legge del Maryland e della Virginia e due biblioteche universitarie, la Georgetown Law e la Harvard Law School Libraries.

L'obiettivo della ricerca era comprendere quando i link diventino marcescenti, vale a dire se e in quanto tempo cessino di essere efficaci mancando nella capacità di dirigere alla risorsa cercata. Il Web offre un'ampio spazio di archiviazione e le informazioni possono essere spostate o copiate con grande facilità. Può capitare, dunque, che nel processo si "rompa" qualche link che rimane, letteralmente, a marcire nella Rete.

I ricercatori hanno preso in considerazione due campioni: il primo era composto da circa 600 documenti archiviati nel 2007 e nel 2008, per osservare le variazioni di anno in anno; il secondo consisteva in 800 pagine online nate tra il 2007 e il 2012, per analizzare un quadro più ampio. Lo studio ha evidenziato che 214 degli 800 documenti del secondo campione, vale a dire il 26 per cento, non erano più reperibili all'indirizzo orginario. La maggior parte degli URL nati nel 2012 era ancora validi, ma in generale i link cominciano a marcire a un anno dalla nascita. L'8 per cento dei link prodotti nel 2011 era inefficace. Nel complesso, il 38 per cento delle URL più vecchie è diventato inattivo nel 2012.

Per quanto accurata, non è chiaro se la ricerca possa essere significativa rispetto alla totalità di Internet: prende in considerazione solo una piccola parte dell'immensa quantità di dati che circola nella Rete. Tuttavia lo studio mostra in maniera evidente quanto il Web possa cambiare nel giro di pochi anni.
Gabriella Tesoro
Notizie collegate
2 Commenti alla Notizia Link mio, dopo un anno non ti conosco
Ordina
  • Che ci fa siti web si prenda la responsabilità di mantenere i link attivi o almeno che metta un redirect alla nuova pagina se la sposta, invece anche quando lo stesso sito che dovrebbe essere "professionale" è ancora attivo capita spessissimo di vedere che il link una volta spostata la pagina "muore" e basta e rimane un 404 o al limite un redirect alla pagina principale. Basta farsi un giro per le "recensioni esterne" su IMDB.com per rendersi conto di quanti siti che si definiscono professionali fanno questo.

    Un conto è se il sito chiude, ma se il sito rimane attivo è un altro paio di maniche; specialmente quando si tratta di recensioni e articoli simili, rimuovere la pagina e basta per aprirne una nuova ad un altro URL è sintomo di mancanza di professionalità e mancanza di serietà.
    non+autenticato
  • In primo luogo ci rimette il mantainer del sito stesso, siccome perde traffico.
    Il visitatore che trova il 404 non perde tempo a cercare la risorsa su quel sito, ma passa al risultato di ricerca successivo offerto da google.

    Io cerco di evitare sempre e comunque i 404, quando non c'è modo di ripescare una risorsa spostata con certezza, allora redirigo i 404 ad una pagina di ricerca che mostra i risultati ottenuti cercando le keyword che compongono il REQUEST_URI... al massimo poi, la pagina di ricerca in questione redirige poi a sua volta verso ilprimo risultato della ricerca, tutto con direttiva 301 e in modo trasparente al browser/crawler.