Una ricerca che verrà presentata oggi al Congresso ForumPA ha misurato il contributo alla produzione di linked open data, ossia i dati accessibili, collegati e arricchibili da terzi, da parte del Parlamento italiano.
Gli Open Data e le istituzioni italiane
Ormai da tempo fa capolino nell’agenda digitale italiana, come già in quella in quella degli Stati Uniti ed in quella europea, l’idea di sfruttare le possibilità di riuso dei dati pubblici. Tuttavia mentre, per esempio, il governo britannico fin dal 2009 ha offerto ai cittadini la possibilità di un’informazione trasparente attraverso i Linked Open Data offerti sul sito data.gov.uk , il movimento per l’Open Government italiano ha avuto un impulso dal basso che però ha permesso allo Stivale di recuperare velocemente rispetto agli altri paesi .
Negli anni più recenti il tema “open data” è così venuto assumendo anche rilevanza politica, ed è stato pertanto oggetto di un forte interesse istituzionale sia presso il Senato che presso la Camera, tanto che diversi documenti ufficiali e rapporti riconoscono che i dati prodotti o raccolti per finalità pubblica in qualsiasi ambito e da chiunque – siano organizzazioni pubbliche o private, siano società o singoli individui – debbano essere resi disponibili all’accesso, alla condivisione e al riuso in modalità gratuita e senza vincoli di accesso a tutti i possibili interessati attraverso la rete Internet.
Secondo la legge italiana, ora, si definisce aperto il formato di dati reso pubblico, documentato esaustivamente e neutro rispetto agli strumenti tecnologici necessari per la fruizione dei dati stessi ( art. 68 comma 3 lett. a ) del Codice dell’Amministrazione Digitale).
Lo studio, condotto dal Centro Nexa su Internet & Società del Politecnico di Torino (DAUIN) in collaborazione con la Camera dei deputai ed il Senato della Repubblica e gestito tramite una Wiki ora accessibile , mette in luce come le istituzioni italiane stiano ben comportandosi su questo fronte, contribuendo sia in termini quantitativi che qualitativi.
Lo studio
Dal punto di vista qualitativo la ricerca impiega la scala delle cinque stelle strutturata da Tim Berners-Lee, con le sue precondizioni incrementali: la prima si ottiene semplicemente mettendo a disposizione i dati sul Web in qualsiasi formato con licenza aperta (per esempio immagini o PDF; la seconda strutturandoli in un formato “machine readable” (come Excel); la terza utilizzando simili formati ma non-proprietari o aperti (come per esempio CSV anziché Excel); la quarta si ottiene utilizzando gli standard del W3C (RDF e SPARQL) e URI (stabili) per identificare ogni cosa a cui i dati si riferiscono, così che altri possano creare puntatori ai relativi dati; la quinta, infine, si ottiene collegandoli ad altre dati per fornire un contesto (e si può parlare in questo caso di Linked Data).
Nel dettaglio lo studio conta – in termini numerici – oltre 500 milioni di “triple” RDF pubblicate dalla Camera dei deputati e oltre 30 milioni di triple pubblicate dal Senato della Repubblica, intendendo per tripla “un formalismo per rappresentare dati basato sul concetto di tripla RDF”, asserzioni – cioè – rappresentabili anche in forma di grafo, composte da soggetto, predicato e oggetto e collegate ad URI del modello W3C che identificano diverse risorse.
Lo studio nota infatti che Parlamento e Senato occupano una posizione di spicco non solo per la quantità di dati che oggi sono prodotti, ma anche per la scelta di utilizzare standard aperti del W3C (RDF e SPARQL) e con la contestualizzazione dei dati attraverso link verso altri dati in rete. Guadagnandosi, insomma, le cinque stelle di Berners-Lee.
A volte tali dati pubblici, nel loro complesso denominati “informazioni del settore pubblico” o, in inglese, “public sector information” (da cui l’acronimo “PSI”), sono generati direttamente come risultato dell’attività di un’amministrazione stessa: pensiamo ai dati cartografici, al catasto, alle informazioni meteorologiche, o all’archivio delle emittenti radio-televisive pubbliche. In altri casi, invece, essi sono acquisiti, organizzati e impiegati dall’amministrazione nell’adempimento dei propri obiettivi istituzionali, ma rappresentano un mezzo rispetto all’output principale – prodotto o servizio che sia. Informazioni che sono particolarmente importanti, e quindi necessarie e richieste, in ambito legislativo. Per quanto riguarda Parlamento e Senato si tratta in gran parte di dati legati alla Composizione del Parlamento, dei Gruppi e delle Commissioni, agli atti e processi normativi, alle votazioni, ai documenti non legislativi, le informazioni sui parlamenti e sulla relativa attività.
Nel concreto questi dati sono condivisi in RDF, XML, CSV, JSON o HTML, e sono alla base dei due portali di Camera e Senato, dati.camera.it e dati.senato.it , che costituiscono piattaforme di pubblicazione e condivisione di Linked Open Data rispettivamente dal 2011 e dal 2013 con licenza aperta CC-BY 3.0, che consente di condividere (riprodurre e distribuire i dati con qualsiasi mezzo e formato) e adattare (modificare, trasformare il materiale e basarsi su di esso per trarne altre opere) i dati per qualsiasi fine, anche commerciale, con l’unica condizione di attribuire la paternità alla fonte e indicare se sono state effettuate modifiche. Costituiscono l’unica eccezione a questa licenza alcuni dataset, quali quelli bibliografici pubblicati dalla Camera dei Deputati, che adottano la licenza CC-BY-SA 3.0, richiedendo di condividerli allo stesso modo.
obiettivi
Sfruttare al meglio i dati pubblici tramite l’impiego di formati aperti, secondo lo studio Nexa, è determinante per far guadagnare le istituzioni in fatto di efficienza, “grazie a una migliore rappresentazione informativa”, alla diffusione dei dati pubblici ed al loro potenziale utilizzo per imprese, app o servizi non considerati al momento della raccolta dei dati stessi, ma anche alla diffusione di conoscenze presso i cittadini: questo tipo di condivisione può contribuire alla trasparenza ed all’efficienza dell’attività parlamentare incoraggiando a sviluppare servizi per l’attività parlamentare ed approfondire determinati argomenti.
Claudio Tamburrino