A parlarne con una pubblicazione durante le difficili settimane di isolamento a cui l’Europa è stata costretta, è stato il portale CORDIS dell’UE, dal quale è emerso un progetto specifico per la gestione dei “megadati” su piattaforme cloud, specificatamente pensato per i centri di ricerca e la ricerca scientifica.
Il cloud dei big data
Si parla di grandi numeri, ed è esattamente questo il problema specifico: le dimensioni.
Alcuni rami della scienza producono enormi quantità di dati. Ad esempio, la fisica delle particelle e i laboratori di genomica generano ogni giorno circa un petabyte (PB) di dati. Un petabyte corrisponde a mille terabyte (1 milione di gigabyte), ovvero circa un quarto di milione di DVD. I circa 10 miliardi di foto archiviate su Facebook ammontano a circa 1,8 PB. La maggior parte delle organizzazioni di ricerca scientifica non è in grado di accogliere tali quantità utilizzando le proprie strutture e il problema sta peggiorando.
La soluzione identificata è nel cosiddetto Helix Nebula Science Cloud (HNSciCloud), piattaforma ibrida che mette assieme servizi cloud commerciali per dar vita ad una piattaforma che possa operare al servizio di 10 centri di ricerca europei e dei relativi dataset. Molteplici i campi di applicazione coinvolti: dall’astronomia alla fisica, fino agli studi su fotoni e neutroni.
Per raggiungere l’obiettivo si è indetta una gara europea nella quale sono stati selezionati quattro consorzi, tre dei quali sono passati alla successiva fase prototipale:
Le fasi prototipo e pilota hanno dimostrato con successo i vantaggi del modello di cloud ibrido e hanno dimostrato che le organizzazioni potrebbero superare in modo conveniente i limiti delle loro infrastrutture di elaborazione adottando servizi cloud commerciali specializzati. [il cloud ibrido] combina i servizi a livello di infrastruttura come servizio per fornire un ambiente a supporto dell’intero ciclo di vita dei flussi di lavoro scientifico.
Bob Jones, direttore del progetto Helix Nebula Science Cloud
Questi i consorzi che hanno partecipato fin dalla prima ora alla gara:
- T-Systems, Huawei, Cyfronet, Divia
- IBM
- RHEA Group, T-Systems, Exoscale, SixSq
- Indra, HPE, Advania, SixSq
Grazie a questo nuovo strumento, i centri di ricerca europei si trovano ora a disposizione una piattaforma comune di lavoro e di interscambio di dati, evitando che la quantità di dati gestiti possa diventare un collo di bottiglia insormontabile ponendo una grave limitazioni alle capacità dei ricercatori europei.