Alfonso Maruccia

Google: anche i nostri datacenter piangono

Mountain View spiega i motivi che hanno causato alcuni disservizi a febbraio. Sbagliando si impara: che l'esperienza di BigG sia tesoro per il web

Roma - Che cosa si nasconde dietro l'interruzione di servizi fondamentali per il web come quelli offerti dai capaci datacenter di Google? In seguito a una "degradazione" generale delle appliance basate sull'infrastruttura App Engine avvenuta lo scorso febbraio, Mountain View ha analizzato la situazione e offre ora un resoconto abbastanza dettagliato su cosa è andato male, cosa non doveva succedere, e sul perché l'efficienza di recupero delle macchine è ancora meno importante della capacità degli uomini (in questo caso i tecnici in loco) di reagire alle emergenze seguendo le procedure più indicate.

"Il 24 febbraio del 2010", scrive l'App Engine Team sul gruppo ufficiale, "tutte le applicazioni basate su Googe App Engine si sono trovate in un stato operativo variamente degradato per un periodo di due ore e venti minuti" fino alle 18:09 ora di Greenwich.

La causa fondamentale del problema è stata individuata in una temporanea interruzione di corrente nel data center primario di Google e, sebbene l'infrastruttura sia progettata per risollevarsi in fretta in occasioni del genere, la "rarità" del problema in combinazione con i problemi riscontrati nell'interpretare le procedure interne ha esteso il periodo di durata del malfunzionamento.
La "rarità" del problema consiste nel fatto che le procedure di spostamento e ripristino del carico di lavoro verso centri sostitutivi prevedono che si verifichi uno stato di "general failure" riguardante la stragrande maggioranza delle macchine, mentre nel caso specifico l'interruzione di corrente ha impattato soltanto sul 25 per cento dei server presenti nel data center.

In occasione di questo peculiare incidente, i tecnici del centro si sono trovati a fronteggiare una situazione nuova senza avere regole specifiche da seguire, il che ha portato a una analisi erronea della situazione che ha a sua volta esteso oltremisura il periodo di "downtime". Nel mezzo ci sono ovviamente capitati gli utenti, lesti a segnalare i problemi lato server, e costretti a subire la mancanza di coordinazione tra il personale più che l'ostracismo intransigente e capzioso dell'infrastruttura hardware.

Che fare, dunque, per evitare che capitino nuovi incidenti del genere? Google dice di aver approntato piani di ripristino in caso di fallimenti hardware parziali, oltre a nuove procedure di analisi che siano in grado di verificare se App Engine è in grado di funzionare lo stesso anche con una percentuale minoritaria di server offline.

Ma soprattutto, Mountain View ha messo in atto una pratica di "esercitazioni" regolari per lo staff messo di fronte a un ampio numero di necessità di intervento, senza dimenticare l'audizione bimestrale di tutti i documenti operativi. Grazie alla messa in atto delle nuove procedure, promette Google, l'incidente di febbraio sarebbe durato soltanto 20 minuti e avrebbe al massimo rallentato le applicazioni invece di mandarle tutte in crash.

Alfonso Maruccia
Notizie collegate
  • AttualitàCloud computing? Utenti poco informatiNel quadro del dibattito sulla banda larga nazionale la FCC ammonisce: attenzione a dare per scontata la consapevolezza degli utenti sui problemi delle nuvole telematiche
  • SicurezzaGoogle cade ancora dalle nuvoleMountain View lascia a piedi utenti e aziende per un'ora prima di ripristinare i vari servizi remoti. Il problema sarebbe dovuto a una procedura di routing sbagliata, ma le polemiche infuriano
23 Commenti alla Notizia Google: anche i nostri datacenter piangono
Ordina
  • Vedete? Siete proprio sicuri che sia una tecnologia senza problemi?
    E voi pensate che le aziende possano rimanere impallate per ore, con i dati chissà dove, in attesa che qualcuno lì fuori ripari qualcosa?
    Magari chiamando dei call-center creati a mò di "muro di gomma"?
    non+autenticato
  • e perchè? per un down di un paio d'ore all'anno?, quando può benissimo succedere altrettanto alla tua connessione internet, al tuo pc e a mille altre cose nella tua azienda, non mi dire che nella tua vita non ti è mai saltata la corrente per un paio d'ore?, sono eventi straordinari e nessun sistema al mondo è infallibile al 100%.
    non+autenticato
  • - Scritto da: M B
    > e perchè? per un down di un paio d'ore all'anno?,
    > quando può benissimo succedere altrettanto alla
    > tua connessione internet, al tuo pc e a mille
    > altre cose nella tua azienda, non mi dire che
    > nella tua vita non ti è mai saltata la corrente
    > per un paio d'ore?, sono eventi straordinari e
    > nessun sistema al mondo è infallibile al
    > 100%.

    e se capita proprio 5 minuti prima di quella riunione fondamentale?
    chi se ne frega se salta la corrente in azienda, ho il portatile, con dentro tutti i miei bei file.
    1977
    977
  • beato te...la mia batteria non regge la durata della riunione...che famo?
    non+autenticato
  • - Scritto da: the_lordo
    > beato te...la mia batteria non regge la durata
    > della riunione...che
    > famo?

    torniamo tutti assieme appassionatamente all'eta' della pietra. problema risolto
    1977
    977
  • che batteria hai ?
    Sgabbio
    26177
  • - Scritto da: 1977
    > - Scritto da: M B
    > > e perchè? per un down di un paio d'ore
    > all'anno?,
    > > quando può benissimo succedere altrettanto alla
    > > tua connessione internet, al tuo pc e a mille
    > > altre cose nella tua azienda, non mi dire che
    > > nella tua vita non ti è mai saltata la corrente
    > > per un paio d'ore?, sono eventi straordinari e
    > > nessun sistema al mondo è infallibile al
    > > 100%.
    >
    > e se capita proprio 5 minuti prima di quella
    > riunione
    > fondamentale?
    > chi se ne frega se salta la corrente in azienda,
    > ho il portatile, con dentro tutti i miei bei
    > file.

    Si si, conosco anch'io uno come te. Poi il suo notebook con tutti i file è sparito per ricomparire qualche mese dopo magicamente nelle mani della Guardia di Finanza.
    Morale della favola?
    Sei mesi di indagine coi finanzieri che giravano tra gli uffici e una bella multa da 6 milioni di euro pagata da un incazzatissimo titolare.
    non+autenticato
  • - Scritto da: cielle_fanc ul
    > - Scritto da: 1977
    > > - Scritto da: M B
    > > > e perchè? per un down di un paio d'ore
    > > all'anno?,
    > > > quando può benissimo succedere altrettanto
    > alla
    >
    > > > tua connessione internet, al tuo pc e a mille
    > > > altre cose nella tua azienda, non mi dire che
    > > > nella tua vita non ti è mai saltata la
    > corrente
    > > > per un paio d'ore?, sono eventi straordinari e
    > > > nessun sistema al mondo è infallibile al
    > > > 100%.
    > >
    > > e se capita proprio 5 minuti prima di quella
    > > riunione
    > > fondamentale?
    > > chi se ne frega se salta la corrente in azienda,
    > > ho il portatile, con dentro tutti i miei bei
    > > file.
    >
    > Si si, conosco anch'io uno come te. Poi il suo
    > notebook con tutti i file è sparito per
    > ricomparire qualche mese dopo magicamente nelle
    > mani della Guardia di
    > Finanza.
    > Morale della favola?
    > Sei mesi di indagine coi finanzieri che giravano
    > tra gli uffici e una bella multa da 6 milioni di
    > euro pagata da un incazzatissimo
    > titolare.

    Questa non l'ho proprio capita. Cosa c'entra con il cloud computing? Penso che a livello aziendale, sia intermini di sicurezza, sia i termini di disponibilita' e fruizione delle informazioni, la situazione attuale sia meglio del cloud computing, dove sei legato all'affidabilita' di chi ti fornisce il servizio.
    1977
    977
  • contenuto non disponibile
  • - Scritto da: cielle_fanc ul
    > Si si, conosco anch'io uno come te. Poi il suo
    > notebook con tutti i file è sparito per
    > ricomparire qualche mese dopo magicamente nelle
    > mani della Guardia di> Finanza.

    generalmente i notebook quando spariscono finiscono venduti nei mercatini.
    La GF non puˇ iniziare un indagine usando un computer che hanno ricettato.
    -----------------------------------------------------------
    Modificato dall' autore il 10 marzo 2010 13.28
    -----------------------------------------------------------
  • - Scritto da: cielle_fanc ul
    > Si si, conosco anch'io uno come te. Poi il suo
    > notebook con tutti i file è sparito per
    > ricomparire qualche mese dopo magicamente nelle
    > mani della Guardia di> Finanza.
    > Morale della favola?

    morale ?
    se era un'azienda ben organizzata la finanza non trova un bel niente.
    Anche senza tirare in ballo la crittografia esistono innumerevoli modi per imboscare i dati nei computer