Nella giornata di domenica gli utenti d’oltreoceano hanno dovuto fare i conti con un prolungato blackout che ha interessato diversi servizi Google: da YouTube a Drive, fino a Gmail. Un allarme rientrato nel giro di alcune ore. Oggi il gruppo di Mountain View torna sulla vicenda, spiegando le ragioni che hanno provocato il malfunzionamento, il suo impatto e le misure messe in campo per evitare che possa accadere nuovamente.
Google blackout: le cause
Il post condiviso da bigG sul blog ufficiale parla di ritardi che hanno interessato il motore di ricerca ed errori generati da alcune delle piattaforme gestite. La causa è da ricercare nella modifica apportata alla configurazione di alcuni server: anziché essere applicata a un numero ridotto di macchine localizzate in una singola regione è stata introdotta su più larga scala, andando ad abbattere per oltre la metà la capacità di gestire il traffico in ingresso e in uscita da parte di più data center. L’infrastruttura rimasta operativa si è così trovata a dover fare i conti con una mole di richieste non prevista, generando una congestione e di conseguenza i rallentamenti sperimentati.
È accaduto che i server hanno dato priorità alle richieste meno esigenti in termini di banda. Google lo spiega ricorrendo a un paragone: è come se avesse continuato a consegnare i pacchi più urgenti in bicicletta, percorrendo strade bloccate da un intasamento delle automobili. Gli ingegneri di Mountain View hanno identificato l’anomalia in pochi secondi, mentre la diagnosi del problema e la sua correzione hanno richiesto alcuni minuti, ristabilendo una situazione di normalità solo ore dopo. Lo stesso rallentamento che ha interessato l’utenza ha frenato anche l’intervento dei tecnici.
Durante il blackout le visualizzazioni di YouTube sono diminuite del 10% circa a livello globale, mentre il traffico sui servizi cloud per lo storage si è ridotto del 30%. Ancora, approssimativamente l’1% degli utenti Gmail ha incontrato un qualche tipo di malfunzionamento: una piccola quota, ma che considerando quanto la piattaforma sia adottata in tutto il mondo si traduce in milioni di persone impossibilitate a inviare o ricevere messaggi. Il motore di ricerca è invece stato oggetto solo di rallentamenti nella gestione delle query.
Il post sottolinea come Google sia ancora al lavoro per comprendere in ogni minimo dettagli la dinamica del problema, così come le ragioni dell’attesa prolungata perché tutto potesse tornare alla normalità. L’azienda si impegna inoltre a lavorare affinché episodi di questo tipo non si verifichino nuovamente. Questo il commento in chiusura.
Sappiamo che le persone di tutto il mondo fanno affidamento sui servizi di Google e negli anni si sono abituate ad aspettarsi che tutto funzioni sempre. Consideriamo molto seriamente questa aspettativa: è la nostra missione, la nostra ispirazione. Quando non la soddisfiamo, come domenica, ci motiva a imparare il più possibile e rendere ancora migliori i nostri servizi, più veloci e più affidabili.