Alfonso Maruccia

Amazon S3, il cloud sconfitto da un errore umano

La corporation di Seattle spiega le ragioni del tracollo di una delle piattaforme cloud più popolari al mondo, imputando il disastro a un errore umano. In futuro non accadrà più, promette Amazon

Roma - I disservizi della piattaforma Amazon S3 (Simple Storage Service) sono durati quasi cinque ore, hanno buttato giù un numero enorme di servizi, "app" e siti Web e hanno messo per l'ennesima volta in luce le debolezze strutturali del concetto di "always-on" su cui si basa il cloud computing. Stando a quanto spiega ora la corporation, però, l'origine del problema non è da ricercare nel cloud in quanto tale, bensì in un più prosaico errore umano.

Nel post-mortem dedicato all'interruzione di servizio nel data center della regione del Nord Virginia (US-EAST-1), Amazon imputa l'origine del problema a un team di tecnici impegnato nel debugging di un problema all'interno del sistema di fatturazione della piattaforma S3; una piccola porzione di server andava messa off-line, ma il comando inserito dai tecnici era incorretto ed è finito offline un numero di server superiore al previsto.

I server rimossi dalla rete giocavano a loro volta un ruolo di supporto per due altri sottosistemi S3, spiega ancora Amazon, e uno di questi era responsabile della gestione dei metadati e delle le informazioni di localizzazione di tutti gli "oggetti" S3 attivi nella regione. Una reazione a catena ha portato quindi al malfunzionamento dei servizi Web dipendenti dalla piattaforma, impossibilitati a richiamare i dati registrati sui server e ad eseguire task di base sullo storage.
I sistemi coinvolti hanno quindi dovuto eseguire un riavvio completo, e a quanto pare portare a compimento tale processo ha richiesto un tempo notevole; a peggiorare le cose c'è stata l'indisponibilità di altri servizi cloud di Amazon dipendenti da S3, inclusi EC2 e l'imbarazzante "luce verde" della Dashboard di AWS mentre in giro i siti Web morivano a milioni.

Chiedendo scusa per il disservizio e promettendo miglioramenti futuri, Amazon dice di aver imparato dai propri errori approntando meccanismi di salvaguardia aggiuntivi: la rimozione dei server S3 in caso di interventi tecnici sarà meno repentina, mentre la Dashboard di controllo sarà isolata rispetto al resto della piattaforma.

Alfonso Maruccia
Notizie collegate
35 Commenti alla Notizia Amazon S3, il cloud sconfitto da un errore umano
Ordina
  • Poveretti gli amministratori, ci fosse stata una GUI moderna questo non sarebbe successo Arrabbiato.
    non+autenticato
  • Qui invece abbiamo un parser che ha sputtanato 150 milioni di account:

    https://blog.cloudflare.com/incident-report-on-mem.../

    P.S.: alla fine l' errore è sempre umano.
    non+autenticato
  • L'appiattimento globalizzato, chiamato anche standardizzazione + globalizzazione, è una grande trovata per rendere più efficente ogni cosa e per garantire meno conflitti in ogni settore relazionale.

    Ma non tiene conto di due fattori, principalmente per assenza di una visione... globale, paradossalmente:

    - l'uomo è un animale tutt'altro che efficiente, questo è un mito (su cui ci marciano quelli che comandano) tipico di questo periodo storico;

    - la sparizione della diversità (anche della bio-diversità) espone la civiltà a danni colossali provocati da eventi anche minimi in sé ma che si ripercuotono indisturbati grazie alla globalizzazione, crescendo a valanga.
    non+autenticato
  • Si ma tutti i tentativi di standardizzare ed estremizzare l'efficienza portati sull'uomo e la natura falliscono miseramente.

    Basti pensare a pazzi furiosi come questo Ray Dalio che vogliono creare lavoratori-macchine inibendogli farmacologicamente l'amigdala.

    http://overthedoors.it/in-evidenza/vietato-amare-c.../

    Ed invece riguardo agli OGM ecco il riscatto della natura, proprio dalla pianta degli dei cara agli antichi Inca ed Aztechi.

    https://www.greenme.it/informarsi/agricoltura/1044...

    Tra l'altro ti consiglio l'amaranto col quale ci si può fare pane, pasta, hamburger vegetariani ed altri prodotti salutari.
    iRoby
    9147
  • - Scritto da: iRoby
    > Si ma tutti i tentativi di standardizzare ed
    > estremizzare l'efficienza portati sull'uomo e la
    > natura falliscono
    > miseramente.
    >
    > Basti pensare a pazzi furiosi come questo Ray
    > Dalio che vogliono creare lavoratori-macchine
    > inibendogli farmacologicamente
    > l'amigdala.
    >
    > http://overthedoors.it/in-evidenza/vietato-amare-c
    >
    > Ed invece riguardo agli OGM ecco il riscatto
    > della natura, proprio dalla pianta degli dei cara
    > agli antichi Inca ed
    > Aztechi.
    >
    > https://www.greenme.it/informarsi/agricoltura/1044
    >
    > Tra l'altro ti consiglio l'amaranto col quale ci
    > si può fare pane, pasta, hamburger vegetariani ed
    > altri prodotti
    > salutari.

    Complottismo + propaganda vegana.
  • - Scritto da: merlano
    > L'appiattimento globalizzato, chiamato anche
    > standardizzazione + globalizzazione, è una grande
    > trovata per rendere più efficente ogni cosa e per
    > garantire meno conflitti in ogni settore
    > relazionale.

    Cazzate! Viviamo in un' epoca pericolosissima, stracolma di conflitti, con intere nazioni disposte alla deriva nazionalista. L' apparato globalizzato, come lo chiami tu, vuole soltanto i SOLDI, la gente lo sa e si incazza nera, altro che "garantire meno conflitti in ogni settore relazionale".

    >
    > Ma non tiene conto di due fattori, principalmente
    > per assenza di una visione... globale,
    > paradossalmente:
    >
    > - l'uomo è un animale tutt'altro che efficiente,
    > questo è un mito (su cui ci marciano quelli che
    > comandano) tipico di questo periodo
    > storico;

    TU sei inefficiente, vai a fare il manovale in Cina poi ne riparliamo. Comunque se vuoi farci qualche esempio di essere vivente più efficiente dell' essere umano accomodati pure.

    >
    > - la sparizione della diversità (anche della
    > bio-diversità) espone la civiltà a danni
    > colossali provocati da eventi anche minimi in sé
    > ma che si ripercuotono indisturbati grazie alla
    > globalizzazione, crescendo a
    > valanga.

    Che pizza di commento.
    non+autenticato
  • IMVHO la globalizzazione non c'entra un tubo, si può benissimo avere una rete globale, distribuita, con standard comuni ma apparati, sw, sotto-reti diverse (hint: internet) e non sono quasi possibili grandi problemi, al contrario si può anche concentrare tutto su una piattaforma, un sistema unico ecc e li quando c'è un problema son tutti messi male.

    Essere globali non vuol dire vestirsi tutti allo stesso modo, esser tutti cloni, esser superuguali ecc. Questa è la *zata che va di moda oggi per ripristinare un lock-in ancora più forte verso l'utente: un tempo il ferro consumer era chiuso e proprietario, poi le soluzioni open han cominciato a diffondersi in massa e questo non piaceva ad alcuni, ecco la soluzione: fai esplodere il mobile (che rispetto al PC è una scatola ben più chiusa e lucchettata ed essendo una novità la gente prende le sue caratteristiche come un dato di fatto), spingi il cloud così l'utente può anche usare client open ma tanto i suoi dati ed i servizi che vuole sono in mano tua. Il problema non è tecnologico né teorico, è una mera scelta politica. Che "la massa" non ha ancora granché capito e capirà tardi, spero non troppo.
    non+autenticato
  • Più o meno ciò che J. Rifkin descrive in "L'era dell'accesso" (per noi inforNatici: i web terminals, il PC-non-PC).
    Ed il motivo per cui, con tanti saluti al cloud, mi tengo tutto in LAN (backup compresi, ovviamente) ed in WAN ci va solo una replica di ciò che penso possa esser pubblico.
    885
  • Discordo, è una scelta commerciale.
    non+autenticato
  • Quello che mi sorprende in queste cose è che per l'azienda basta un: scusa, scusa, aggiustiamo tutto, e la responsabilità per i danni che ti abbiamo causato è tua.
    Anche quelle cacche di cloudflare se la cavano così.
    Niente denunce, niente guai legali, silenzio assoluto delle istituzioni.
    Bella società civile.
    non+autenticato
  • - Scritto da: fetuso
    > Quello che mi sorprende in queste cose è che per
    > l'azienda basta un: scusa, scusa, aggiustiamo
    > tutto, e la responsabilità per i danni che ti
    > abbiamo causato è
    > tua.
    > Anche quelle cacche di cloudflare se la cavano
    > così.
    > Niente denunce, niente guai legali, silenzio
    > assoluto delle
    > istituzioni.
    > Bella società civile.

    E ci mancherebbe altro!
    Se tu decidi di mettere i tuoi dati nel computer di qualcun altro che cosa pretendi?

    L'unica cosa che ti garantiscono, nel caso in cui i tuoi dati vengano persi, e' quella di non divulgare in giro che quei dati erano tuoi, cosi' ti limiti solo ad aver perso i dati, e ti risparmi la figura del coglione che ha affidato i suoi dati ad altri.
  • Però rimane coglione, in quanto con 140 euro ti prendi 2 hd usb3 da 2Tb wd/toshiba\... e li tieni sincronizzati. hai accesso istantaneo ai propri dati che rimangono in mano propria e ti sono disponibili in qualsiasi monmento senza chiedere il permesso ad alcuno di poter usare i propri dati...
    non+autenticato
  • Quando ti registri al servizio, metti una spunta tramite la quale accetti i termini del servizio. Nessuno legge il testo completo, scritto in avvocatese, ma in quel testo c'è scritto che loro si lavano le mani in casi come questo.
    non+autenticato
  • Parlavo proprio di questo quando ho scritto: "Niente denunce, niente guai legali, silenzio assoluto delle istituzioni. Bella società civile."
    Intendevo che una cosa ormai strategica per il funzionamento delle società civili come il cloud (volenti o nolenti), è lasciata alle clausole vessatorie delle società commerciali e a pratiche fumose di protezione dei dati.
    Si salvano le banche con i soldi dei cittadini perché "troppo grandi per fallire" (naturalmente nessuno parla della mancata prevenzione), mentre siamo di nuovo daccapo con l'assenza di responsabilità su qualcosa che un domani, a causa di intervento umano malevolo (anche tramite una AI malevola) o inetto, potrebbe portare ad un disastro planetario.
    non+autenticato
  • Quando le istituzioni non sono interessate al problema, allora il problema si risolve personalmente. Le istituzione erano fuori e rimangoni fuori per loro volontà. Il problema me lo devo risolvere da solo e me lo risolvo personalmente.
    non+autenticato
  • Per quanto riguarda il "disastro planetario" non le so dire, ma per gli incidenti locali (fuoco, terremoti, boeing-747 che cascano sul CED) le banche sono obbligate ad ottemperare alla Disaster Recovery (https://it.wikipedia.org/wiki/Disaster_recovery) con continuità operativa nei limiti del tipo di disastro: ogni giorno vengono spediti backup in località remote rispetto al CED ed esistono contratti per un ripristino in breve tempo (tipo il giorno dopo, non credo 5 ore in caso di terremoto/fuoco/incidente aereo).

    Poi se vogliamo tirare in ballo Skynet è un altro paio di maniche, però bisognerebbe portare anche un minimo di prove, perchè le aziende non spendono sulle ipotesi un pò troppo ipotetiche.
    885
  • Venghino siore e siori venghino.
    Paghino per mettere i vostri dati nei computer altrui, gestiti da incompetenti pagati a vaucher.
    Tanto se i vostri dati si perdono o se il sistema che li ospita si blocca chissenefrega.
    L'importante e' pagare e poi vantarsi di avere i dati sul cloud.
  • se li metto invece in un pennino la situazione migliora di molto ?
    non+autenticato
  • - Scritto da: pink
    > se li metto invece in un pennino la situazione
    > migliora di molto
    > ?

    Migliora moltissimo.
    Intanto i dati sono in mano tua e non in mano altrui.
    E poi il pennino non lo paghi un tot al mese.

    Quindi e' sicuramente meglio del cloud.
  • Soprattutto non è accessibile da cani e porci in caso di bug, resta confinato nel tuo taschino.
    non+autenticato
  • - Scritto da: ...
    > Soprattutto non è accessibile da cani e porci in
    > caso di bug, resta confinato nel tuo taschino.
    Concordo, utilissimo se:
    1) lo perdi;
    2) si becca una carica di statica;
    3) devi condividere il lavoro con altri;
    4) te lo scordi nei pantaloni e li mandi a lavare;
    ecc. ecc.
    Ah, già, dimenticavo, il vostro lavoro e passare il tempo qui a trollare
    non+autenticato
CONTINUA A LEGGERE I COMMENTI
1 | 2 | 3 | Successiva
(pagina 1/3 - 11 discussioni)