Per oltre sei ore tutte le piattaforme dell’azienda di Menlo Park (Facebook, WhatsApp, Instagram, Messenger e Oculus) sono sparite da Internet. I tecnici hanno successivamente spiegato che il problema è stato causato da una modifica alla configurazione dei router che gestiscono il traffico tra i data center. Cloudflare ha fornito una spiegazione più dettagliata, indicando il protocollo BGP come principale “responsabile”.
Facebook ha incasinato i record BGP
Molti utenti utilizzano i servizi DNS offerti da Cloudflare e Google come alternativa a quelli del provider Internet. Durante il blackout di ieri è stato registrato un netto incremento del traffico verso i resolver 1.1.1.1. e 8.8.8.8, ma gli indirizzi IP non erano raggiungibili. In pratica, come ha sottolineato Cloudflare, è come se qualcuno avesse staccato i cavi da tutti i data center di Facebook.
Il problema non è stato causato dai server DNS, ma dall’errata configurazione delle tabelle di routing BGP (Border Gateway Protocol). Quest’ultimo può essere considerato il “servizio postale” di Internet. Mentre il DNS stabilisce dove andare, il BGP sceglie il percorso migliore per raggiungere la destinazione. Ciò avviene tramite lo scambio di informazioni tra i sistemi autonomi (i server di Facebook in questo caso). Se nelle tabelle di routing non ci sono gli indirizzi dei sistemi autonomi, il sito non è più raggiungibile.
In seguito all’errata modifica delle tabelle, Facebook si è auto-disconnesso da Internet. I DNS non potevano quindi risolvere i nomi di dominio perché l’indirizzo IP dei siti non esisteva. Ciò spiega inoltre il motivo per cui il dominio facebook.com era libero e disponibile per l’acquisto. Jack Dorsey (CEO di Twitter) ha chiesto anche il prezzo:
how much? https://t.co/fH0zXw7rV9
— jack (@jack) October 4, 2021