"La magia oscura di Internet" che ha messo in ginocchio Facebook
Facebook e tutte le sue società e servizi affiliati sono improvvisamente scomparsi dal web lunedì, un'interruzione che è durata oltre cinque ore e ha impedito agli utenti di raggiungere i propri account FB, WhatsApp o Instagram. Presto si diffusero voci e teorie del complotto secondo cui il gigante dei social media era stato hackerato o che stava cercando di distrarre dai suoi imminenti guai al Congresso .
Bene, ora sappiamo il vero motivo: martedì la società ha rilasciato una dichiarazione che fornisce maggiori dettagli sull'interruzione e spiega che l'intero blackout globale è stato avviato da un "cambiamento di configurazione difettoso" emesso nel corso della manutenzione ordinaria. Quella configurazione errata ha accidentalmente spento la dorsale di Facebook, la rete distribuita a livello globale di cavi in fibra ottica responsabile del collegamento di tutti i data center dell'azienda in tutto il mondo. Pertanto, il tanto diffamato gigante dei social media è scomparso da Internet per la maggior parte della giornata, dando a tutti noi il tanto necessario riposo dalla sua presenza tossica.
Naturalmente, i dettagli di quello che è successo sono più complicati di così. Un aspetto particolarmente interessante dell'intera faccenda è il ruolo svolto da un protocollo di routing potente ma poco conosciuto chiamato Border Gateway Protocol o "BGP". È stato ampiamente ipotizzato dagli esperti del web, ed è ora confermato da Facebook, che BGP ha contribuito ad alimentare l'intero episodio. Quindi, sì. Che diavolo è BGP?
È stata chiamata la “colla” che tiene insieme la rete. Altri lo chiamano "ufficio postale" o "controllore del traffico aereo" di Internet. Quando Facebook è caduto dalla faccia della Terra lunedì, il CEO di Stripe Patrick Collison si è riferito a BGP come "la magia oscura di Internet", un meccanismo complesso "pienamente compreso da nessuno". In realtà, BGP ha una funzione semplice e di base, ma, per capirlo, devi considerare i tratti generali di come funziona effettivamente il web, il che è, ammettiamolo, piuttosto complicato.
In breve, BGP è uno dei tanti protocolli che aiutano a mettere ordine nel grande casino di reti interconnesse che compongono il web. Nello specifico, BGP aiuta a instradare il traffico da e verso le più grandi entità online, i cosiddetti " sistemi autonomi ". Un AS è fondamentalmente un'abbreviazione per una grande rete o un gruppo di reti: può essere un'università, un ISP, un'agenzia governativa o, tra le altre cose, una grande azienda tecnologica, come Facebook. I sistemi autonomi sono responsabili di mantenere le informazioni aggiornate sui percorsi web più veloci attraverso i quali i pacchetti di dati possono essere inviati da e verso la loro rete. Tali politiche vengono successivamente comunicate al Web più ampio (e quindi ad altre reti) utilizzando BGP. In questo senso, BGP abilita sostanzialmente il routing dei dati sul web.
È qui che entra in gioco la metafora dell' " ufficio postale" . BGP ha il compito di trovare e condividere i percorsi più efficienti per trasmettere i dati (come la posta) avanti e indietro da destinazioni specifiche. Altri ne hanno parlato come una mappa, che viene costantemente modificata e aggiornata, a seconda delle condizioni fluttuanti di Internet. In un'altra metafora ispirata, un'analisi della società di sicurezza Imperva confronta BGP con il sistema GPS della tua auto:
C'è molto di più che si potrebbe dire sul BGP, ma il racconto è questo: se un sistema autonomo non ha il suo BGP configurato correttamente, i dati non possono essere instradati in modo efficace da e verso la sua rete e, quindi, le persone possono' raggiungerlo. Apparentemente questo fa parte di quello che è successo a Facebook.
Storicamente parlando, le configurazioni errate di BGP sono note per causare "incidenti spettacolari di interruzioni diffuse", interrompendo l'accesso degli utenti ai servizi online. Facebook ha ora accettato il ruolo di BGP nei suoi giorni più merdosi, spiegando nel suo recente aggiornamento come il suo problema alla spina dorsale abbia contribuito all'abbattimento della sua "pubblicità" BGP, essenzialmente il meccanismo che segnala ad altre entità online che esiste sul web:
In particolare, la disattivazione degli annunci BGP di Facebook è stato solo un effetto collaterale di un errore più ampio e sistemico. Tuttavia, l'incidente illustra comunque il ruolo fondamentale del protocollo nella funzionalità web, ricordando anche altri episodi in cui l'incapacità o l'errata configurazione di BGP ha incasinato le cose su vasta scala.
"Nella nostra esperienza, questi di solito sono errori, non attacchi", ha affermato Usman Muzaffar, SVP, Engineering di Cloudflare, in una dichiarazione condivisa con Gizmodo lunedì, quando è stato interrogato sull'interruzione. Secondo gli esperti, tale interruzione non è un evento totalmente anomalo, sebbene le dimensioni e la durata dell'interruzione di Facebook siano notevoli. Cloudflare ha fatto la sua ripartizione su come BGP configurazione errata potrebbe aver giocato fuori.
"Non è così strano", ha affermato Jacob Hoffman-Andrews, tecnico senior dello staff presso la Electronic Frontier Foundation. "I grandi giganti della tecnologia hanno interruzioni come questa con una certa frequenza", ha detto, indicando un incidente BGP particolarmente noto nel 2008, quando le telecomunicazioni statali del Pakistan sono riuscite ad avviare accidentalmente YouTube da Internet cooptando il traffico destinato al video- piattaforma di condivisione Durante un episodio simile nel 2018, gran parte di Google è andata in tilt per circa un'ora dopo che un malfunzionamento di BGP ha instradato una grossa fetta di traffico web attraverso Russia, Cina e altre aree che non avrebbero dovuto essere.
Risposta breve: sì. Sicuramente sì. Se non per Facebook, BGP avrà quasi sicuramente un ruolo nell'inciampare su un'altra importante piattaforma che usi molto. Secondo gli esperti, questo non è motivo di allarme, ma è un buon esempio della natura fallimentare del web, che illustra quanto può essere abbattuto da qualcosa di semplice come un errore tecnico di un'azienda.
"Gli eventi di oggi sono un gentile promemoria del fatto che Internet è un sistema molto complesso e interdipendente di milioni di sistemi e protocolli che lavorano insieme", hanno affermato gli analisti di Cloudflare nel loro articolo sull'incidente. "La fiducia, la standardizzazione e la cooperazione tra le entità sono al centro del suo funzionamento per quasi cinque miliardi di utenti attivi in tutto il mondo".