'La magia oscura de Internet' que puso a Facebook de rodillas

Oct 06 2021
Facebook y todas sus empresas y servicios afiliados desaparecieron repentinamente de la web el lunes, una interrupción que duró más de cinco horas y dejó a los usuarios sin acceso a sus cuentas de Facebook, WhatsApp o Instagram. Pronto se difundieron rumores y teorías de conspiración de que el gigante de las redes sociales había sido pirateado o de que estaba tratando de distraerse de sus inminentes problemas en el Congreso.

Facebook y todas sus empresas y servicios afiliados desaparecieron repentinamente de la web el lunes, una interrupción que duró más de cinco horas y dejó a los usuarios sin acceso a sus cuentas de Facebook , WhatsApp o Instagram. Pronto se difundieron rumores y teorías de conspiración de que el gigante de las redes sociales había sido pirateado o de que estaba tratando de distraerse de sus inminentes problemas en el Congreso .

Bueno, ahora sabemos la verdadera razón: el martes, la compañía emitió una declaración en la que proporcionaba más detalles sobre la interrupción y explicaba que todo el apagón global se inició con un "cambio de configuración defectuoso" emitido en el curso del mantenimiento de rutina. Esa mala configuración cerró accidentalmente la red troncal de Facebook, la red distribuida globalmente de cables de fibra óptica responsable de conectar todos los centros de datos de la compañía en todo el mundo. Por lo tanto, el muy difamado gigante de las redes sociales desapareció de Internet durante la mayor parte del día, dándonos a todos un descanso muy necesario de su presencia tóxica.

Por supuesto, los detalles de lo que sucedió son más complicados que eso. Un aspecto particularmente interesante de todo esto es el papel que desempeña un protocolo de enrutamiento poderoso pero poco conocido llamado Border Gateway Protocol o "BGP". Los expertos web especularon ampliamente, y ahora Facebook lo confirma, que BGP ayudó a impulsar todo el episodio. Así que sí. ¿Qué diablos es BGP?

Se le ha llamado el "pegamento" que mantiene unida la telaraña. Otros se refieren a ella como la "oficina de correos" de Internet o el "controlador de tráfico aéreo". Cuando Facebook se desprendió de la faz de la Tierra el lunes, el director ejecutivo de Stripe, Patrick Collison, se refirió a BGP como "la magia oscura de Internet", un mecanismo complejo que "nadie comprende completamente". En realidad, BGP tiene una función básica y sencilla, pero, para entenderlo, debe considerar los trazos generales de cómo funciona realmente la web, que es, sin duda, bastante complicado.

En resumen, BGP es uno de los muchos protocolos que ayudan a poner orden en el gran lío de redes entrelazadas que componen la web. Específicamente, BGP ayuda a enrutar el tráfico hacia y desde las entidades en línea más grandes, lo que se denomina " sistemas autónomos ". Un AS es básicamente la abreviatura de una gran red o grupo de redes: puede ser una universidad, un ISP, una agencia gubernamental o, entre muchas otras cosas, una gran empresa de tecnología, como Facebook. Los sistemas autónomos son responsables de mantener actualizada la información sobre las rutas web más rápidas mediante las cuales se pueden enviar paquetes de datos hacia y desde su red. Posteriormente, esas políticas se comunican a la red en general (y, por lo tanto, a otras redes) mediante BGP. En este sentido, BGP básicamente permite el enrutamiento de datos en la web.

Aquí es donde entra en juego la metáfora de la " oficina postal" . BGP se encarga de encontrar y compartir las rutas más eficientes para transmitir datos (como el correo) de ida y vuelta desde destinos específicos. Otros han hablado de él como un mapa, uno que se cambia y actualiza constantemente, dependiendo de las condiciones fluctuantes de Internet. En otra metáfora inspirada, un análisis de la firma de seguridad Imperva compara BGP con el sistema GPS de su automóvil:

Se podría decir mucho más sobre BGP, pero la historia corta es la siguiente: si un sistema autónomo no tiene su BGP configurado correctamente, los datos no se pueden enrutar de manera efectiva hacia y desde su red y, por lo tanto, las personas pueden ' t alcanzarlo. Aparentemente, esto es parte de lo que le sucedió a Facebook.

Históricamente, las configuraciones incorrectas de BGP son conocidas por causar "incidentes espectaculares de interrupciones generalizadas", que cortan el acceso de los usuarios a los servicios en línea. Facebook ahora ha aceptado el papel de BGP en sus días de mierda más de mierda, explicando en su reciente actualización cómo su problema de la columna vertebral contribuyó al derribo de su "anuncio" de BGP, esencialmente el mecanismo que señala a otras entidades en línea que existe en la web:

En particular, la desactivación de los anuncios BGP de Facebook fue solo un efecto secundario de un error más grande y sistémico. Sin embargo, el incidente ilustra el papel fundamental del protocolo en la funcionalidad web, al tiempo que recuerda otros episodios en los que la incapacidad o la mala configuración de BGP arruinaron las cosas a gran escala.

"En nuestra experiencia, estos generalmente son errores, no ataques", dijo Usman Muzaffar, vicepresidente senior de ingeniería de Cloudflare, en un comunicado compartido con Gizmodo el lunes, cuando se le preguntó sobre la interrupción. Según los expertos, tal interrupción no es un evento totalmente anómalo, aunque el tamaño y la duración de la interrupción de Facebook son notables. Cloudflare ha hecho su propio desglose sobre cómo podría haberse producido la mala configuración de BGP.

“No es tan extraño”, dijo Jacob Hoffman-Andrews, tecnólogo senior de la Electronic Frontier Foundation. "Los grandes gigantes tecnológicos tienen cortes como este con cierta frecuencia", dijo, señalando un incidente de BGP particularmente notorio en 2008 cuando las telecomunicaciones estatales de Pakistán lograron arrancar accidentalmente a YouTube de Internet al apropiarse del tráfico destinado al video. plataforma de intercambio. Durante un episodio similar en 2018, una gran parte de Google cayó durante aproximadamente una hora después de que un mal funcionamiento de BGP enrutara una gran parte del tráfico web a través de Rusia, China y otras áreas donde se suponía que no debía ser.

Respuesta corta: sí. Definitivamente sí. Si no es en Facebook, es casi seguro que BGP desempeñará un papel en la activación de otra plataforma importante que usa mucho. Según los expertos, eso no es motivo de alarma, pero es un buen ejemplo de la naturaleza falible de la web, que ilustra cuánto puede ser derribado por algo tan simple como un error técnico de una empresa.

"Los eventos de hoy son un suave recordatorio de que Internet es un sistema muy complejo e interdependiente de millones de sistemas y protocolos que trabajan juntos", dijeron los analistas de Cloudflare en su informe sobre el incidente. "Esa confianza, estandarización y cooperación entre entidades son fundamentales para que funcione para casi cinco mil millones de usuarios activos en todo el mundo".