
El pasado 4 de octubre a las 15:51, hora UTC, todas las URLs de Facebook dejaron de responder a los DNS del mundo. En otras palabras, Facebook desapareció de internet. ¿Cómo es esto posible? ¿Qué impacto tuvo esto en el resto de la red de redes? En estas líneas intentaré explicar, en el lenguaje más llano posible, todo esto.
El origen de la cascada
Lo primero es entender dónde se originó el problema. Según lo que indica la propia empresa en un post de su blog de ingeniería, el centro del problema estuvo en el backbone de la empresa. Esta red es la que interconecta los principales recursos computacionales del imperio de Mark Zuckerberg. En el momento que mencionamos antes, los ingenieros realizaron tareas para evaluar la disponibilidad de esta red a través de un test. El problema es que este test generó que la red cayera, haciendo que todos los datacenters de Facebook quedaran desconectados de manera global.
Lo siguiente que sucedió es que los servidores DNS (encargados de traducir URLs como ser www.facebook.com en direcciones IP que identifican a los diferentes servidores) dejaron de enviar a internet estas traducciones porque no podía llegar a los recursos que conectaban la red anterior. En pocas palabras, Facebook dejó de decir dónde estaba al mundo y nadie podía llegar a él.
El caos era grande porque los empleados de la empresa no podían conectarse a estos servidores de la manera tradicional, por lo que tuvieron que moverse físicamente hasta los datacenters para realizar cualquier tarea que permitiera reestablecer los servicios. Eso, sumado a que a pesar de estar en ellos se debió desactivar los controles de seguridad para poder modificar los diferentes dispositivos, hizo que todo el proceso demorase lo que demoró: cerca de 7 horas.
¿Qué hicimos nosotros?
Esto es la historia puertas para adentro, pero evidentemente muchas personas y organizaciones se vieron sorprendidas y afectadas por esta caída de estos servicios y actuaron en consecuencia. Otra empresa que hizo un análisis muy interesante fue Cloudflare, empresa responsable de más del 35% de los servidores DNS de todo internet. En un primer posteo en su blog comenta como, luego que Facebook desapareciese de la red, las consultas de personas y aplicaciones a las URLs de los servicios de Facebook se multiplicaron por 30. Esto a raíz de que la gente no acepta un error como respuesta y recargaban sus navegadores y las aplicaciones tienden a reintentar al obtener un error desde allí.
Lo siguiente fue el movimiento de las solicitudes a otras aplicaciones de mensajería y/o redes sociales: prácticamente se duplicaron los pedidos (y en consecuencia los accesos) a Twitter, Signal, Telegram y demás aplicaciones similares.
Unos días más tarde publicaron una segunda entrada que mostró de dónde provenían la mayor cantidad de consultas a Facebook durante la caída y, por lo tanto, los lugares que más sufrieron. Turquía encabeza ampliamente este ranking seguido de Granada, Congo y Lesotho.
También pudieron apreciar que el acceso a los sitios de juegos como Steam, Xbox o Minecraft aumentaron hasta en un 50% (el ocio mata el ocio). Y obviamente los portales de noticias alrededor del mundo multiplicaron su tráfico, por momentos, en un 300%.
La moraleja del asunto
La cuenta de Twitter del Observatorio Latinoamericano de Regulación, Medios y Convergencia (OBSERVACOM), mientras ocurría todo esto, publicó un mensaje muy firme.
Es importante que tomemos conciencia de cuanto depende nuestra comunicación, nuestros negocios, nuestras relaciones, de una empresa o un conglomerado. Para evitar este tipo de situaciones uno debe tener canales alternativos siempre disponibles (léase Telegram, Signal, etc.).
También nos debería poner alerta si existieran prácticas que, implícitamente, llevase a los usuarios hacia ese camino no deseado (por ejemplo, que los prestadores de servicios beneficien a una empresa por sobre otra ofreciendo a sus clientes que el tráfico hacia esos servicios sea gratuito).
Resumiendo: prendamos las luces y defendamos nuestra independencia digital.