El pasado 24 de junio de 2019, grandes proveedores como Amazon y Cloudflare sufrieron una caída a nivel global que terminó afectando a una larga porción de Internet. Estas caídas no son raras, pero esta en particular tiene su origen en un “simple” error de configuración de red de una empresa en el estado de Pennsylvania en los Estados Unidos llamada DQE Communications, un pequeño ISP de la región.
El problema: esa empresa se convirtió temporalmente en la ruta preferida de más de 20.000 direcciones IP a través de Verizon, uno de los ISP más importantes en gran parte del mundo. Es decir, por un momento esa pequeña empresa dijo que era dueña de una enorme porción de Internet y Verizon lo aceptó como tal.
El 24 de junio a las 10:30UTC, Internet sufrió un pequeño ataque cardíaco. Una pequeña empresa al norte de Pennsylvania se convirtió en la trayectoria preferida de muchas rutas de Internet a través de Verizon, un gran proveedor de tránsito. Esto fue el equivalente a que Waze enviara el tráfico de una autopista completa a una calle de un vecindario, dando como resultado que muchos sitios web alojados en Cloudflare, y en muchos otros proveedores, dejaran de estar disponibles en grandes partes de Internet. Esto nunca debería haber pasado porque Verizon nunca debió haber desviado esas rutas al resto de Internet.
Un error de un pequeño ISP local es diseminado a todo el mundo a través de un ISP global
Los culpables de esto, como explican en Cloudflare, fueron Verizon y BGP Optimizer. BGP Optimizer es un producto de la empresa Noction que ofrece a sus clientes una función que divide los prefijos de las direcciones IP recibidas en partes más pequeñas o “más específicas”, de forma que una red tenga un mecanismo mediante el cual dirigir el tráfico dentro de tu propia red. Esas rutas más específicas anulan las rutas más generales.
Hasta ahí todo bien, hasta que las rutas específicas de esa pequeña empresa en Pennsylvania fueron anunciadas incorrectamente a todo el mundo, rutas que anunciaban que enviaran el tráfico de un montón de nombres grandes de la web hacia ellos. La empresa DQE anunció sus rutas a unos de sus clientes, Allegheny Technologies, y como estos últimos eran a su vez clientes de Verizon, toda esa información se mandó también a este ISP.
Verizon procedió a informar al Internet completo de esas rutas más específicas, ya que no implementan prácticas de filtrado, esto hizo que DQE y su cliente Allegheny Technologies, tuviesen que lidiar con la estampida de tráfico que trataban de acceder a sitios web alojados en Cloudflare, Amazon, Linode y más, como por ejemplo, Facebook. Imagina una pequeña empresa con una red local intentando lidiar con el tráfico de Amazon o Facebook.
Por la forma en que Internet funciona, todas las redes que se conectan unas a otras lo hacen a través del BGP o Border Gateway Protocol, ese protocolo es el que “mapea Internet” y permite que el tráfico viaje desde por ejemplo, tu ISP a YouTube. Y, para identificar a cada red en ese mapa, cada una tiene un número único o número AS.
A través de BGP las redes intercambian información de las rutas, es decir, el cómo llegar al usuario. Cuando DQE estableció sus rutas equivocadamente usando BGP optimizer en su red, esas rutas debieron llegar hasta ahí, nunca hasta Verizon, que debería tener un filtro que identificara las rutas específicas erradas.
John Graham-Cumming, CTO de Cloudflare le dijo a The Register que “este tipo de configuraciones erroneas de BGP pasan mucho, pero que normalmente un ISP tan grande como Verizon debería filtrarlas si pasa que un proveedor pequeño dice que es dueño de Internet”.