¿La IA tuvo la culpa? La gran caída de AWS reabre el debate sobre los despidos en Amazon

Expertos apuntan a que la reciente caída de AWS podría estar relacionada con la pérdida de ingenieros veteranos tras los despidos ligados a la adopción de IA

¿La IA tuvo la culpa? La gran caída de AWS reabre el debate sobre los despidos en Amazon
El fallo de AWS pone en duda la dependencia de Amazon en sistemas de IA tras recortes de personal
Publicado en Amazon
Por por Sergio Agudo

La caída de Amazon Web Services del pasado lunes por la mañana dejó sin red a aplicaciones, juegos y plataformas de todo tipo. ChatGPT dejó de funcionar, Fortnite desapareció de la red, distintos dispositivos inteligentes se quedaron sin conexión y aplicaciones como Snapchat o servicios bancarios dejaron de responder. Tal y como ya os contamos, el fallo afectó a servicios de todo tipo en medio mundo durante más de medio día.

Los primeros informes llegaron a las 3:11 de la madrugada, hora del este de Estados Unidos. Según se recoge en Futurism, Amazon tardó tres horas en indicar en su panel que el problema estaba solucionado, pero no fue hasta las 18:53 cuando todos los servicios volvieron a funcionar con normalidad. Las pérdidas de productividad se estimaron en miles de millones de dólares a nivel global.

Un fallo de DNS que tardó horas en resolverse

Amazon atribuyó el problema a un fallo en la resolución de DNS. El sistema de nombres de dominio traduce URLs como Amazon.com en direcciones IP, actuando como una guía que permite conectar servicios en internet. Cuando estos datos fallan, los servicios dejan de comunicarse entre sí y se produce una caída masiva como la del lunes.

Amazon ya había sufrido caídas importantes de AWS en el pasado. Esta coincide con una decisión tomada en julio: la división de informática en la nube de Amazon eliminó al menos cientos de puestos de trabajo. El CEO Andy Jassy había avisado en junio de que la adopción de IA generativa reduciría plantilla en determinadas áreas de la compañía.

Jassy explicó en una nota interna que necesitarían menos personas haciendo algunos trabajos actuales y más gente en otros tipos de tareas. La compañía no ha especificado qué puestos se vieron afectados por los despidos. Ahora, con la caída de esta semana, algunos expertos apuntan a que la falta de personal experimentado pudo contribuir al tiempo que tardó en resolverse el problema.

Los puestos técnicos son algunos de los más afectados por la llegada de herramientas de IA, especialmente asistentes de programación. Google y Microsoft también están usando estas tecnologías: el 25% del código nuevo de Google lo escribe IA según su CEO Sundar Pichai, mientras que en Microsoft esta cifra alcanza casi el tercio según Satya Nadella. Las empresas que han apostado por sustituir trabajadores por IA están descubriendo que los resultados no siempre son los esperados.

Corey Quinn, experto en informática en la nube y autor del boletín Last Week in AWS, publicó un artículo en The Register donde señalaba la falta de conocimiento adquirido mediante la experiencia durante la caída. Quinn escribió que el equipo de Amazon no supo identificar qué estaba fallando durante un periodo de tiempo absurdamente largo para un problema de este tipo.

Quinn explica que se puede contratar a personas muy inteligentes que expliquen cómo funciona el DNS a nivel técnico, pero no se puede sustituir a quien recuerda que cuando el DNS falla hay que revisar ese sistema del rincón que históricamente ha contribuido a caídas anteriores. Ese conocimiento acumulado es el que se pierde cuando el personal veterano se va de la empresa.

Cuando ese conocimiento desaparece, hay que reinventar experiencia interna desde cero. Quinn escribió que esto no afecta a la fiabilidad del servicio hasta que un día lo hace de forma espectacular, y que sospechaba que ese día había llegado para Amazon Web Services esta semana.

Para ti
Queremos saber tu opinión. ¡Comenta!