DeepSeek pospone su modelo estrella: cuando la tecnología choca con el poder

La empresa china no puede entrenar su modelo R2 con chips de Huawei y tiene que recurrir a hardware de NVIDIA pese a las presiones gubernamentales

DeepSeek pospone su modelo estrella: cuando la tecnología choca con el poder
Los procesadores Ascend de Huawei han demostrado ser insuficientes para las demandas computacionales de los modelos de IA más avanzados de DeepSeek
Publicado en Tecnología
Por por Sergio Agudo

DeepSeek acaba de dar un paso atrás. La compañía china ha tenido que posponer el lanzamiento de su esperado modelo R2, que estaba previsto para mayo de 2025. La razón es bien sencilla: no han conseguido entrenar el sistema con los procesadores de Huawei, algo que el gobierno chino quería que hicieran sí o sí.

Todo viene después del exitazo de su modelo R1, que se entrenó principalmente con chips de Nvidia. Según TechSpot, Pekín presionó a DeepSeek para que usara solo hardware nacional en R2, pero la cosa no ha salido como esperaban.

La realidad técnica supera las ambiciones políticas

Los ingenieros de DeepSeek han tenido problemas serios intentando entrenar R2 con los procesadores Ascend de Huawei. Los chips fallan constantemente, la comunicación entre ellos es lenta y, lo peor de todo, no tienen un ecosistema como el CUDA de Nvidia que funcione de verdad. La cosa se complicó tanto que Huawei mandó a sus propios ingenieros para echar una mano, pero después de semanas trabajando juntos no consiguieron arreglar los problemas y DeepSeek tuvo que cambiar de planes completamente.

Al final han decidido hacer una mezcla: entrenar R2 con chips Nvidia H20 y usar los de Huawei solo para la inferencia, que es la parte donde se necesita menos potencia de cálculo. Así pueden seguir adelante, aunque no era exactamente lo que tenían pensado al principio. DeepSeek se ha ganado bastante reconocimiento por hacer las cosas con cuidado y tener un desarrollo más pulido que otros, así que cuando tienen problemas técnicos, la cosa se nota bastante en todo el sector.

Las autoridades chinas están preocupadas por depender del hardware estadounidense. Les da miedo que los chips de Nvidia tengan puertas traseras o vulnerabilidades, pero querer algo y conseguirlo son dos cosas muy diferentes, sobre todo en tecnología. El retraso ha fastidiado bastante a DeepSeek porque habían adelantado tres meses el lanzamiento de su nueva IA para competir directamente con GPT-5, prometiendo algo más eficiente y hasta 20 veces más barato.

Lo que más llama la atención es que los jefes de OpenAI y Microsoft han reconocido lo bueno que es DeepSeek y el impacto que está teniendo en el sector. Que te alaben tus competidores y luego tengas que retrasar tu siguiente modelo no queda muy bien que digamos. DeepSeek espera tener R2 listo en unas semanas, ya funcionando completamente con hardware de Nvidia, pero lo que ha pasado demuestra lo complicado que es querer ser independiente tecnológicamente cuando la realidad técnica no acompaña.

Al final, en el mundo de la IA las decisiones técnicas mandan más que las políticas cuando se trata de sacar productos que funcionen de verdad. China puede tener todas las ambiciones que quiera, pero si el hardware no da la talla, poco se puede hacer. Este episodio con DeepSeek no es más que un recordatorio de que la tecnología no entiende de fronteras ni de nacionalismos: o funciona o no funciona, y punto.

Para ti
Queremos saber tu opinión. ¡Comenta!