El plan maestro de Tesla para sus robots: usarán el mismo método que los coches autónomos para que aprendan a "vivir"
La compañía abandona los trajes de captura para que Optimus aprenda viendo vídeos, igual que hacen sus coches autónomos para aprender a conducir

Tesla acaba de dar un giro importante al entrenamiento de Optimus, y la compañía ha abandonado los trajes de captura de movimiento para apostar por algo completamente distinto. Según ha recogido Business Insider, ahora quieren que su robot humanoide aprenda de la misma forma que sus coches autónomos: mediante enormes cantidades de vídeos.
Es un cambio considerable si tenemos en cuenta los métodos tradicionales. Tesla ha decidido centrar todo en la visión computacional como base principal para que Optimus adquiera nuevas habilidades, dejando atrás lo que hace el resto del sector robótico.
Adiós a los sensores, hola a las cámaras
Hasta hace poco, Tesla seguía el mismo camino que otros fabricantes como Boston Dynamics con Atlas. Utilizaban trajes equipados con sensores junto con cascos de realidad virtual para registrar movimientos humanos. Los operadores dirigían físicamente al robot, permitiéndole aprender mediante la interacción directa con objetos reales.
Pero este método tenía sus limitaciones evidentes. Las interrupciones técnicas eran frecuentes y los problemas de resolución ralentizaban considerablemente la recolección de datos. El equipo de Musk decidió que era momento de acelerar y escalar todo el proceso.
El nuevo sistema funciona de forma diferente: los trabajadores realizan tareas cotidianas —como doblar camisetas o recoger objetos— equipados con un casco y una mochila que incluyen cinco cámaras desarrolladas por Tesla. Estas cámaras capturan cada movimiento desde múltiples ángulos, permitiendo que la inteligencia artificial aprenda a replicar exactamente cómo nos movemos: la posición de las manos, el ángulo de los dedos, cada detalle.
La lógica es bastante directa: recopilar masivas cantidades de vídeo para que Optimus no se limite a imitar, sino que pueda generalizar y aplicar lo aprendido a situaciones nuevas. El vídeo permite escalar la recolección de datos de forma exponencial y, en principio, entrena la IA para absorber patrones más complejos y diversos.
Tesla lleva años mostrando la evolución de Optimus. La segunda generación ya incluía mejoras notables en velocidad, equilibrio y sensibilidad táctil. Más recientemente, las demostraciones del robot han mostrado capacidades como ejercicios de yoga y habilidades para esquivar objetos en movimiento.
Sin embargo, no todos los expertos ven clara esta transición. Robert Griffin, del Instituto de Cognición Humana y de Máquina, argumenta que la interacción física directa proporciona datos mucho más ricos que las secuencias de vídeo. Traducir imágenes en movimientos precisos representa un desafío técnico significativamente mayor para cualquier robot.
Musk ha expresado su ambición de que Optimus llegue a aprender incluso de vídeos de YouTube, pero especialistas como Alan Fern de la Universidad Estatal de Oregón señalan un problema fundamental: enseñar tareas físicas mediante observación visual requiere que la IA interprete correctamente cada acción antes de intentar reproducirla en el mundo físico.
Paralelamente, Tesla ha incorporado elementos adicionales a Optimus, como pantallas OLED de Samsung integradas en el rostro para mostrar expresiones e información, facilitando su integración en entornos sociales. Los últimos desarrollos del Gen 2 demuestran avances progresivos en manipulación de objetos y navegación espacial.
Este cambio de rumbo coincide con la salida de Milan Kovac como director del proyecto y la asunción del control por parte de Ashok Elluswamy, actual responsable de IA. Tesla ha pausado las contrataciones para el equipo Optimus, aunque mantiene activas más de 50 ofertas laborales relacionadas con el proyecto.
Ni Tesla ni Musk han ofrecido declaraciones oficiales al respecto, pero la dirección está clara: la compañía busca democratizar la robótica aplicando la misma filosofía que utilizó con los vehículos eléctricos, basándose en grandes volúmenes de datos visuales en lugar de los métodos convencionales del sector.