Mira Murati y Thinking Machines Lab buscan eliminar el azar en las respuestas de la IA

Murati quiere que la IA deje de ser impredecible: reproducibilidad como pilar de su laboratorio de vanguardia.

Mira Murati y Thinking Machines Lab buscan eliminar el azar en las respuestas de la IA
Publicado en Tecnología
Por por Alex Verdía

La aleatoriedad en las respuestas de los modelos de lenguaje ha sido aceptada durante años como una característica inherente a la inteligencia artificial. Preguntar lo mismo varias veces a un chatbot y obtener diferentes respuestas es una experiencia común para millones de usuarios de sistemas como ChatGPT. Sin embargo, Mira Murati, ex directora de tecnología de OpenAI y ahora fundadora de Thinking Machines Lab, cree que este problema es resoluble.

Con $2.000 millones en financiación inicial y un equipo de lujo compuesto por antiguos investigadores de OpenAI, el laboratorio con sede en Silicon Valley publicó su primera entrada en el blog de investigación “Connectionism”. El artículo, titulado “Defeating Nondeterminism in LLM Inference”, propone que la raíz del problema no está en el modelo en sí, sino en la forma en que las GPU kernels —pequeños programas que se ejecutan dentro de los chips de Nvidia— son orquestadas durante el proceso de inferencia.

El autor del texto, el investigador Horace He, sostiene que controlando cuidadosamente esta capa de ejecución es posible lograr que los modelos de IA sean más deterministas. Esto significa que, dadas las mismas condiciones y la misma pregunta, el sistema debería ofrecer siempre la misma respuesta.

Implicaciones para el entrenamiento y los futuros productos

Más allá de mejorar la confiabilidad para empresas y científicos, esta innovación podría transformar el proceso de reinforcement learning (RL), una técnica de entrenamiento que premia a los modelos cuando aciertan. Actualmente, la ligera variabilidad de las respuestas introduce “ruido” en el entrenamiento. Si los resultados fueran más consistentes, el aprendizaje por refuerzo sería mucho más eficiente y “suave”, como explica He.

Thinking Machines Lab ya ha adelantado a sus inversores que planea utilizar RL para personalizar modelos de inteligencia artificial adaptados a necesidades empresariales, según informó The Information. Si logran consolidar esta metodología, abrirían la puerta a modelos de IA más estables, precisos y personalizables, un atractivo enorme en sectores como la salud, la investigación científica o las finanzas.

Aunque aún no se sabe con exactitud cuál será el primer producto comercial de la compañía, Murati adelantó en julio que será presentado en los próximos meses y estará enfocado en investigadores y startups que desarrollan modelos a medida. Si este producto logra implementar las técnicas descritas en la investigación, podría marcar un hito en la industria.

Un aspecto destacado de la iniciativa es la apuesta por la apertura. En el blog, el laboratorio afirma que publicará investigaciones, código y recursos de manera constante para “beneficiar al público y mejorar la propia cultura de investigación”. Esta visión contrasta con la evolución de OpenAI, que comenzó con una filosofía abierta, pero se ha vuelto más hermética a medida que creció en escala y valoración.

El reto, sin embargo, es monumental. Resolver la no determinación en modelos de lenguaje no solo implicaría superar barreras técnicas, sino también convertir ese avance en un producto comercial sólido que justifique los $12.000 millones de valoración de la compañía. Lo que está claro es que Thinking Machines Lab ha decidido empezar fuerte: atacando una de las preguntas más difíciles y fundamentales en el campo de la IA moderna.

Para ti
Queremos saber tu opinión. ¡Comenta!