El secreto de cómo funciona la IA desvelado: OpenAI muestra sus entresijos
OpenAI ha puesto en marcha un nuevo proyecto para comprender cómo funciona la IA desde su interior, hacer un nuevo modelo más lento pero que pueda ver cómo trabaja y satisface nuestras solicitudes
OpenAI está pensando en cómo avanzar en un futuro donde los modelos de lenguajes experimentales de gran tamaño son cada vez más incomprendidos. En una entrevista exclusiva con MIT Technology Review, un investigador de OpenAI dio un adelanto respecto al nuevo trabajo que podría desenmascarar a ChatGPT en nuevas versiones. Es una investigación temprana que está en sus primeras etapas pero que promete mucho ya que es pequeño pero permitirá comprender en su totalidad cómo funciona respecto a otros modelos que son más complejos.
El secreto de cómo funciona la IA podría ser revelado con un nuevo LLM de OpenAI
¿Cuántas veces no hemos utilizado un motor de IA y al finalizar no comprendemos cómo le ha hecho para respondernos a un simple cuestionamiento? Todo es una labor interna de la cual ni nos enteramos y algunos usuarios no prefieren enterarse. OpenAI seguirá sorprendiendo al mundo y ahora lo hará con un modelo de lenguaje experimental que es mucho más fácil de comprender que cualquier otro.
Esto ayudará a otros a poder potenciar sus propios modelos tras entender cómo funcionan dichos modelos de aprendizaje automático de manera general. Sobre todo, aborda en cómo los modelos presentan fallas y por qué lo hacen. Leo Gao, investigador de OpenAI entrevistado, declaró que si un sistema de IA se vuelve más potente es casi un hecho que se involucrará en un ambiente importante.
Tras tener esto como base, OpenAI pensó en un modelo que no fuera el más relevante en potencia pero sí en funcionamiento, al menos desde el punto de vista comprensivo. Analizar su funcionamiento ayudará a entender todo el mecanismo interior que normalmente se oculta de un modelo grande de IA. Dicho trabajo forma parte de un nuevo campo de investigación denominado "interpretabilidad mecanicista" que "mapeará los mecanismos internos que utilizan los modelos" cuando se les indica realizar ciertas tareas.

Las herramientas de inteligencia artificial permiten generar vídeos gratis a partir de texto o imágenes, ideales para redes sociales y proyectos creativos
Estos modelos son construidos mediante "redes neuronales" que vienen en capas. El líder del equipo de interpretabilidad mecanicista de OpenAi, Dan Mossing, ha declarado que estas redes neuronales son muy grandes, complejas y difíciles de entender. Su propuesta es el de cambiar esto por algo más sencillo.
De vuelta a los orígenes, en lugar de tener algo más rápido será lento pero con respuestas detrás del proceso
El tipo de red neuronal que ha construido OpenAI para esta investigación es conocida como "transformador de pesos dispersos". Cada neurona está conectada a otras pocas neuronas, en lugar de ser un lugar lleno de capas conectadas a más neuronas conocidas como "red densa". El modelo es lento pero es fácil poder distinguir a estas neuronas con "conceptos y funciones específicos".

Un texto farragoso se puede convertir en un cómodo listado de puntos principales con GPT-3
La solicitud más sencilla implica poder averiguar cómo se tejió la red de neuronas, por lo que con el nuevo modelo se podría explicar concretamente cómo se ha hecho. No se espera que puedan comprender cómo se desenvuelve GPT-5 pero al menos podría llegar a crearse un modelo similar a lo que fue GPT-3 en su momento pero entendible. El reto está en poder interpretar lo que hizo un modelo de hace 4 años.