Así será la IA de OpenAI que compone música a partir de texto y audio

El proyecto, aún en desarrollo, busca unir arte y tecnología con ayuda de jóvenes músicos de Juilliard.

26/10/2025 21:00

La inteligencia artificial ha aprendido a escribir, a razonar e incluso a crear imágenes fotorrealistas. El siguiente territorio en disputa es el sonido. Según un informe publicado por The Information, OpenAI está desarrollando una nueva herramienta de música generativa capaz de componer piezas originales a partir de texto o de indicaciones de audio. Se trataría de un sistema que permitiría generar acompañamientos instrumentales, melodías o incluso arreglos completos con solo describir lo que se desea escuchar.

Inteligencia artificial

De los modelos de voz a la composición musical

Aunque OpenAI ya había experimentado con modelos de música en el pasado, aquellos proyectos eran previos al lanzamiento de ChatGPT y quedaron en un segundo plano frente al auge de los grandes modelos de lenguaje. En los últimos meses, la compañía se ha centrado en herramientas de síntesis y reconocimiento de voz, perfeccionando sus sistemas de text-to-speech (de texto a voz) y speech-to-text (de voz a texto). Sin embargo, la música vuelve ahora al primer plano, impulsada por una industria en busca de soluciones creativas y automatizadas para la producción de contenidos.

De acuerdo con las fuentes citadas por The Information, esta nueva herramienta permitiría añadir música a vídeos existentes o crear acompañamientos, como guitarras o bases rítmicas, sobre grabaciones vocales ya realizadas. El sistema aceptaría tanto prompts de texto (por ejemplo, “una pieza melancólica de piano con un toque cinematográfico”) como muestras de audio que servirían de guía para el estilo o la instrumentación.

Uno de los datos más curiosos revelados por la investigación es que OpenAI estaría colaborando con estudiantes de la Juilliard School, una de las escuelas de arte y música más prestigiosas del mundo. Estos alumnos estarían ayudando a anotar partituras para crear un conjunto de datos de alta calidad, con el objetivo de enseñar a la IA no solo la estructura formal de la música, sino también matices expresivos como la dinámica, la intención o la progresión armónica. Esta colaboración sugiere un enfoque mucho más académico y artístico que el de otros proyectos de generación musical.

Aún no se sabe cuándo OpenAI planea lanzar la herramienta ni si llegará como producto independiente o integrada en alguna de sus plataformas existentes, como ChatGPT o la aplicación de vídeo Sora. Ambas posibilidades son estratégicamente atractivas: una integración con ChatGPT abriría la puerta a usuarios cotidianos y creadores de contenido, mientras que una conexión con Sora podría revolucionar la creación audiovisual, permitiendo generar música adaptada en tiempo real a escenas generadas por IA.