Turing paga a artistas y obreros para grabar su día a día y entrenar la próxima generación de inteligencia artificial

Turing paga a artistas y obreros para grabar su día a día y entrenar la próxima generación de inteligencia artificial
Publicado en Tecnología

En pleno auge de la inteligencia artificial, los datos se han convertido en el recurso más valioso. Ya no basta con modelos potentes o infraestructuras masivas; lo que realmente marca la diferencia es la calidad de la información con la que estas máquinas aprenden. En esa búsqueda, algunas empresas tecnológicas están recurriendo de nuevo a los humanos, esta vez no como simples anotadores, sino como protagonistas de su propio trabajo cotidiano, grabado con cámaras y convertido en materia prima para la próxima generación de modelos de IA.

Taylor (una artista entrevistada por Tech Crunch que pidió no revelar su apellido) formó parte de ese nuevo experimento. Durante una semana entera de verano, ella y su compañera de piso llevaron cámaras GoPro atadas a la frente mientras pintaban, esculpían o fregaban los platos. Todo lo que hacían era cuidadosamente sincronizado para entrenar un modelo de visión artificial de la startup Turing, que busca enseñar a las máquinas a comprender tareas humanas complejas a partir de vídeo real.

“Nos levantábamos, sincronizábamos las cámaras y seguíamos con nuestro día, cocinando o haciendo arte”, contó Taylor. “Pero terminaba siendo agotador. Las cintas dejaban marcas rojas en la piel y acababas con dolor de cabeza”.

El objetivo de Turing no era enseñar al modelo a pintar, sino algo más abstracto: dotar a la IA de una comprensión visual y secuencial del mundo físico, desde cómo se corta una cebolla hasta cómo se mezcla cemento o se repara un enchufe. Para ello, la empresa está contratando artistas, cocineros, obreros y técnicos. Según explicó Sudarshan Sivaraman, director de AGI (inteligencia artificial general) de Turing, el enfoque manual es la única forma de conseguir una base de datos realmente diversa: “Estamos grabando todo tipo de trabajos manuales para que el modelo entienda cómo se ejecuta una tarea. La variedad es esencial en la fase de preentrenamiento”.

De los algoritmos hambrientos al valor de la experiencia humana

Lo que hace Turing refleja un cambio profundo en la industria de la IA. En los primeros años del boom, las compañías llenaban sus modelos con datos extraídos de internet (páginas web, foros, redes sociales) sin apenas filtros ni control de calidad. Hoy, en cambio, las empresas más punteras están dispuestas a pagar cantidades importantes por conjuntos de datos precisos, limpios y exclusivos.

El razonamiento es sencillo: el poder bruto de los modelos ya está alcanzado; ahora la ventaja competitiva está en los datos privados y bien entrenados. En lugar de subcontratar el trabajo a plataformas anónimas, muchas compañías prefieren recolectar su propia información o controlar directamente su generación.

Un ejemplo de ello es Fyxer, una empresa que usa IA para ordenar correos electrónicos y redactar respuestas. Su fundador, Richard Hollingsworth, explicó que tras varios ensayos descubrieron que el rendimiento de su sistema no dependía tanto de la cantidad de datos como de su calidad. “Lo que realmente define el rendimiento no es el volumen, sino la precisión del conjunto de datos”, afirmó.

En la práctica, eso significó algo curioso: en los primeros meses, los ingenieros y directivos eran superados en número por los asistentes ejecutivos, profesionales que se encargaban de entrenar al modelo en los matices del correo corporativo. “Necesitábamos expertos en relaciones humanas, personas que supieran cuándo un correo merece respuesta y cuándo no. Es un problema profundamente humano”, explicó Hollingsworth.

Con el tiempo, el proceso se volvió más selectivo: menos volumen, más control. Al igual que en Turing, la obsesión por la curación de los datos sustituyó al entusiasmo por la escala masiva. En el caso del modelo visual, Sivaraman calcula que entre el 75 % y el 80 % de los datos que usa Turing son sintéticos, generados a partir de las grabaciones originales. Pero eso solo aumenta la importancia del material inicial: “Si el preentrenamiento no parte de datos de buena calidad, todo lo que derives de ellos será defectuoso”, explicó.

Este enfoque tiene, además, una lógica estratégica. En un panorama donde cualquiera puede usar modelos de código abierto, el verdadero diferencial reside en los datos propietarios. Para empresas como Fyxer, el trabajo de recopilación y anotación humana se convierte en un muro difícil de franquear para la competencia. “Creemos que la mejor manera de avanzar es a través de los datos: modelos personalizados, entrenamiento humano y de alta calidad”, resumió Hollingsworth.

A primera vista, el método puede parecer un paso atrás en la era de la automatización: humanos grabando cada uno de sus movimientos para enseñar a las máquinas. Pero en realidad, es una forma de recordar que la inteligencia artificial todavía necesita aprender de la experiencia humana directa. Sin esas horas de observación (de pinceles, cables y sartenes), los modelos serían meros coleccionistas de patrones estadísticos sin sentido práctico.

Así, mientras el mundo se pregunta cuándo llegará la inteligencia general artificial, Turing y otras empresas están invirtiendo en lo que quizá sea su cimiento más valioso: la comprensión real de cómo actúan las manos humanas. Tal vez el futuro de la IA no se construya en laboratorios cerrados, sino en los hogares y talleres donde personas como Taylor siguen, día a día, enseñando a las máquinas lo que significa vivir y crear en el mundo físico.

Para ti
Queremos saber tu opinión. ¡Comenta!