Así es como Google sabe qué canción estás tarareando

Google puede saber el nombre de las canciones que tarareas. Pero, ¿cómo? Así es como funciona esta espectacular función.

Última actualización el 22/11/2020 a las 21:01

Descubrir el nombre o el creador de una canción a través de Google es tan fácil como tararear la canción y esperar a que el buscador haga su magia. En pocos segundos –dependiendo de tu técnica de tarareo– podrás saber toda la información que necesitas sobre esa música que lleva días sonando en tu cabeza.

Pero, ¿cuál es esa magia realmente? A través de su blog de inteligencia artificial, Google ha querido explicarnos con más detalle cómo funcionan sus sistemas encargados de identificar las canciones en base a los sonidos que producimos.

Buscador de música de Google

Google puede saber qué canción estás tarareando.

Una base de datos de millones de canciones y mucha IA: así funciona “Hum to search”

Google explica que, a la hora de desarrollar esta función, llamada “Hum to Search”, tuvieron que enfrentarse a varios retos.

Uno de los más importantes es el hecho de que cada persona tararea su propia interpretación de la canción, de modo que el ritmo o el tono podrían no ser los adecuados, dificultando así el proceso de búsqueda de la canción original, sobre todo cuando se utiliza una base de datos que solo incluye las versiones originales de cada canción.

Es por ello que Google decidió modelar un sistema capaz de producir una melodía a partir de un espectrograma de una canción, sin generar una representación intermedia. O, en castellano: el sistema es capaz de hacer coincidir la melodía tarareada con la grabación polifónica original de la canción.

Espectrograma

Para representar lo difícil que puede llegar a ser identificar una canción en base a una melodía tarareada, Google nos muestra una visualización del espectrograma de la popular canción Bella Ciao en la imagen sobre estas líneas. A la izquierda, se puede ver la versión tarareada, mientras que a la derecha se observa la melodía original.

A partir de la visualización de la melodía tarareada, el modelo desarrollado debe buscar rasgos que permitan asociarla a la canción original, realizando búsquedas en una base de datos de 50 millones de canciones con espectrogramas similares.

En ese sentido, Google ha entrenado a su sistema para centrarse solo en la melodía predominante, olvidándose de letras, instrumentos o el timbre de la voz. También es capaz de filtrar otros ruidos como el sonido de ambiente o el que puede producir la reverberación de una habitación.

La compañía explica, además, que esta función ha sido desarrollada aprovechando algunos avances en este campo conseguidos en el pasado, como pueden serlo el sistema Now Playing que Google introdujo por primera vez junto a los Google Pixel 2, y que permite identificar cualquier canción que suene a nuestro alrededor, sin necesidad de conexión a Internet ni de recurrir a un servidor.

Now Playing en Pixel 2 XL

Now Playing, una de las mejores funciones de los Pixel.

A través de modificaciones llevadas a cabo en los modelos usados para dar vida tanto a Now Playing como a la función Sound Search, se entrenó a la red neuronal con pares de audio, formados por una versión tarareada y otra grabada a partir de la melodía original. Así, se generaba una incrustación de cada uno de ellos que posteriormente serían procesadas en búsqueda de rasgos que dejen clara las similitudes entre una y otra.

Esto, llevado a cabo en millones de ocasiones con millones de canciones diferentes, fue uno de los grandes retos a la hora de entrenar a la red neuronal. No por el proceso de aprendizaje automático en sí, sino por la dificultad añadida de tener que encontrar versiones tarareadas de las millones de canciones utilizadas durante este proceso.

Y es que para ello, Google se vio obligada a utilizar SPICE, un modelo de extracción de tono que fue utilizado para generar melodías tarareadas que pudieran ser utilizadas para entrenar al modelo. En ese sentido, Google nos muestra cómo sonaban las melodías extraídas, y cómo lo hacían las originales.

A partir de ahí, cuando el sistema estaba lo suficientemente entrenado, se fue refinando la técnica a través de otros sistemas de aprendizaje automático con los que se fue mejorando la precisión de las búsquedas.

Además, la compañía especifica que, si bien los tarareos de los usuarios no se comparten de manera automática, es posible activar una opción que permite a “Hum to Search” seguir aprendiendo y mejorando sus capacidades. Hoy por hoy, la base de datos ya cuenta con más de medio millón de canciones.

Cómo usar “Hum to Search”

Cualquier usuario de un móvil iOS o Android puede **usar “Hum to Search” para encontrar canciones simplementa tarareándolas –o silbándolas–. Para ello, tan solo hay que seguir estos pasos:

  1. Abre el buscador de Google, a través de la app para móviles o desde un navegador web.
  2. Toca sobre el icono del micrófono y, después, sobre “¿Cuál es esta canción?”.
  3. Comienza a tararear o a silbar la canción que quieres encontrar, y espera a que el buscador la identifique.

Funciones como esta, o como la herramienta de Google Maps que sabe decirnos cómo de concurrido está un lugar, son grandes ejemplos de cómo la inteligencia artificial puede hacernos la vida más fácil.

VER COMENTARIOS

Recomendado