A esta inteligencia artificial le bastan 1,2 millones de canciones para imitar el estilo de cualquier artista, vivo o muerto

16 comentarios Facebook Twitter E-mail

11 Mayo 2020

Javier Pastor

La próxima canción que lo pete en las listas de éxitos podría estar creada completamente por una máquina. Es al menos lo que uno se plantea cuando descubre a Jukebox, una red neuronal capaz de imitar a cualquier artista musical creando canciones que siguen ese estilo.

Este sistema de ingeligencia artificial ha sido entrenado con 1,2 millones de canciones y que gracias a ello puede generar por sí sola la letra de la canción, la música e incluso de forma "rudimentaria", como sus creadores indican, la voz de ese artista. El resultado, como se puede ver en las muestras de audio y los vídeos, son sorprendentemente convincentes.

En Xataka

A los seres humanos siempre nos quedará la creatividad, una máquina no puede crear ¿mito o realidad?

Dame una canción, ya hago yo el resto

OpenAI publicaba este desarrollo —tanto el código fuente como un montón de muestras de ejemplo— hace unos días y lo hacía para que cualquiera pudiera experimentar con un sistema que reabre el debate sobre la potencial capacidad creativa de las máquinas.

Este entorno de trabajo hace uso de un sistema de aprendizaje automático capaz de generar música y canciones de diversos géneros y estilos musicales. Una vez está entrenado, uno puede darle como entrada al sistema un artista o canción de partida y Jukebox creará de cero una muestra de sonido de una canción que conservará ese mismo estilo.

En Xataka

Tócala otra vez, IA (Captcha 1x04)

Este tipo de modelos de generación de contenido a partir de un entrenamiento previo no son en absoluto novedosos, pero esta nueva plataforma de OpenAI demuestra hasta dónde se puede llegar con los avances actuales: las muestras de música country, pop clásico jazz, rock clásico o heavy metal eran realmente llamativos por cómo se ajustaban al estilo y artista original.

El sistema de Jukebox funciona mediante un llamado codificador automático (autoencoder), que comprime el audio de entrada en un espacio dimensional más reducido en el que se descarta cierta información considerada irrelevante. Ese modelo puede ser entrenado para generar audio con ese mismo patrón y devolver una muestra del resultado.

Los responsables de este sistema lo entrenaron con 1,2 millones de canciones, 600.000 de las cuales estaban en inglés, y en ellas también se incluyeron tanto las letras como algunos metadatos (género, año de publicación, artista, algunas palabras clave).

Los ejemplos publicados imitan todo tipo de estilos musicales y todo tipo de artistas. Entre ellos estaba inevitablemente un ejemplo más de rickrolling, ese meme generado a partir de la canción 'Never Give You Up' de Rick Astley. El motor fue capaz de generar un tema muy similar y que desde luego sorprende por cómo logra imitar el estilo de Rick Astley.

Los resultados son espectaculares aun con sus limitaciones, sobre todo en cuanto al ruido generado en la canción o al hecho de que se necesita mucho tiempo ("nueve horas" en sus máquinas, aunque no especifican cuáles) para generar un solo minuto de audio debido a la ingente capacidad de proceso que requiere este sistema.

Más información | OpenAI