La próxima canción que lo pete en las listas de éxitos podría estar creada completamente por una máquina. Es al menos lo que uno se plantea cuando descubre a Jukebox, una red neuronal capaz de imitar a cualquier artista musical creando canciones que siguen ese estilo.
Este sistema de ingeligencia artificial ha sido entrenado con 1,2 millones de canciones y que gracias a ello puede generar por sí sola la letra de la canción, la música e incluso de forma "rudimentaria", como sus creadores indican, la voz de ese artista. El resultado, como se puede ver en las muestras de audio y los vídeos, son sorprendentemente convincentes.
Dame una canción, ya hago yo el resto
OpenAI publicaba este desarrollo —tanto el código fuente como un montón de muestras de ejemplo— hace unos días y lo hacía para que cualquiera pudiera experimentar con un sistema que reabre el debate sobre la potencial capacidad creativa de las máquinas.
Este entorno de trabajo hace uso de un sistema de aprendizaje automático capaz de generar música y canciones de diversos géneros y estilos musicales. Una vez está entrenado, uno puede darle como entrada al sistema un artista o canción de partida y Jukebox creará de cero una muestra de sonido de una canción que conservará ese mismo estilo.
Este tipo de modelos de generación de contenido a partir de un entrenamiento previo no son en absoluto novedosos, pero esta nueva plataforma de OpenAI demuestra hasta dónde se puede llegar con los avances actuales: las muestras de música country, pop clásico jazz, rock clásico o heavy metal eran realmente llamativos por cómo se ajustaban al estilo y artista original.
El sistema de Jukebox funciona mediante un llamado codificador automático (autoencoder), que comprime el audio de entrada en un espacio dimensional más reducido en el que se descarta cierta información considerada irrelevante. Ese modelo puede ser entrenado para generar audio con ese mismo patrón y devolver una muestra del resultado.
Los responsables de este sistema lo entrenaron con 1,2 millones de canciones, 600.000 de las cuales estaban en inglés, y en ellas también se incluyeron tanto las letras como algunos metadatos (género, año de publicación, artista, algunas palabras clave).
Los ejemplos publicados imitan todo tipo de estilos musicales y todo tipo de artistas. Entre ellos estaba inevitablemente un ejemplo más de rickrolling, ese meme generado a partir de la canción 'Never Give You Up' de Rick Astley. El motor fue capaz de generar un tema muy similar y que desde luego sorprende por cómo logra imitar el estilo de Rick Astley.
Los resultados son espectaculares aun con sus limitaciones, sobre todo en cuanto al ruido generado en la canción o al hecho de que se necesita mucho tiempo ("nueve horas" en sus máquinas, aunque no especifican cuáles) para generar un solo minuto de audio debido a la ingente capacidad de proceso que requiere este sistema.
Más información | OpenAI
Ver 13 comentarios
13 comentarios
palamos2000
tarda 9 horas para hacer canciones de verdad, en media hora te hace la discografia completa de maluma y bad bunny cantando afinado y sin autotune
manuelantoniomedinaguevara
no lo sé... suena a algo que haría un gorila con esquizofrenia
eufrasio
Solo he escuchado el de Rick Asley pero me parece un pastiche de trozos sin ton ni son.
Piter_Parking
la próxima canción que lo pete podría estar creada hasta por un chimpancé....
enmadrid
Ah, sí solo son 1.2 millones de canciones.
Usuario desactivado
Bueno... después de escuchar los audios unas cuantas veces, y como profesional de la música... puedo decir con contundencia lo siguiente :
Si se trata de COPIAR e IMITAR, los humanos seguimos estando a años luz de estas IA 👼 ya ni te digo en cuanto a crear material original.
Lo siento, Skynet aún nos queda muy lejos.