Articles

AI everywhere: El sigiloso advenimiento del Aprendizaje Profundo en la Industria de la música

Music Generation

El objetivo de los investigadores en esta área es generar artificialmente música con sonido humano o algo específico del artista, como una de las composiciones de Mozart. Algunos de los enfoques en esta área incluyen:

Magenta:

Un proyecto de investigación de código abierto que explora el papel del aprendizaje automático como herramienta en el proceso creativo.

Este proyecto desarrollado por Google Brain tiene como objetivo crear una nueva herramienta para que los artistas la usen al trabajar y desarrollar nuevas canciones. Han desarrollado varios modelos para generar música. A finales de 2016, publicaron un modelo LSTM sintonizado con el Aprendizaje por refuerzo. La idea emocionante era utilizar el Aprendizaje por refuerzo para enseñar al modelo a seguir reglas específicas, al tiempo que le permitía retener la información aprendida de los datos. Magenta Studio también está disponible como un complemento en Ableton Live.

Musenet:

Musenet es una red neuronal profunda que puede generar composiciones musicales de 4 minutos con 10 instrumentos diferentes, y puede combinar estilos desde country hasta Mozart y los Beatles.

Este es un modelo de generación de música OpenAI. Utiliza arquitectura de PNL en forma de modelo de transformador a gran escala para predecir el siguiente token en una secuencia. Puede combinar estilos de diferentes compositores famosos, así como varios géneros musicales.

Popgun:

La tecnología de Popgun ayuda a todos a cantar, tocar instrumentos, componer canciones y dominar el audio

Esta startup con sede en Australia utiliza el aprendizaje profundo a través de una plataforma llamada ALICE para acompañar o aumentar composiciones musicales. ALICE trata de predecir lo que tocará un músico, trata de acompañar al músico y también intenta improvisar sobre lo que está tocando el músico.

Música Amper:

Amper Score ™ permite a los equipos empresariales componer música personalizada en segundos y recuperar el tiempo dedicado a buscar música de archivo.

Amper es una plataforma de composición musical basada en la nube y impulsada por IA. Según se informa, el sistema genera selecciones musicales únicas basadas en el estado de ánimo, el estilo y los parámetros de duración seleccionados por el usuario. Una vez realizadas estas selecciones, el usuario puede realizar ediciones adicionales antes de completar la composición.

Transmisión de música:

Foto por Zarak Khan en Unsplash

La entrada de la Inteligencia Artificial en el dominio de la Música en Streaming ha cambiado totalmente la transmisión de la experiencia de un usuario. Empresas de aplicaciones de streaming de música como Joox, QQ Music y KuGou han estado utilizando IA para analizar las preferencias de sus oyentes y recomendar listas de reproducción especialmente seleccionadas para una experiencia de cliente personalizada. Mediante el uso de motores de recomendación basados en IA, las aplicaciones de transmisión de música examinan el historial existente de los oyentes y recomiendan canciones nuevas. Spotify es un gigante de la música que ha tenido un gran éxito en esta área.

El verdadero impacto que ha tenido la IA es el uso de motores de filtrado, que escanean miles de canciones recién subidas para desarrollar listas de reproducción y recomendaciones dirigidas a cada individuo, eliminando la necesidad de que los oyentes naveguen por miles de canciones para elegir favoritas. Además, los motores de filtrado de IA no restringen la personalización a géneros individuales, sino que dan una definición completamente nueva a la palabra género, al generar una lista de reproducción de canciones supuestamente no relacionadas consideradas buena música por ese individuo. Apple Music ha estado optimizando su sección Para ti regularmente utilizando el principio anterior.

Endel es una startup de sonido firmada por Warner Music Group. Es un ecosistema de audio multiplataforma que crea entornos personalizados, basados en el sonido y adaptables que ayudan a las personas a concentrarse y relajarse. A pesar de que la música producida no era lo suficientemente buena para encabezar las listas o llegar al top 100 de Billboard, Warner firmó un contrato de 20 álbumes con la compañía. Este es el impacto de la IA en el mundo actual, donde la experiencia y la comodidad del usuario son de suma importancia.

Veamos más de cerca una de las plataformas de transmisión de música más grandes que utiliza activamente IA en sus productos.

Spotify

Foto por Heidi Aleta Unsplash

Spotify es un servicio de música digital que te da acceso a millones de canciones.

Spotify es la aplicación de servicio de música bajo demanda más importante de la actualidad. La empresa tiene un historial de superar los límites de la tecnología mediante el uso de inteligencia artificial y aprendizaje automático para mejorar la experiencia del usuario a través de conocimientos de datos de clientes matizados. Un gran éxito que habían logrado bastante temprano fue el lanzamiento de la lista de reproducción semanal Discover, que llegó a 40 millones de personas en el primer año de su introducción. Cada lunes, a los usuarios individuales se les presenta una lista personalizada de treinta canciones que incluye pistas que el usuario podría no haber escuchado antes, pero las recomendaciones se generan en función del patrón del historial de búsqueda del usuario y las preferencias de música potenciales. La generación de esta lista de reproducción es posible con una combinación de modelos de 3 ML: Filtrado Colaborativo, Procesamiento de Lenguaje Natural y Modelos de Audio.

Fuente: https://blog.galvanize.com/spotify-discover-weekly-data-science/

El algoritmo de filtrado colaborativo encuentra usuarios que son similares entre sí, en función de su uso, las canciones en común que han escuchado, y luego recomienda las canciones que solo una persona ha escuchado a la otra. Al igual que con cualquier producto nuevo, Spotify también se enfrenta al problema del arranque en frío, donde uno no tiene datos de usuario sobre los que actuar. Para hacer frente a esto, Spotify utiliza CNN (Red Neuronal Convolucional) y las ejecuta sobre la acústica de una canción para analizar canciones con patrones acústicos similares para la recomendación.

En términos de PNL, utiliza una técnica llamada Word2Vec, que toma palabras y las codifica en un vector. Por lo tanto, es más probable que los vectores con una forma similar tengan el mismo significado. Toma listas de reproducción y las trata como un párrafo o un gran bloque de texto, y trata cada canción de la lista de reproducción como una palabra individual. Esto da como resultado representaciones vectoriales de canciones que se pueden usar para determinar dos piezas de música que son similares. Como tal, Spotify puede decidir qué canciones son similares entre sí, lo que le permite abordar el problema del arranque en frío y recomendar canciones con muy pocas reproducciones.

Los modelos de audio se utilizan para analizar datos de pistas de audio sin procesar y clasificar las canciones en consecuencia. Esto ayuda a la plataforma a evaluar todas las canciones para crear recomendaciones, independientemente de la cobertura en línea. Por ejemplo, si hay una nueva canción lanzada por un nuevo artista en la plataforma, los modelos de PNL podrían no atraparla si la cobertura en línea y en las redes sociales es baja. Sin embargo, al utilizar datos de canciones de modelos de audio, el modelo de filtrado colaborativo podrá analizar la pista y recomendarla a usuarios similares junto con otras canciones más populares.

Spotify también utiliza la detección de valores atípicos para diferenciar entre las cosas que realmente le gustan a un usuario. Por ejemplo, es probable que una canción de un género diferente con 1 o 2 reproducciones se denomine como un valor atípico y no se incluya en la generación de las listas de reproducción, ya que esto podría ser un error. Esto asegura que mi lista de reproducción semanal no se llene de canciones de K-pop en lugar de lanzamientos de Anjunabeats porque mi hermana decidió experimentar con mi cuenta 😄.

Monetización de la música

Foto de Samuel Ramos en Unsplash

Otra área bastante emocionante donde la IA ha echado raíces es la Monetización de la música. AI está ayudando actualmente a muchos artistas no descubiertos a firmar con grandes sellos discográficos y viceversa. Esto está sucediendo de muchas maneras, como la Masterización de audio asequible, que es un aspecto crucial en el campo de la producción de Música Electrónica de Baile, o a través de un Descubrimiento&R (Artista y Repertorio) donde se utiliza un algoritmo para revisar los datos sociales, de transmisión y de gira para encontrar talentos prometedores.

LANDR es una de las empresas que agiliza el proceso de mezcla y masterización para productores locales y subterráneos. Utiliza algoritmos de aprendizaje automático entrenados en los pasos estándar que un ingeniero de sonido utiliza para dominar la música. La masterización de pistas es gratuita para pistas MP3 de hasta 192 kbps de tamaño!. Una vista previa instantánea de la pista masterizada también está disponible después de que se cargue la canción.