Articles

AI everywhere: The stealthy advent of Deep Learning in the Music Industry

Music Generation

L’obiettivo dei ricercatori in questo settore è quello di generare artificialmente musica dal suono umano o qualcosa di specifico per l’artista, come una delle composizioni di Mozart. Alcuni degli approcci in questo settore comprendono:

Magenta:

Un open-source del progetto di ricerca esplorare il ruolo di machine learning come strumento nel processo creativo.

Questo progetto sviluppato da Google Brain mira a creare un nuovo strumento per gli artisti da utilizzare quando si lavora e si sviluppano nuove canzoni. Hanno sviluppato diversi modelli per generare musica. Alla fine di 2016, hanno pubblicato un modello LSTM sintonizzato con l’apprendimento di rinforzo. L’idea entusiasmante era quella di utilizzare l’apprendimento per rinforzo per insegnare al modello a seguire regole specifiche, pur consentendo di conservare le informazioni apprese dai dati. Magenta Studio è disponibile come plugin in Ableton Live anche.

Musenet:

Musenet è una profonda rete neurale in grado di generare 4 minuti di composizioni musicali con 10 strumenti diversi, e può combinare stili da paese a Mozart ai Beatles.

Questo è un modello di generazione di musica OpenAI. Utilizza l’architettura NLP sotto forma di un modello di trasformatore su larga scala per prevedere il token successivo in una sequenza. Può combinare stili di diversi compositori famosi e vari generi musicali.

Popgun:

Popgun la tecnologia aiuta tutti a cantare, suonare, comporre canzoni e master audio

Australiano-a base di avvio utilizza un profondo apprendimento attraverso una piattaforma chiamata ALICE per accompagnare o aumentare composizioni musicali. ALICE cerca di prevedere cosa suonerà un musicista, cerca di accompagnare il musicista e tenta anche di improvvisare su ciò che il musicista sta suonando.

Amper Musica:

Amper Punteggio™ consente il team enterprise per comporre musica personalizzata in pochi secondi e recuperare il tempo speso alla ricerca attraverso la musica di stock.

Amper è una piattaforma di composizione musicale basata su cloud e basata sull’intelligenza artificiale. Secondo quanto riferito, il sistema genera selezioni musicali uniche in base all’umore, allo stile e ai parametri di durata selezionati dall’utente. Una volta effettuate queste selezioni, l’utente può apportare ulteriori modifiche prima che la composizione sia completa.

Musica in streaming:

Foto di Zarak Khan Unsplash

La voce dell’Intelligenza Artificiale nel dominio di Musica in Streaming, ha completamente cambiato l’esperienza di streaming di un utente. Aziende di app per lo streaming musicale come Joox, QQ Music e KuGou hanno utilizzato l’IA per analizzare le preferenze dei loro ascoltatori e raccomandare playlist appositamente curate per un’esperienza cliente personalizzata. Utilizzando motori di raccomandazione basati su AI, le applicazioni di streaming musicale esaminano la cronologia esistente degli ascoltatori e raccomandano nuove canzoni. Spotify è un gigante della musica che ha avuto un enorme successo in questo settore.

Il vero impatto che AI ha fatto è l’utilizzo di motori di filtraggio, che scansionano migliaia di canzoni appena caricate per sviluppare playlist e raccomandazioni mirate a ogni individuo, eliminando la necessità per gli ascoltatori di sfogliare migliaia di canzoni per scegliere i preferiti. Inoltre, i motori di filtraggio AI non limitano la personalizzazione ai singoli generi, ma danno invece una definizione completamente nuova alla parola genere, generando una playlist di canzoni apparentemente non correlate considerate buona musica da quell’individuo. Apple Music ha ottimizzato regolarmente la sua sezione For You utilizzando il principio di cui sopra.

Endel è una startup sonora firmata da Warner Music Group. Si tratta di un ecosistema audio multipiattaforma che crea ambienti personalizzati, basati sul suono e adattivi che aiutano le persone a concentrarsi e rilassarsi. Anche se la musica prodotta non era abbastanza buona per superare le classifiche o arrivare alla top 100 di Billboard, Warners ha firmato un contratto di 20 album con la società. Questo è l’impatto dell’IA nel mondo di oggi, dove l’esperienza utente e il comfort sono della massima importanza.

Diamo un’occhiata più da vicino in una delle più grandi piattaforme di streaming musicale che utilizzano attivamente l’IA nei loro prodotti.

Spotify

Foto di Heidi Fin su Unsplash

Spotify è un servizio di musica digitale che consente di accedere a milioni di brani.

Spotify è l’applicazione di servizio musicale on-demand più significativa oggi. L’azienda ha un record di spingere i confini della tecnologia utilizzando l’intelligenza artificiale e l’apprendimento automatico per migliorare l’esperienza dell’utente attraverso approfondimenti sui dati dei clienti sfumati. Un grande successo che avevano raggiunto abbastanza presto è stato il lancio della Playlist settimanale Discover, che ha raggiunto 40 milioni di persone nel primo anno è stato introdotto. Ogni lunedì, ai singoli utenti viene presentato un elenco personalizzato di trenta canzoni che comprende brani che l’utente potrebbe non aver sentito prima, ma le raccomandazioni vengono generate in base al modello della cronologia di ricerca dell’utente e alle potenziali preferenze musicali. La generazione di questa playlist è possibile con una combinazione di modelli da 3 ML: filtraggio collaborativo, elaborazione del linguaggio naturale e modelli audio.

Fonte: https://blog.galvanize.com/spotify-discover-weekly-data-science/

Il filtraggio collaborativo algoritmo individua gli utenti che sono simili gli uni agli altri, in base al loro utilizzo — le canzoni che hanno in comune ascoltato — e suggerisce le canzoni che solo una persona ha ascoltato le altre. Come con qualsiasi nuovo prodotto, Spotify affronta anche il problema dell’avvio a freddo in cui non si hanno dati utente su cui agire. Per affrontare questo, Spotify utilizza CNN (Convoluzionale Rete neurale) e li corre sopra l’acustica di una canzone stessa per analizzare canzoni con modelli acustici simili per la raccomandazione.

In termini di PNL, utilizza una tecnica chiamata Word2Vec, che prende le parole e le codifica in un vettore. Quindi i vettori con una forma simile hanno più probabilità di avere lo stesso significato. Prende playlist e li tratta come un paragrafo o grande blocco di testo, e tratta ogni canzone nella playlist come una singola parola. Ciò si traduce in rappresentazioni vettoriali di canzoni che possono essere utilizzate per determinare due brani musicali simili. Come tale, Spotify può decidere quali canzoni sono simili tra loro, consentendo così di affrontare il problema di avviamento a freddo e raccomandare canzoni con pochissimi giochi.

I modelli audio vengono utilizzati per analizzare i dati delle tracce audio grezze e classificare le canzoni di conseguenza. Questo aiuta la piattaforma a valutare tutte le canzoni per creare raccomandazioni, indipendentemente dalla copertura online. Ad esempio, se c’è una nuova canzone rilasciata da un nuovo artista sulla piattaforma, i modelli di PNL potrebbero non prenderlo se la copertura online e nei social media è bassa. Utilizzando i dati dei brani da modelli audio, tuttavia, il modello di filtro collaborativo sarà in grado di analizzare la traccia e consigliarla a utenti simili insieme ad altre canzoni più popolari.

Spotify utilizza anche il rilevamento dei valori anomali per distinguere tra le cose che un utente ama effettivamente. Ad esempio, una canzone di un genere diverso con 1 o 2 giochi è probabile che sia definito come un outlier e non essere incluso nella generazione delle playlist come questo potrebbe essere solo un misclick. Questo fa in modo che la mia playlist settimanale non si riempia di canzoni K-pop invece delle versioni di Anjunabeats perché mia sorella ha deciso di sperimentare usando il mio account 😄.

Musica Monetizzazione

Foto di Samuel Ramos su Unsplash

l’Altro abbastanza emozionante area dove l’AI ha posto le sue radici, è la Musica Monetizzazione. AI sta attualmente aiutando molti artisti sconosciuti a firmare per grandi etichette discografiche e viceversa. Questo sta accadendo in molti modi come il mastering audio a prezzi accessibili che è un aspetto cruciale nel campo della produzione di musica dance elettronica o attraverso una scoperta&R (Artista e repertorio) in cui viene utilizzato un algoritmo per rivedere i dati sociali, in streaming e in tour per trovare talenti promettenti.

LANDR è una delle aziende che ottimizzano il processo di mixaggio e mastering per i produttori locali e underground. Utilizza algoritmi ML addestrati sui passaggi standard che un tecnico del suono utilizza per padroneggiare la musica. Mastering di tracce è gratuito per le tracce MP3 fino a 192 kbps di dimensioni!. Un’anteprima istantanea della traccia masterizzata è disponibile anche dopo il caricamento della canzone.