Articles

AI everywhere: the stealthy advent of Deep Learning in The Music Industry

Music Generation

a kutatók célja ezen a területen az, hogy mesterségesen hozzanak létre emberi hangzású zenét vagy valami művész-specifikus zenét, például Mozart egyik kompozícióját. Néhány megközelítés ezen a területen:

Magenta:

nyílt forráskódú kutatási projekt, amely feltárja a gépi tanulás mint eszköz szerepét a kreatív folyamatban.

ez a Google Brain által kifejlesztett projekt célja egy új eszköz létrehozása a művészek számára, hogy új dalokat dolgozzanak és fejlesszenek. Számos modellt fejlesztettek ki a zene létrehozására. 2016 végén közzétettek egy megerősítő tanulással hangolt LSTM modellt. Az izgalmas ötlet az volt, hogy a megerősítő tanulás segítségével megtanítsák a modellt konkrét szabályok betartására, miközben továbbra is lehetővé teszik az adatokból tanult információk megőrzését. A Magenta Studio pluginként is elérhető az Ableton Live – ban.

Musenet:

a Musenet egy mély neurális hálózat, amely 4 perces zenei kompozíciókat képes létrehozni 10 különböző hangszeren, és kombinálhatja a stílusokat a country-tól Mozartig a Beatlesig.

ez egy OpenAI zenei generációs modell. NLP architektúrát használ nagyszabású transzformátor modell formájában, hogy megjósolja a következő tokent egy sorrendben. Meg lehet kombinálni stílusok különböző híres zeneszerzők, valamint a különböző zenei műfajok.

Popgun:

a Popgun technológiája mindenkinek segít énekelni, hangszereken játszani, dalokat komponálni és mesterhangot készíteni

ez az ausztrál székhelyű startup mély tanulást használ az ALICE nevű platformon keresztül, hogy kísérje vagy bővítse a zenei kompozíciókat. ALICE megpróbálja megjósolni, hogy egy zenész mit fog játszani, megpróbálja kísérni a zenészt, és megpróbálja improvizálni, amit a zenész játszik.

Amper Zene:

az amper Score (amper Score) lehetővé teszi a vállalati csapatok számára, hogy másodpercek alatt egyedi zenét állítsanak össze, és visszaszerezzék a stock zene keresésével töltött időt.

az Amper egy felhőalapú, AI-vezérelt zenei kompozíciós platform. A rendszer állítólag egyedi zenei válogatásokat generál a felhasználó által kiválasztott hangulat, stílus és időtartam paraméterek alapján. Miután ezeket a beállításokat elvégezték, a felhasználó további szerkesztéseket végezhet a kompozíció befejezése előtt.

Zenei Streaming:

fotó: Zarak Khan az Unsplash oldalon

a mesterséges intelligencia belépése a zenei Streaming területére teljesen megváltoztatta a felhasználó streaming élményét. Az olyan zenei streaming alkalmazáscégek, mint a Joox, a QQ Music és a KuGou, az AI segítségével elemezték hallgatóik preferenciáit, és speciálisan kurált lejátszási listákat javasoltak a személyre szabott felhasználói élmény érdekében. Az AI-alapú ajánlómotorok használatával a zenei streaming alkalmazások megvizsgálják a hallgatók meglévő történetét, és új dalokat ajánlanak. A Spotify egy zenei óriás, amely rendkívül sikeres volt ezen a területen.

az AI valódi hatása a szűrőmotorok használata, amelyek több ezer újonnan feltöltött zeneszámot vizsgálnak át, hogy lejátszási listákat és ajánlásokat fejlesszenek ki az egyes személyek számára, így a hallgatóknak nem kell több ezer dalt böngészniük a kedvencek kiválasztásához. Ráadásul, az AI szűrőmotorok nem korlátozzák a személyre szabást egyetlen műfajra, hanem egy teljesen új meghatározást adnak a műfaj szónak, az állítólag nem kapcsolódó dalok lejátszási listájának létrehozásával, amelyet az egyén jó zenének tart. Az Apple Music rendszeresen optimalizálja az Ön számára részt a fenti elv felhasználásával.

az Endel egy hangindító, amelyet a Warner Music Group írt alá. Ez egy cross-platform audio ökoszisztéma, amely személyre szabott, hangalapú, adaptív környezetet teremt, amely segít az embereknek koncentrálni és pihenni. Annak ellenére, hogy az előállított zene nem volt elég jó a toplisták élére vagy a Billboard top 100-ba való bejutáshoz, Warners 20 albumszerződést írt alá a céggel. Ez az AI hatása a mai világban, ahol a felhasználói élmény és a kényelem rendkívül fontos.

nézzük meg közelebbről az egyik legnagyobb zenei streaming platformot, amely aktívan használja az AI-t a termékeikben.

Spotify

fotó: Heidi Fin az Unsplash oldalon

a Spotify egy digitális zenei szolgáltatás, amely több millió dalhoz biztosít hozzáférést.

a Spotify ma a legjelentősebb igény szerinti zenei szolgáltatás. A cég a technológia határait feszegeti az AI és a gépi tanulás segítségével, hogy árnyalt ügyféladatokkal javítsa a felhasználói élményt. Az egyik nagy siker, amelyet meglehetősen korán értek el, a Discover Weekly lejátszási lista elindítása volt, amely elérte 40 millió ember az első évben. Minden hétfőn, az egyes felhasználók egy testreszabott listát kapnak harminc dalból, amely olyan zeneszámokat tartalmaz, amelyeket a felhasználó esetleg még nem hallott, de az ajánlások a felhasználó keresési előzményeinek mintája és a lehetséges zenei preferenciák alapján készülnek. A lejátszási lista létrehozása 3 ML-es modellek kombinációjával lehetséges: kollaboratív szűrés, természetes nyelvi feldolgozás és Audio modellek.

forrás: https://blog.galvanize.com/spotify-discover-weekly-data-science/

az együttműködő szűrési algoritmus megkeresi azokat a felhasználókat, akik hasonlóak egymáshoz, használatuk alapján — a közös dalok, amelyeket hallgattak—, majd azokat a dalokat ajánlja, amelyeket csak egy ember hallgatott meg a másiknak. Mint minden új termék esetében, a Spotify is szembesül a hidegindítás problémájával, ahol nincs felhasználói adat, amelyre reagálni lehetne. Ennek kezelésére a Spotify a CNN-t (Convolutional Neural Network) használja, és futtatja őket egy dal akusztikáján, hogy elemezze a hasonló akusztikai mintázatú dalokat az ajánláshoz.

az NLP szempontjából a Word2Vec nevű technikát használja, amely a szavakat vektorba kódolja. Tehát a hasonló alakú vektoroknak nagyobb valószínűséggel ugyanaz a jelentése. A lejátszási listákat bekezdésként vagy nagy szövegblokkként kezeli, és a lejátszási lista minden egyes dalát egyedi szóként kezeli. Ez olyan dalok vektorábrázolását eredményezi, amelyek felhasználhatók két hasonló zenemű meghatározására. Mint ilyen, a Spotify eldöntheti, hogy mely dalok hasonlítanak egymásra, így lehetővé teszi a hidegindítás problémájának kezelését, és nagyon kevés lejátszású dalokat ajánl.

az Audio modellek a nyers hangsávok adatainak elemzésére és a dalok ennek megfelelő kategorizálására szolgálnak. Ez segít a Platformnak az összes dal értékelésében, hogy ajánlásokat hozzon létre, függetlenül az online lefedettségtől. Például, ha van egy új dal, amelyet egy új előadó adott ki a platformon, az NLP modellek nem fogják el, ha az online és a közösségi médiában alacsony a lefedettség. Az audio modellekből származó daladatok felhasználásával azonban az együttműködő szűrési modell képes lesz elemezni a zeneszámot, és más népszerű dalok mellett ajánlani a hasonló felhasználóknak.

a Spotify a kiugró észlelést is használja, hogy megkülönböztesse azokat a dolgokat, amelyeket a felhasználó valóban szeret. Például egy másik műfajú, 1 vagy 2 darabot tartalmazó dalt valószínűleg kiugrónak neveznek, és nem szerepelnek a lejátszási listák generálásában, mivel ez csak téves kattintás lehet. Ez biztosítja, hogy a heti lejátszási listám ne legyen tele K-pop dalokkal az Anjunabeats kiadások helyett, mert a nővérem úgy döntött, hogy kísérletezik a Fiókom használatával.

zenei bevételszerzés

fotó: Samuel Ramos on Unsplash

egy másik nagyon izgalmas terület, ahol az AI gyökeret vert, a zenei bevételszerzés. Az AI jelenleg sok felfedezetlen művésznek segít abban, hogy nagy lemezkiadókhoz szerződjenek, és fordítva. Ez sok szempontból megtörténik, mint például a megfizethető Audio Mastering, amely kulcsfontosságú szempont az elektronikus tánczene előállításában, vagy egy& R (művész és repertoár) felfedezés révén, ahol egy algoritmust használnak a társadalmi, streaming és touring adatok áttekintésére, hogy ígéretes tehetségeket találjanak.

a LANDR egyike azoknak a vállalatoknak, amelyek egyszerűsítik a keverési és mastering folyamatot a helyi és földalatti termelők számára. ML algoritmusokat használ, amelyeket a hangmérnök a zene elsajátításához használ. Mastering pályák ingyenes MP3 pályák akár 192 kbps méretű!. Az elsajátított szám azonnali előnézete A dal feltöltése után is elérhető.