Az elmúlt héten a Spotify minden felhasználójának elküldött egy elemzést a 2019-es hallgatási szokásaikról. Innen jött az ötlet: mi lenne, ha elemezném a saját lejátszási listámat és benne összefüggéseket keresnék? Hátha kiderül valami érdekes az adatokból.
Hogyan szerezzük meg az adatainkat?
Az első lépés, hogy a Spotify API-n keresztül létrehozok egy datasetet az egyik kedvenc lejátszási listámról. Ehhez, írtam egy Python szkriptet ami a Spotify Library segítségével kapcsolódik az API-hoz, kilistázza a lejátszási listámban lévő számokat, és hozzákapcsolja a Spotify által biztosított audio jellemzéseket. A kód megtalálható a GitHub-on a következő helyen: kattints ide.
A projekthez az általam 5 legfontosabbnak tartott változókat tervezem használni.
- Acousticness: Egy 0.0 és 1.0 közötti konfidencia érték, ami azt mutatja, hogy az adott számra mennyire jellemző az, hogy akusztikus. Ha az érték 1.0, akkor szinte biztos, hogy az adott szám akusztikus.
- Danceability: Ez a változó azt hivatott mérni, hogy az adott szám mennyire táncolható, pár zenei jellemző alapján, mint például a tempo, ritmus, ütem. Ha az érték 0.0, akkor kevésbé, ha 1.0, akkor táncolható a zene.
- Liveness: Azt mutatja, hol lett felvéve a dal. Ha az érték magasabb, akkor nagyobb az esélye annak, hogy a szám élő felvétel volt. Ha az érték 0.8 fölött van, akkor ez szinte biztosan állítható.
- Loudness: A változó a szám átlagos decibel tartományát veszi figyelembe. Így kapunk egy képet a számról, hogy mennyire erőteljes vagy lassú, és emiatt jó összehasonlítási alapot ad. Az érték -60 és 0 között alakul.
- Speechiness: Itt a beszéd van detektálva az adott számban. 0.66 érték fölött nagy valószínűséggel mondhatjuk, hogy a számban többnyire a szöveg dominál. A 0.33 és 0.66 tartományban mind zenét és mind szöveget tartalmazhatnak, ide tartozik például a rap. Ha az érték 0.33 alatt van, akkor nagy valószínűséggel állíthatjuk, hogy az adott szám instrumentális.
A Spotify biztosít további változókat is. Forrás: Spotify API Documentation
Ezek után, nézzük milyen értékeket kaptak a lejátszási listámban szereplő számok. A következő kép az első 20 számot mutatja.
A folytatásban vizualizálom majd, egymáshoz képest hogyan is helyezkednek el a számok, illetve klaszterezem az egymáshoz közel állókat. A végén meg fogom tudni mondani, hogy a különböző klaszterek milyen hangulatomat tükrözhetik.
Comments are closed.