Deezer, ecco l’IA che rileva l’umore della musica

Usando reti neurali si riesce a capire meglio quali emozioni si associano a ogni brano, e con quanta intensità. Presto potrebbe aiutare a creare playlist migliori.

Deezer abbraccia l’intelligenza artificiale per studiare la correlazione fra musica e umore. I ricercatori del servizio musicale lanciato oltre dieci anni fa hanno infatti lavorato ad un sistema di in grado di associare determinate canzoni a particolari stati d’animo.

Per valutare “l’umore di una canzone” i ragazzi di Deezer hanno preso in considerazione sia il segnale audio che i testi. Per cominciare, hanno alimentato segnali audio in una rete neurale, insieme a modelli che ricostruiscono i contesti linguistici delle parole.

In questo modo, per insegnare all’IA come riconoscere l’atmosfera di una canzone, hanno usato il Million Song Dataset (MSD), che è una raccolta di metadati per oltre 1 milione di canzoni contemporanee. Nello specifico, il set di dati utilizzato è quello di Last.fm, il quale assegna gli identificatori (titoli di canzoni, nomi di artisti e titoli di album) alle tracce di oltre 500mila tag unici.

Molti di questi tag, a loro volta, sono legati all’umore e oltre 14 mila parole inglesi di questi tag hanno ricevuto due valutazioni: quanto è negativa o quanto è positiva una parola, e anche quanto è calma o energica. Da sottolineare che l’MSD contiene metadati per le canzoni, ma non le canzoni stesse. A questi metadati è stato allora aggiunto il catalogo Deezer.

In questo modo i ricercatori di Deezer hanno concluso che l’IA era in grado di riconoscere quanto una canzone fosse energica o calma in maniera più efficace rispetto agli approcci tradizionali, senza appunto l’ausilio dell’intelligenza artificiale.

La ricerca non è ovviamente fine a se stessa ma va da se che, in un futuro prossimo, Deezer potrebbe sfruttare questa nuova tecnologia. Grazie allo studio di Deezer, si è infatti scoperto che le reti neurali mostrano un notevole vantaggio nel riconoscere l’intensità emotiva della parte strumentale.

I sistemi tradizionali, invece, sono migliori nell’interpretazione dei testi – o per meglio dire di alcune parole chiave – usati per determinare se l’emozione di un brano è positiva o negativa.