20. September 2021
Wie und wo Spotify Künstliche Intelligenz nutzt

Wie und wo Spotify Künstliche Intelligenz nutzt

Spotify ist mit 345 Millionen aktiven Nutzern, von denen 155 Millionen zahlende Abonnenten sind1, der größte Audio-Streaming-Abonnementdienst der Welt. 2006 gegründet, können heute neben Musik auch Hörbücher, Podcasts und Videos plattformübergreifend gestreamt werden. Der Pionier der Audio-Streaming-Revolution ist aktuell in 170 verschiedenen Ländern verfügbar. Spotify benutzt ein Freemium-Modell. Einfache und grundlegende Dienstleistungen sind kostenlos und werbefinanziert, erweiterte oder zusätzliche Funktionen sind Teil eines „Premium“-Angebots. Was Spotify so erfolgreich macht, ist der intensive und kreative Einsatz von Künstlicher Intelligenz. Wie und wo Spotify Künstliche Intelligenz nutzt, erfahren sie in diesem Artikel.

Spotify und der Datenschatz

Mit Millionen täglichen Nutzern, deren Daten permanent gemonitored werden, sitzt Spotify auf einem Datenschatz, der sich aus Songpräferenzen, Keyword-Präferenzen, Playlist-Daten, dem geografischen Standort der Hörer, den meistgenutzten Geräten und weiteren Daten-Bausteinen zusammensetzt. Diese Datenschätze, die durch den Netzwerkeffekt täglich anwachsen, sind die Basis für das Training der Algorithmen, die die Plattform jeden Tag besser machen. Spotify und KI – ein Dreamteam.

Discover Weekly  und Empfehlungen

Ein riesiger KI Erfolg für Spotify ist „Discover Weekly“, das schon im ersten Jahr seiner Einführung 40 Millionen Menschen erreicht hat. Jeden Montag erhält jeder Benutzer eine aktuelle Wiedergabeliste mit neuen empfohlenen Liedern, auf Basis seiner/ ihrer Hörgeschichte. Die Empfehlungen werden auf der Grundlage des Suchverlaufs und der potenziellen Musikpräferenz des Benutzers generiert.

Es handelt sich dabei um  ein Machine Learning-Empfehlungssystem, welches sich selbst verbessert, wie man es z.B. auch vom Online Shopping bei Amazon kennt. Diese intelligente Anwendung  sorgt nicht nur dafür, dass die Nutzer wiederkehren, sondern ermöglicht es ihnen auch auch, Musiker und Songs zu entdecken, die sie möglicherweise gar nicht organisch gesucht hätten. Das heißt aber auch, dass die Spotify-Algorithmen unseren Musikgeschmack beeinflussen.

Collaboratives Filtern
Spotify trackt den Hörverlauf der eingeloggten User
Spotify trackt den Hörverlauf der eingeloggten User

Beim collaborativen Filtern  werden die Hörverläufe und Verhaltensweisen bestehender User gemessen und mit anderen verglichen. Auch hier gibt es parallelen zum Online Shopping („Kunden, die diesen Artikel angesehen haben, haben auch angesehen …“) oder auch zu den Empfehlungsmodellen von Netflix. Doch auch  wenn Spotify kein klassisches Sterne-Bewertungssystem für Songs verwendet, nutzt es implizites Feedback – wie z. B. die Anzahl, wie oft man einen bestimmten Song gespielt hat, einen Song in seiner Playlist gespeichert oder auf die Seite des Künstlers geklickt hat usw. Um so relevante Empfehlungen für andere User zu geben, die als „ähnlich“ eingestuft wurden.

30 Sekunden, die entscheiden …

Der sogenannte “BaRT-Algorithmus “ist für Streams von mehr als 30 Sekunden optimiert. Das heißt, wenn sie ein Lied länger als 30 Sekunden anhören (Spotify nennt diesen Punkt „Sweet Spot“), glaubt der Algorithmus, dass es ihnen gefällt. Und je länger sie die empfohlene Wiedergabeliste oder eine Reihe von Songs anhören, desto besser wird diese Empfehlung bestimmt. Er trainiert dann das ML-Modell einmal täglich neu, auf der Grundlage der gesammelten Interaktionsdaten. Die Aufgabe von BaRT (Bayesian Additive Regression Trees) ist es also, den Startbildschirm für jeden Nutzer individuell und personalisiert zu gestalten.

NLP (Natural Language Processing), Cultural Vectors und Top Terms

Natural Language Processing, kurz NLP, beschreibt die Fähigkeit von Computern, mit gesprochenem oder geschriebenem Text zu arbeiten. Dabei kommen Machine Learning Techniken zum Einsatz. Die KI von Spotify scannt die Metadaten eines Musiktitels, Nachrichtenartikel über Künstler oder Songs, aber auch Blogbeiträge und Diskussionen über bestimmte Musiker und Themen und wertet sie linguistisch aus.

spotify cultural vectors
Quelle: “Cultural vectors” or “top terms,” as used by the Echo Nest. Image source: How music recommendation works — and doesn’t work, by Brian Whitman, co-founder of The Echo Nest.

 

In dieser Bewertung entstehen Schlüsselwörter, die man bei Spotify als „kulturelle Vektoren“ und „Top-Begriffe“ bezeichnet. Jeder Künstler und jeder Song wird dann mit diesen Begriffen assoziiert, die sich täglich ändern können. So stuft die Spotify KI zum Beispiel den Song „Dancing Queen“ von Abba als „nonviolent“ und „swedish pop“ ein. Das Geniale daran ist, dass Spotify dafür kein festes „Wörterbuch“ hat, sondern die KI ist in der Lage, neue Musikbegriffe zu identifizieren, sobald sie auftauchen.


David-Bowie-Verbasizer
David-Bowie-Verbasizer, Quelle: https://youtu.be/x3IKLMgFaDA

Infobox

Wussten Sie, dass der legendäre Musiker David Bowie  schon 1977 Künstliche Intelligenz zur Erstellung von Liedertexten genutzt hat? Zusammen mit Ty Roberts entwickelte er die Mac App „Verbasizer“. Die Ergebnisse erschienen auf drei Alben aus dieser Zeit, von 1977-1979, „Low“, „Heroes“ und „Lodger“, der sogenannten „Berliner Trilogie“, die heute zu den besten Werken von Bowie zählen. Der Verbasizer half Bowie, z.B. den Text des Songs „Outside“ zu schreiben.

Mehr Info HIER!

 


Das KI-Audio Modell

Eines der ursprünglichen Probleme bei Spotify bestand darin, dass jeden Tag neue Musik auf Spotify hochgeladen wurde, es aber kein System gab, um Musik zu empfehlen, wenn sie nicht von einem schon zuvor populären Künstler stammte. So entstand die Idee, Audiomodelle zu verwenden, um Daten aus rohen Audiospuren zu analysieren und Songs entsprechend zu klassifizieren und kategorisieren. Zum Beispiel werden Lieder mit hohem Rhythmus, akustisch oder energetisch unter einer Kategorie zusammengefasst, dann arbeitet das Künstliche Neuronale Netz effizient daran, Lieder in entsprechende Gruppen einzuordnen.

Auch KünstlerInnen mit geringerem Bekanntheitsgrad haben bei Spotify eine faire Chance, gehört zu werden.

Dies hilft der Plattform, alle Songs unabhängig von ihrer Online-Reichweite zu bewerten, also z.B. wenn ein Künstler/eine Künstlerin noch keinen hohen Bekanntheitsgrad hat. Durch die Nutzung von Songdaten aus Audiomodellen kann das kollaborative Filtermodell den Song analysieren und ihn ähnlichen Nutzern zusammen mit anderen populäreren Songs empfehlen.

Spotify Code und Bilderkennung – KI als Basis
Noah 9000 Spotify Code
So sieht ein Spotify Code aus

Jedes Album und jeder Song hat einen eigenen Code, den die Kamera des Smartphones auslesen kann. Spotify hat die Codes bereits 2017 eingeführt. Sie sollen die Benutzer dazu animieren, Musik mit der Familie und Freunden zu teilen. Der Aufruf des Spotify-Codes in der App auf einem Smartphone  ist denkbar einfach:

1. Die Suche (Lupen-Symbol) in der Spotify-App öffnen
2. Auf das Kamera-Symbol (oben rechts) in der Suchen-Leiste tippen
3. Smartphone-Kamera auf den Spotify-Code richten

Werbetreibende können dieses Feature für Werbeaktionen (Druck auf Plakate, Flyer, Folder) sinnvoll einsetzen. Ein Spotify-Code funktioniert dabei ähnlich wie ein QR-Code, sieht aber völlig anders aus. Zudem ist er nur auf die Plattform beschränkt und somit einzigartig. Zur Entstehung und Entwicklung des Codes, der ebenfalls auf KI basiert, gibt es auch eine kleine Beschreibung des Entwicklers selbst, der bei Reddit aus dem Nähkästchen plaudert.

Spotify nutzt KI-Bilderkennung
Beispiel für die Anwendung eines Spotify Codes auf dem Smartphone. Der Aufruf der Playlist Singularity is near

Streaming Intelligence  – Für Werbetreibende sind diese Daten Gold wert

Nicht-Premium User konsumieren auf Spotify Musik mit Werbeeinschaltungen, das sind aktuell 190 Mio. Nutzer weltweit. Unter „Streaming Intelligence“ versteht Spotify, wie und was Menschen hören. Unzählige, individuelle Datenpunkte sorgen dafür, dass die Auslieferung von Werbemitteln intelligent im Sinne des Werbetreibenden und Konsumenten abläuft. Mit Audio-Streaming kann man so als Werber die Botschaft genau auf den Kontext der gewünschten Zielgruppe abstimmen.

Spotify mit KI an der Spitze des Streaming Marktes

Spotify, der größte On-Demand-Musikdienst der Welt, hat in der Vergangenheit immer wieder technologische Grenzen überschritten. Der Einsatz von Künstlicher Intelligenz hat maßgeblich zum  Erfolg der Plattform beigetragen. Maschinelles Lernen, das sowohl auf den Nutzerdaten als auch auf externen Datenquellen basiert, ist zum pochenden Herz des Spotify-Angebots geworden. Es hilft Künstlern, ihr Publikum und ihre Reichweite besser zu verstehen und entdeckt zu werden, während Spotify durch ein tiefes Verständnis seiner Kundenbasis und prädiktive Empfehlungen, die die Nutzer zum Wiederkommen bewegen, an der Spitze des Musikstreaming-Marktes bleibt.

KI erkennt Gefühlslage anhand der Stimme – Spotify Patent

Spotify hat schon 2018 ein Patent eingereicht, welches  Google Assistant, Alexa und Siri herausfordern könnte. So soll ein eigener  Sprachassistent auf menschliche Emotionen reagieren können. Das Patent beschreibt ein „Medienwiedergabegerät“, das zum Beispiel erkennen kann, wenn ein Nutzer traurig klingt   – „Du scheinst ein wenig niedergeschlagen zu sein“ –  mit dem Ziel, ihn aufzumuntern.

„Die Erkennung von emotionalen Zuständen wird für Verbesserungen in der Spracherkennungs-Technologie immer wichtiger … und ist ein entscheidender Schritt auf dem Weg zu echter Konversations-KI“ – Simon Forrest, principal technology analyst at Futuresource Consulting2

Wenn die Stimmlage eines Users vermittelt, als hätte er es eilig, könnte der neue Spotify Sprachassistent versuchen, das Tempo zu halten, indem er schneller spricht oder in weniger Worten antwortet. Die im Spotify-Patent beschriebene Technologie wäre in der Lage, Emotionen aus dem Tonfall, der Kadenz, der Lautstärke und der Tonhöhe der Stimme eines Nutzers zu erkennen.

„Hey Spotify“- Sprachassistent

Es ist noch nicht bekannt, wann der Spotify Voice Assistant die Marktreife erlangt, aber allzugange werden wir wohl nicht darauf warten müssen. Die Forscherin Jane Manchung Wong, bekannt für Ihre Recherchearbeiten,  hat kürzlich einen Code für eine Sprachaktivierungsfunktion in der Spotify Mobile App entdeckt.

Im Hinblick auf die Zukunft darf man gespannt sein, was die Kreativen von Spotify noch in der Schublade haben. Besonders interessant scheinen dabei die Kreation von KI Musik und die Aufwertung von Podcasts zu sein. Weitere spannende Patente umfassen eine Karaoke-Funktion und eine Anwendung, bei der Jogger ihre Musik an das Lauftempo anpassen können.

1.) Quelle: Statista, https://de.statista.com/infografik/13769/monatlich-aktive-nutzer-und-zahlende-abonnenten-von-spotify-weltweit/
2.) Quelle: Forbes, https://www.forbes.com/sites/joshmandell/2020/03/12/spotify-patents-a-voice-assistant–that-can-read-your-emotions/?sh=3ae6ef538d5b

Weiterführende Links:

> Spotify Charts, Filterung nach Regionen möglich:
https://spotifycharts.com/regional/global/daily/latest

> Werbung auf Spotify:
https://ads.spotify.com/de-DE/

> Spotify Codes:
https://www.spotifycodes.com/

> Noah 9000, Sentimental Mood:
Künstliche Intelligenz komponiert Jazz Album

> How bad is your Spotify? Eine KI bewertet Ihren Musikgeschmack

Michael Katzlberger

Michael Katzlberger war von 2001-2021 Geschäftsführer von TUNNEL23, einer der führenden, meistausgezeichneten digitalen Kreativagenturen in Österreich. Seit 2016 widmet sich Katzlberger intensiv dem Thema Künstliche Intelligenz in der Kreativindustrie, berät Unternehmen und gibt sein Wissen in Seminaren, Lehrveranstaltungen und Gastvorträgen im In- und Ausland weiter. Sein Schwerpunkt liegt hierbei darauf, das Thema KI zu entmystifizieren, um es EPUs, KMUs und der breiteren Öffentlichkeit besser zugänglich zu machen.

Alle Beiträge ansehen von Michael Katzlberger →
%d Bloggern gefällt das: