Big Data: Die Potentiale von Daten verstehen, Projekte daraus verwirklichen und seine Daten entfalten.

Wer dachte, die Zeiten penetranter Radiowerbung à la Seitenbacher, Hornbach und Mömax seien mit Spotify und anderen Streamingdiensten vorbei, der irrt. Der genusssüchtige Spotify-Gratisnutzer und geneigte Klassikliebhaber wird zwischen den Sätzen eines Bach-Violinkonzertes durch Ballermanhits geschockt: Werbung. Inklusive der penetrantesten Refrains. Dass das in Zeiten von Service-Customization und Empfehlungsalgorithmen nötig ist, verstört den Geigenfreund – gelinde gesagt.

Big Data krempelt die Musikindustrie um, seit sich diese auf die Digitalisierung eingelassen hat. Dafür haben im letzten Jahr mehrere Analyseunternehmen den Besitzer gewechselt: Spotify hat The Echo Nest für 100 Mio. Dollar gekauft. Music Metrics war einer der Pioniere. Der Mitbewerber Music Analytics wurde von Techcrunch zuletzt auf 1.8 Milliarden Dollar Marktwert geschätzt. Aber warum genau?

Streamingdienste sind das neue Zuhause der Musik. Ein Browser ähnlich Firefox oder Chrome – allein für Musik. Alle Alben, alle Richtungen, jede Epoche. 20 bis 30 Millionen Stücke. Die annähernd erschöpfenden Musiksammlungen sind ein Panoptikum: Jeder Klick, jede Cursorbewegung, jede Songauswahl, Sucheingabe und Songunterbrechung, Lautstärkeregelung und jedes Nutzerprofil sind auswertbar: Spotify macht in Echtzeit sichtbar, was bisher verborgen war: Die ganz private Nutzung von Musik. Und die verändert sich rasant – jetzt steht viel auf dem Spiel. Der nächste Nummer Eins-Hit. Die Gewinnung zahlender Kunden für die Musikflatrate oder eben die Optimierung von Werbung und Empfehlungen.

Wie weitreichend die Folgen schon heute sind, zeigt ein Blick in die Musikindustrie. Als Künstler gewinnt man die Möglichkeit, live zu sehen, welche Songs wo wie populär sind. Man wird demographische Informationen über die Fans bekommen und so die immer wichtiger werdenden Live-Auftritte strategisch und zielgenau planen. Die Verknüpfung der Dienste mit Facebook und Twitter demaskiert das Publikum und führt es geradewegs in eine noch immersivere Klangwelt.

Aus Rezensionen, Konzertverkäufen, Radio, Streaming, Pirateriedaten natürlich der Social Media-Performance eines Künstlers lässt sich die Entwicklung von Songs ableiten. Der Nummer-1-Hit in drei Monaten ist mit 90-prozentiger Wahrscheinlichkeit schon bekannt. Ebenso wie die Spotify in der Lage war, die Grammy-Gewinner 2013 mit einer Fehlerquote von 33% vorherzusagen. Problemlos können Versuchs- und Kontrollgruppen gebildet werden, um auszuprobieren wir ein neues Webdesign, ein neuer Künstler etc. wo ankommt.

Spotify-Nutzer hinterlassen 600 GB an Daten – pro Tag!

Und 28 Petabyte ist die Speichermenge der vier Datencenter des Unternehmens. Too Big Data um mit herkömmlichen Methoden unter Zeitdruck auszuwerten. Luigi heißt die Hauseigene Lösung: Ein in Python geschriebene Datenflussbett, dass in der Lage ist viel zu kanalisieren, zu steuern und auszulesen. Die meisten der Daten sind Nutzerbezogen und erlauben es, individuelle Playlists zu empfehlen und Geschäftsentscheidungen zu treffen. Der große Streamingpool schwächt so zwar die Marktmacht der Plattenfirmen – sie können keine exklusiven Einzelpakete und CDs mehr verkaufen – aber dafür gewinnen sie Einblicke in aktuellste Trends. Der richtige Künstler, der richtige Song – heute eine Frage er Datenauswertung und der Experimentierweise.

Zwischen 20 und 30 Millionen Musikstücke haben die Anbieter Spotify, Simfy, Rdio, Deezer und Napstar im Angebot. Und es gibt noch mehr. Die größten haben 40 Millionen Nutzer – zahlende und nichtzahlende Kunden – die dafür Werbung und bestimmten Restriktionen ausgesetzt werden.