Big Data: Die Potentiale von Daten verstehen, Projekte daraus verwirklichen und seine Daten entfalten.

„We Experiment On Human Beings!“. Dies gab jüngst einer der Chefs von OKCupid, Christian Rudder, in einem Blogtext zu. In den USA gehört OKCupid zu den beliebtesten Partnerbörsen und belegt gegenwärtig Platz 123 der meistbesuchten Seiten insgesamt. Was sie von anderen Anbietern unterscheidet, ist die relativ offenherzige Erklärung darüber, auf welche Art und Weise ihr Algorithmus funktioniert.

„Aus Big Data wird Big Dating“ – dazu hat Tobias Hauck hier im Big Data Blog erst kürzlich einen lesenswerten Artikel verfasst. Der Algorithmus ist das Herzstück einer Online-Partnerbörse. Er  nimmt dem Benutzer das stundenlange Suchen ab und liefert Vorschläge, bei denen die Kontaktaufnahme möglichst viel Erfolg verspricht. Doch funktioniert das Kennenlernen, weil der vorgeschlagene Partner wirklich zu einem passt, oder eher deshalb, weil beide aufgrund des Vorschlags einfach glauben, dass sie füreinander bestimmt sind?

Liebes-Spiele für die Wissenschaft

OKCupid hat nun bei Benutzern das Ergebnis des Algorithmus manipuliert. Wer rechnerisch zu nur 30% übereinstimmte, bekam stattdessen einen Wert von 60% oder 90% angezeigt – oder auch umgekehrt. Dann wurde gemessen, wie sich die Konversation änderte. Als tatsächliche Konversation galt das Austauschen von mindestens vier Nachrichten.

Erhöht also der Algorithmus tatsächlich die Chance, dass zwei gut zueinander passende Personen einander finden? Oder könnte auch ein willkürliches Ergebnis angezeigt werden, da die Nutzer ihr Konversationsverhalten ohnehin danach ausrichten? Erfreulicherweise hat OKCupid die Ergebnisse dieses Experiments detailliert in einer Tabelle veröffentlicht.

Diese Tabelle zeigt zunächst die Chance auf eine Konversation, wenn zwei Nutzer tatsächlich laut Algorithmus eine Kompatibilität von 30%, 60% oder 90% besitzen. Sie beträgt 10%, 13% oder 20%. Offenbar ist der Wert des Algorithmus nicht direkt übertragbar: Auch bei einem Ergebnis von 90% wird nur aus jeder fünften Anfrage eine Konversation. Andererseits steigt diese Chance mit zunehmender, rechnerischer Kompatibilität tatsächlich an.

Kann Statistik die Kontakt-Chance erhöhen?

Wie verändern sich nun die Chancen, wenn statt des tatsächlichen Wertes ein manipulierter Wert angezeigt wird? Bei einer tatsächlichen Kompatibilität von 60% sind die Unterschiede gering. Die Chance von 13% bleibt dieselbe, wenn stattdessen ein niedrigerer Wert von 30% angezeigt wird. Bei 90% steigt hingegen die Chance um drei Prozentpunkte auf 16% an.

Spannend wird es bei den Extremfällen. Zeigt OKCupid zwei Benutzern, die eigentlich zu 30% zusammenpassen, stattdessen einen Wert von 90% an, so steigt die Chance auf eine Konversation von 10% auf 17%. Hätten die beiden aber tatsächlich zu 90% „zusammengepasst“, dann wäre die Chance bei 20% gelegen. Damit besitzt der Algorithmus gegenüber dem manipulierten Wert einen Vorsprung von relativ gesehen knapp 18%. Dies ist also dessen „Eigenleistung.“

Im umgekehrten Fall, wenn 30% statt der „wahren“ 90% angezeigt werden, sind die Unterschiede noch stärker: Statt der erwarteten Konversations-Chance von 10% beträgt die tatsächliche Chance nun 16% und hat sich damit relativ um 60% erhöht. Wieder bestätigt das, dass der Algorithmus mehr leistet als der Zufall: Wer zu 90% zusammenpasst, wird auch eher eine Konversation beginnen; selbst wenn OKCupid nur einen niedrigen Wert anzeigt.

Big Data – eine echte Chance für die Liebe

Der Algorithmus liefert also einen deutlichen Mehrwert gegenüber rein zufälligen Partnervorschlägen. Das hat OKCupid durch dieses Experiment nachgewiesen, auch wenn über die Hälfte der Konversationen bereits ohne den Algorithmus stattgefunden hätte. Dieses Fazit zieht selbstkritisch auch der OKCupid-Blogger. Sicher kann man über den ethischen Aspekt eines solchen unfreiwilligen Experimentes streiten. Andererseits lässt sich nur durch solche Versuche und eine gründliche statistische Auswertung überprüfen, ob eine bestimmte Methode auch wirklich funktioniert und ihr Geld wert ist.

Weiterführende Links:

Dieses und ähnliche Experimente

Algorithmus bei OKCupid und allgemein

Rechtliches

Singlebörsen im Vergleich