Erste-AM-Experte contra Big Data Wenn der Algorithmus zu viel weiß

Festplatten eines Daten-Servers: Big Data wird nicht nur für Investoren zu einem wichtigen Thema | © Pexels

Festplatten eines Daten-Servers: Big Data wird nicht nur für Investoren zu einem wichtigen Thema Foto: Pexels

„Wer nichts zu verstecken hat, der hat auch nichts zu befürchten.“ Was hat es mit diesem Argument auf sich? Schließlich bestimmt doch der User auf den Social Media Plattformen selbst, was er von sich preisgibt? Und warum sollte ich vor irgendjemandem verheimlichen, dass ich eine Vorliebe für Harley Davidson habe und gerne Musik vom Wu-Tang Clan höre?

Dieser Frage, nämlich ob die sogenannten „Likes“ auf Facebook mehr über einen Menschen aussagen, als die damit artikulierten Vorlieben, ging der Wissenschaftler Michael Kosinski an der University of Cambridge im Jahr 2012 nach (1). Dazu baute er mit Kollegen eine Facebook-App, die kostenlos ein Persönlichkeitsprofil erstellte, sofern der User sich bereit erklärte, einen Fragebogen auszufüllen und sein Facebookprofil zu teilen.

Anschließend suchte Kosinski nach statistischen Zusammenhängen zwischen den „Likes“ und den erhobenen Persönlichkeitsstrukturen. Die Ergebnisse sind verblüffend – anhand der „Likes“ war es möglich, mit einer 88 prozentigen Wahrscheinlichkeit vorherzusagen, ob die Person homosexuell oder heterosexuell ist. Die Zuordnung der politischen Ansichten einer Person war mit einer Wahrscheinlichkeit von 85 Prozent möglich. Bei den Eingangs angeführten Interessen könnte beispielsweise davon ausgegangen werden, dass der User heterosexuell (hört Musik vom Wu-Tang Clan) und unterdurchschnittlich intelligent (Vorliebe für Harley Davidson) ist.

Wenn der Algorithmus mehr als der Ehepartner weiß

In der anschließenden Forschungsarbeit im Jahr 2014 verglich Kosinski die Genauigkeit einer auf Facebook „Likes“ basierenden Persönlichkeitsanalyse mit Einschätzungen des näheren Umfeldes der Probanden (2). Die Ergebnisse sind erschreckend: ab 10 Likes kann der Computer die Persönlichkeit des Users besser beurteilen als seine Arbeitskollegen, ab 70 Likes besser als seine Freunde, ab 150 Likes besser als seine Familienmitglieder und ab 300 Likes besser als der Ehepartner!

Und dabei wurde nur ein Bruchteil des digitalen Fußabdrucks, den jeder von uns täglich hinterlässt, berücksichtigt! Würde der Algorithmus beispielsweise noch um Suchabfragen, das Surfverhalten im Internet und bargeldlose Einkäufe erweitert werden, könnten noch präzisere Aussagen getroffen werden.

Hundewerbung vs. Wahlmanipulation

Zu wissen, dass jemand einen Hund besitzt und dieser Person deshalb Werbung für Hundefutter zu schicken, erscheint nicht unbedingt anstößig. Zu wissen, dass jemand schwanger ist und dieser Person Werbung für Babyflaschen und Umstandskleidung zu senden, könnte hingegen schon ein unerwünschter Eingriff in die Privatsphäre mit unerwünschten Folgen für die betroffene Person sein. Vielleicht wollte die werdende Mama ihr Glück noch geheim halten?

Die Manipulation des Abstimmungsverhaltens bei politischen Wahlen durch das Ausspielen von Ängsten, die dank Social Media individuell je nach Persönlichkeitsstruktur an den potentiellen Wähler adressiert werden können, ist jedenfalls nicht zu dulden. Dies stellt einen Angriff auf das Fundament unserer Demokratie dar, wenn nicht mehr Fakten und politische Programme relevant sind, sondern die perfekte Übermittlung der passenden Botschaft. In dieser Hinsicht erscheint es fast grotesk, wenn der bedeutendste ehemalige Kunde von Cambridge Analytica und zugleich Präsident der USA das Wort „fake news“ benutzt.

Edward Snowden, der durch seine Enthüllungen offenbarte, wie unser digitaler Fußabdruck von staatlicher Überwachungssoftware ausgewertet wird, entkräftet das zu Beginn angeführte Argument deshalb wie folgt: „Wer keine Angst um seine Privatsphäre hat, weil er nichts zu verbergen hat, der dürfte auch keine Angst um freie Meinungsäußerung haben, weil er nichts zu sagen hat.“

 

Verwendete Quellen:
(1) Kosinski et al. (2013): “Private traits and attributes are predictable from digital records of human behavior”
(2) Kosinski et al. (2015): „Computer-based personality judgments are more accurate than those made by humans“