IT-Trend Big Data und seine Gewinner Wie aus Daten Geld gemacht wird

Chinesin bezahlt mit Smartphone: In China und den USA werden am meisten Konsumentendaten gesammelt und monetisiert | © Getty Images

Chinesin bezahlt mit Smartphone: In China und den USA werden am meisten Konsumentendaten gesammelt und monetisiert Foto: Getty Images

Informationen in Form von Daten wurden bereits in frühmenschlicher Zeit ausgetauscht, verarbeitet und auch für die Nachwelt festgehalten, zum Beispiel in Höhlenmalereien. Je komplexer die menschlichen Gemeinschaften wurden, desto umfangreicher und ausdifferenzierter wurden diese Daten. Mittlerweile werden aus internetfähigen Geräten wie Smartphones oder auch von Maschinen gigantische Datenmengen produziert – wobei sich die Gesamt-Datenmenge etwa alle zwei bis drei Jahre sogar noch verdoppelt. Nach Schätzungen der Investmentbank Bank of America Merrill Lynch werden im Jahr 2020 insgesamt 44 Zettabyte (umgerechnet 44 Billionen Gigabyte) an Datenvolumen anfallen, ein Anstieg von 12 Zettabyte im Vergleich zu 2015. Bis zum Jahr 2025 explodiert der Datenberg auf 180 Zettabyte. Wenn in einigen Jahren autonom fahrende Fahrzeuge unsere Straßen frequentieren, wird sich dies noch einmal potenzieren, da jedes Fahrzeug pro Minute etwa 1 Gigabyte an Daten erzeugt.

Was bedeutet Big Data?

Unabhängig von diesen Größenordnungen spricht man von Big Data, wenn die Datenmengen zu groß, zu schnelllebig, zu komplex oder zu unstrukturiert sind, um sie mit herkömmlichen Analysemethoden erfassen und interpretieren zu können. Erst durch Künstliche Intelligenz (KI) konnten Methoden entwickelt werden, Daten zu systematisieren und Muster in den scheinbar unspezifischen Daten zu erkennen.

Bei der Nutzung von Big Data kommt es auf Größenvorteile an. Je mehr Datenpunkte zur Verfügung stehen, desto rascher können Algorithmen daraus Schlussfolgerungen ableiten. Sodann können die Daten verwendet werden, um ein KI-System „anzulernen“. Ein berühmtes Beispiel ist, Millionen von Katzenbildern einzulesen und dem KI-System dadurch eine immer feinere Definition davon zu geben, was „eine Katze“ ist. Je mehr Katzenbilder vorhanden sind, desto größer ist die Trefferwahrscheinlichkeit, auf einem bisher unbekannten Foto eine Katze zu identifizieren.

In diesem Bereich wurden in den vergangenen Jahren enorme Fortschritte erzielt. So kann heute der Supercomputer IBM Watson (einst berühmt geworden, als er einen Meister des US-Quizspiels „Jeopardy“ besiegte) bei der Diagnose und Therapieplanung von Tumorpatienten eingesetzt werden. Da Watson mit Millionen Bildern von Tumor-Zellstrukturen gefüttert wurde und damit über eine um ein vielfaches höhere Diagnostikerfahrung verfügt als jeder menschliche Onkologe, ist die Genauigkeit bei der Tumorbestimmung sehr hoch. Außerdem kann die Rechenleistung von Watson dazu genutzt werden, innerhalb von 10 Minuten einen Therapieplan zu erstellen, der bisher ein ganzes Ärzteteam viele Stunden beschäftigt hätte.