Die Diskussion um Big Data geht in drei Aspekten in die falsche Richtung:
Ist Big Data neu?
Nein. Es gab schon immer viele Daten. Doch vor Jahren waren diese einfach zu viel, um sie mit den Mitteln der Datenverarbeitung zu bearbeiten. Das betfach aber nicht alle große Datenbestände: z.B. die Daten in den Rentenversicherungen waren immer auswertbar. Die Datenbestände für die Ermittlung der Telefonrechnung waren ebenso enorm, aber handhabbar.
Big Data ist neu, als dass sie sich auf die große Menge an unstrukturierten Daten bezieht: eben die einzelnen Logfile Zeile eines Webservers, der in jeder Zeile mindestens dreihundert Einzeldaten ablegt. Diese Daten entstehen so schnell und mit einer solchen Datenmenge, dass diese in eine strukturierte Form zu bringen und dann zu analysieren, dazu geführt hätte, dass die Ergebnisse nicht dann da gewesen wären, wenn Sie gebraucht würden.
Das eigentlich neue an Big Data ist, dass z.B. das Logfile von vorhin nicht einfach in eine Datenbank gepackt wird. Das würde klassischerweise die Zerlegung jeder Logfilezeile in ein komplexes Datenmodell bedeuten, um später aus der Datenbank vernünftige Analysen zu erhalten. In den neuen Big Data Konzepten, wird jede Zeile als solche abgespeichert. Jede Zeile wird aber doppelt und dreifach gespeichert mit jeweils einem Schlüssel, um die Daten zu sortieren. Z.B. einmal verknüpft mit einem User, verknüpft mit einer Zeit. Damit wird zuerst einmal die Information dreimal gespeichert – aus vielen Daten werden nun noch mehr Daten. Aber nun kann auf drei verschiedene Weisen auf diese Daten zugegriffen werden. Z.B. Was hat der Benutzer bei seinem letzten Besuch als letztes gemacht? Hierfür wird das entsprechende Datum aus dem Speicher geholt und dann analysiert. Dh. es wird weniger Zeit für das finden der Daten im Heuhaufen gebraucht, so dass mehr Zeit besteht, diese dann auszuwerten. Denn da die Logfilezeilen so wie sie entstanden sind, gespeichert wurden, müssen diese erst wieder aufbereitet werden, damit aus den Daten eine Information wird.
Bedeutet der Besitz von viel Daten gleichzeitig mehr Macht, wirtschaftlichen Erfolg?
Wie schon im vorangegangenen Abschnitt dargelegt: es gibt einen Unterschied zwischen Daten und Informationen. Das vorhanden sein von Daten ist allein noch kein Wert. Und es bringt auch nichts. Erst eine Information macht einen Wert aus, den man nutzen kann.
Damit aus Daten Informationen werden, muss ein leitender Gedanke bestehen, um diese zu interpretieren. Und hier beginnt das Problem: ohne eine solche Bewertung von Daten, sind diese also nutzlos. Wenn also große Datenbestände vorhanden sind, aber keine Idee besteht, wie diese zu nutzen sind, und welche Information daraus gewonnen werden kann, sind diese Daten in sich nutzlos.
Und hier beginnt das Problem: die meisten Datenbestände sind einfach so da. Niemand hat eine Idee,wie diese zu kombinieren sind und was daraus zu lesen wäre. Es gleicht dem Verhalten eines Messis: alles sammeln, nichts wegwerfen. Dann entsteht ein großer Haufen, der dann immer im Weg steht, aber keinen Wert in sich hat.
Heute entstehen solche Datenberge immer häufiger, so dass die Unternehmen sich die Frage stellen, wie sie damit noch Geld verdienen können. Das gleicht einem Messi, der dann zwar viel gesammelt hat, aber ohne Ziel und einfach nur des Sammelns wegen. Und nun steht er mit einem Berg von Sachen dar, die so wild gemixt sind, dass sich nichts vernünftiges damit anstellen läßt. Und so geht es den Unternehmen auch. Nicht alle ihre Datenberge enthalten Schätze oder lassen sich mit angemessenen Aufwand zu Informationen verarbeiten.
Daher ist eigentlich die Frage, warum die Daten überhaupt sammeln. Wenn man nicht weiss, wozu und wenn man sie nicht mehr braucht, sollte man sich davon befreien. Big Data erzeugt in den meisten Fällen nur Geld für die Unternehmen, die andere Unternehmen beraten, wie mit vielen Daten umzugehen ist. Für die ist Big Data eine wahre Goldgrube: mit immer mehr Unternehmen und Organisationen die wie irrsinnig einfach nur sammeln, wird die Beratungsleistung, daraus später Informationen zu gewinnen sowas wie die Lizenz zum Gelddrucken. Die Nachfrage entsteht von selbst, die Lösungen sind nur temporär, da sich nicht nur eine Antwort auf die Frage, wie ein Datum auszuwerten ist, geben läßt, werden hier Baustellen aufgemacht, die den Beratern die Kassen nur so vollspülen. Und dass dabei jemals etwas rauskommt, ist nicht sicher.
Wenn also der Gedanke des Sammelns von Daten nicht schon mit möglichen Zielen verbunden ist, führt die ganze Sammlung zu nichts.
Braucht die Wirtschaft „Big Data“?
Offenbar. Sie schreit nach mehr Befreiung von Datenschutzregeln, damit alles und jedes Datum gespeichert werden kann und so lange gespeichert werden kann, wie es technisch möglich ist.
Aber wozu? Heute schon scheinen die Unternehmen mit der Verwaltung der Datenbestände länger beschäftigt zu sein, als diese nutzbar zu machen. Und solange ein Unternehmen nicht dadurch das es sammelt Geld verdient erscheint diese Übung reichlich unsinnig.
Ausserdem: selbst wenn die Sammlung von Daten Geld einbringt, heisst es doch in den meisten Fällen nicht nur, dass alles besser wird für den Kunden. Es zeigt einen interessanten Punkt in der Diskussion: Google sammelt Daten über viele Dienste, die dem Benutzer kostenlos zur Verfügung gestellt werden, solange er seine Daten für alle möglichen Zwecke Google kostenlos zur Verfügung stellt. Welche Wert haben diese Daten? Möglicherweise den Wert, den die alternativen Dienste, die diese Leistungen so anbieten, dass die Daten des Benutzers nicht weiterverwendet werden, dem Benutzer abverlangen, für die eigentliche Leistung.
Wir brauchen keinen „modernen“ Datenschutz. Die Prinzipien nur die Daten zu speichern, die benötigt werden, sind wirtschaftlich sinnvoll und vor allem vor dem Hintergrund, dass die Datenmengen von niemanden sinnvoll über einen großen Zeitraum gesichert gespeichert können.
Wenn ein Unternehmen sich nicht von den Daten trennen kann, die es hat, dann muss es hierfür Kosten akzeptieren (Datenhaltung, Datenschutz, etc.). Wenn es hierzu keine Möglichkeit gibt, Geld mit den Daten zu verdienen, wird die Lust am Sammeln automatisch vergehen. Das Datensammeln mit Risiken verbunden ist, unter anderem den der Verletzung des Datenschutzes, stellt eine wichtige Hürde dar, den Datenumfang der gesammelt wird, zu begrenzen. Es wird sicher brauchen, bis sich diese Erkenntnis in den Unternehmen durchsetzt. Aber erst zu überlegen und dann zu sammeln ist die einzige Möglichkeit später für die Unternehmen und den Datenschutz den besten Kompromiss zu erreichen.