Kategorie-Archiv: Datenschutz

Big Data – Mehr ist mehr…

Veröffentlicht am von 0 Kommentare

Die Diskussion um Big Data geht in drei Aspekten in die falsche Richtung:

Ist Big Data neu? 

Nein. Es gab schon immer viele Daten. Doch vor Jahren waren diese einfach zu viel, um sie mit den Mitteln der Datenverarbeitung zu bearbeiten. Das betfach aber nicht alle große Datenbestände: z.B. die Daten in den Rentenversicherungen waren immer auswertbar. Die Datenbestände für die Ermittlung der Telefonrechnung waren ebenso enorm, aber handhabbar.

Big Data ist neu, als dass sie sich auf die große Menge an unstrukturierten Daten bezieht: eben die einzelnen Logfile Zeile eines Webservers, der in jeder Zeile mindestens dreihundert Einzeldaten ablegt. Diese Daten entstehen so schnell und mit einer solchen Datenmenge, dass diese in eine strukturierte Form zu bringen und dann zu analysieren, dazu geführt hätte, dass die Ergebnisse nicht dann da gewesen wären, wenn Sie gebraucht würden.

Das eigentlich neue an Big Data ist, dass z.B. das Logfile von vorhin nicht einfach in eine Datenbank gepackt wird. Das würde klassischerweise die Zerlegung jeder Logfilezeile in ein komplexes Datenmodell bedeuten, um später aus der Datenbank vernünftige Analysen zu erhalten. In den neuen Big Data Konzepten, wird jede Zeile als solche abgespeichert. Jede Zeile wird aber doppelt und dreifach gespeichert mit jeweils einem Schlüssel, um die Daten zu sortieren. Z.B. einmal verknüpft mit einem User, verknüpft mit einer Zeit. Damit wird zuerst einmal die Information dreimal gespeichert – aus vielen Daten werden nun noch mehr Daten. Aber nun kann auf drei verschiedene Weisen auf diese Daten zugegriffen werden. Z.B. Was hat der Benutzer bei seinem letzten Besuch als letztes gemacht? Hierfür wird das entsprechende Datum aus dem Speicher geholt und dann analysiert. Dh. es wird weniger Zeit für das finden der Daten im Heuhaufen gebraucht, so dass mehr Zeit besteht, diese dann auszuwerten. Denn da die Logfilezeilen so wie sie entstanden sind, gespeichert wurden, müssen diese erst wieder aufbereitet werden, damit aus den Daten eine Information wird.

Bedeutet der Besitz  von viel Daten gleichzeitig mehr Macht, wirtschaftlichen Erfolg?

Wie schon im vorangegangenen Abschnitt dargelegt: es gibt einen Unterschied zwischen Daten und Informationen. Das vorhanden sein von Daten ist allein noch kein Wert. Und es bringt auch nichts. Erst eine Information macht einen Wert aus, den man nutzen kann.

Damit aus Daten Informationen werden, muss ein leitender Gedanke bestehen, um diese zu interpretieren. Und hier beginnt das Problem: ohne eine solche Bewertung von Daten, sind diese also nutzlos. Wenn also große Datenbestände vorhanden sind, aber keine Idee besteht, wie diese zu nutzen sind, und welche Information daraus gewonnen werden kann, sind diese Daten in sich nutzlos.

Und hier beginnt das Problem: die meisten Datenbestände sind einfach so da. Niemand hat eine Idee,wie diese zu kombinieren sind und was daraus zu lesen wäre. Es gleicht dem Verhalten eines Messis: alles sammeln, nichts wegwerfen. Dann entsteht ein großer Haufen, der dann immer im Weg steht, aber keinen Wert in sich hat.

Heute entstehen solche Datenberge immer häufiger, so dass die Unternehmen sich die Frage stellen, wie sie damit noch Geld verdienen können. Das gleicht einem Messi, der dann zwar viel gesammelt hat, aber ohne Ziel und einfach nur des Sammelns wegen. Und nun steht er mit einem Berg von Sachen dar, die so wild gemixt sind, dass sich nichts vernünftiges damit anstellen läßt. Und so geht es den Unternehmen auch. Nicht alle ihre Datenberge enthalten Schätze oder lassen sich mit angemessenen Aufwand zu Informationen verarbeiten.

Daher ist eigentlich die Frage, warum die Daten überhaupt sammeln. Wenn man nicht weiss, wozu und wenn man sie nicht mehr braucht, sollte man sich davon befreien. Big Data erzeugt in den meisten Fällen nur Geld für die Unternehmen, die andere Unternehmen beraten, wie mit vielen Daten umzugehen ist. Für die ist Big Data eine wahre Goldgrube: mit immer mehr Unternehmen und Organisationen die wie irrsinnig einfach nur sammeln, wird  die Beratungsleistung, daraus später Informationen zu gewinnen sowas wie die Lizenz zum Gelddrucken. Die Nachfrage entsteht von selbst, die Lösungen sind nur temporär, da sich nicht nur eine Antwort auf die Frage, wie ein Datum auszuwerten ist, geben läßt, werden hier Baustellen aufgemacht, die den Beratern die Kassen nur so vollspülen. Und dass dabei jemals etwas rauskommt, ist nicht sicher.

Wenn also der Gedanke des Sammelns von Daten nicht schon mit möglichen Zielen verbunden ist, führt die ganze Sammlung zu nichts.

Braucht die Wirtschaft „Big Data“?

Offenbar. Sie schreit nach mehr Befreiung von Datenschutzregeln, damit alles und jedes Datum gespeichert werden kann und so lange gespeichert werden kann, wie es technisch möglich ist.

Aber wozu? Heute schon scheinen die Unternehmen mit der Verwaltung der Datenbestände länger beschäftigt zu sein, als diese nutzbar zu machen. Und solange ein Unternehmen nicht dadurch das es sammelt Geld verdient erscheint diese Übung reichlich unsinnig.

Ausserdem: selbst wenn die Sammlung von Daten Geld einbringt, heisst es doch in den meisten Fällen nicht nur, dass alles besser wird für den Kunden. Es zeigt einen interessanten Punkt in der Diskussion: Google sammelt Daten über viele Dienste, die dem Benutzer kostenlos zur Verfügung gestellt werden, solange er seine Daten für alle möglichen Zwecke Google kostenlos zur Verfügung stellt. Welche Wert haben diese Daten? Möglicherweise den Wert, den die alternativen Dienste, die diese Leistungen so anbieten, dass die Daten des Benutzers nicht weiterverwendet werden, dem Benutzer abverlangen, für die eigentliche Leistung.

Wir brauchen keinen „modernen“ Datenschutz. Die Prinzipien nur die Daten zu speichern, die benötigt werden, sind wirtschaftlich sinnvoll und vor allem vor dem Hintergrund, dass die Datenmengen von niemanden sinnvoll über einen großen Zeitraum gesichert gespeichert können.

Wenn ein Unternehmen sich nicht von den Daten trennen kann, die es hat, dann muss es hierfür Kosten akzeptieren (Datenhaltung, Datenschutz, etc.). Wenn es hierzu keine Möglichkeit gibt, Geld mit den Daten zu verdienen, wird die Lust am Sammeln automatisch vergehen. Das Datensammeln mit Risiken verbunden ist, unter anderem den der Verletzung des Datenschutzes, stellt eine wichtige Hürde dar, den Datenumfang der gesammelt wird, zu begrenzen. Es wird sicher brauchen, bis sich diese Erkenntnis in den Unternehmen durchsetzt. Aber erst zu überlegen und dann zu sammeln ist die einzige Möglichkeit später für die Unternehmen und den Datenschutz den besten Kompromiss zu erreichen.

Tante Emma als Big Brother

Veröffentlicht am von 0 Kommentare

Die apokalyptischen Visionen der Vergangenheit handelten von tyrannischen Staaten, in denen eine kleine Oberschicht die Massen drangsaliert. Dabei half den Tyrannen die totale Überwachung. Der Gedanke an Privatspähre war in diesen Visionen gleichbedeutend mit Staatsverbrechen.

Aber in unserer Welt kämpfen nicht nur die Staaten um die letzten Fetzen einer immer wieder durchlöcherten Privatsphäre. Sie erhalten Konkurrenz von mächtigen Konzernen die Weltweit alles tuen, um jeden und alles wirtschaftlich auszubeuten. Und das geht am besten, in dem man jeden und alles genau kennt. Deren Bedürfnisse, deren Wünsche und Gewohnheiten.

Demnächst läuft wieder die DMEXCO. Eine Messe unauffälliger Firmen, deren Firmennamen so abstrakt und nichtssagend sind, die klein und unscheinbar wirken, dass sie fast niedlich einher kommen. Daneben wird auf der Messe wie in den vergangen Jahren wieder zu beobachten sein, dass trotz der Unterschiede im Design des Logos, des Namens der Firma und vor allem der Produktbeschreibungen alle das gleiche machen, anbieten und wollen. Und das ist neben dem Marketing im Internet das TargetingBehavioral Targeting, Retargeting und welche Silben und Wörter vor oder vielleicht hinter „targeting“ setzen läßt.

Und wer ist das Target? Ich, Du, Wir. Unser Verhalten im Internet kann gemessen und verkauft werden. Und wer braucht das? Die Werbewirtschaft. Denn durch die Seiten die wir ansurfen geben wir auch etwas vom dem Preis, was uns interessiert. Im kleinen kennen wir das von eBay oder Amazon. Jede Versteigerung, die wir uns auf eBay ansehen führt dazu, dass wir bei unserem nächsten Seitenbesuch auf eBay ähnliche Versteigerungen vorgeschlagen bekommen. Bei Amazon läuft das dann etwas intelligenter. Ich bekomme nach jedem Buchkauf die Bücher angezeigt, die sich andere Käufer dieses Buches auch gekauft haben. Bei meinem nächsten Besuch erhalte ich dann eine Ansicht der aus Sicht von Amazon für mich interessanten Bücher, errechnet aus meinem Verhalten, dem Verhalten von anderen Amazon-Usern.

Nun geht die nächste Stufe darüber hinaus. Nicht nur einzelne Seiten sammeln Daten um ihr eigenes Angebot zu verbessern, sprich die Verkäufe an mich, dem Nutzer zu steigern. Jetzt geht es darum, dass alle meine Aktivitäten im Internet unabhängig von der einzelnen Seite verfolgt werden. Bei Zalando Schuhe gekauft und schon gewundert, warum Spiegel Online gepflastert ist mit Bannern von Zalando-Sonderangeboten…

Und die, die solche Daten sammeln, verkaufen diese meistbietend an denjenigen, der zu zahlen bereit ist. Was erhält er dafür? Im Moment die Möglichkeit Werbung einzublenden. Klingt erstmal unspektakulär. Aber was, wenn die gekauften Daten erfolgreich zum Kauf führen? Dann sind die bisher her nur anonymen Daten mit einem Käufer verbunden. Dh. wenn die Werbung erfolgreich zum Kauf führt, kann den Daten, denen bisher der Name und die Adresse fehlt, auf einmal ein solcher zugewiesen werden. Und das nicht nur in der Vergangenheit – sondern auch bei allen zukünftigen Aktivitäten.

Damit gehört diesen kleinen Firmen auf der DMEXCO demnächst ein wahrer Datenschatz. Der von niemand so recht kontrolliert wird. Heute wollen die Staaten auch an unsere Daten – aber in den meisten davon, kann man dagegen klagen, demonstrieren oder die Regierungen entsprechend abwählen. Bei den Unternehmen ist das leider nicht möglich.

Und die suchen nun nach einem guten „Geschäftsmodell“, wie aus diesen Daten Geld zu machen ist. Eigentlich gehören die Daten noch nicht mal diesen Firmen, sondern uns. Den Internetusern. Aber leider ist es hier, wie bei der Organspende. Wir wissen nicht, wer die Spende bekommt, wer daran verdient. Und nur eins ist sicher: der Spender bekommt nichts – im Gegenteil. Wie bei einer Organspende, spenden wir auch etwas: unsere Privatsphäre. Und ob uns das gefällt, was wir davon haben, ist eher ungewiss. Was, wenn statt gestohlender Steuer-CDs aus der Schweiz, DVDs solcher Benutzerprofile verkauft werden?