Daten-Marktplatz.de Adressen und Daten zum Download
Big Data - Korrelationen und Fehlinterpretationen

Big Data - Korrelationen und Fehlinterpretationen

Anzeige
 
 
Geschrieben von am
Tags: Big Data Datenanreicherung

Big Data - Korrelationen und FehlinterpretationenBig Data ist mehr als nur das Zusammenführen großer Datenmengen. Ziel ist es aus diesem Datenpool Korrelationen zu identifizieren. Daten werden in Cluster mit ähnlichen Merkmalen zerlegt und machen Verhaltensweisen berechenbar. Durch die Analyse von Merkmalen, die häufig in Kombination auftreten können exakte Profile erstellt werden. Statistiker wissen: "Korrelation bedeutet nicht Kausalität". Unserem menschlichen Denken widerspricht das, denn wir denken kausal. Wir können uns daher nicht vorstellen, welche Daten man aus einem Facebookprofil extrahieren und durch Korrelationen mein Verhalten vorhersagen kann. Dabei stellt schon das Ermitteln von kausalen Zusammenhängen eine enorme Hürde dar. Zwischen Merkmalen, Ereignissen oder Zuständen muß bei einer Korrelation keine kausale Beziehung bestehen.

Clusterbildung und Interpretationen von Daten

Was hat also mein Profil bei Facebook mit meiner Kreditwürdigkeit zu tun? Statistiker beweisen Ihnen, das sie aus Ihrem Profil sehr viel herauslesen können. In der riesigen Menge der Daten finden sich sicherlich Profile mit ähnlichen Merkmalen, mit denen Sie in einem Cluster abgebildet werden. Stellt man bei der Zusammenführung der Daten fest, dass es in diesem Cluster sehr viele Personen gibt, die ihre Kredite nicht zurück zahlen, dann könnte sich das in Zukunft auch auf ihre Kreditwürdigkeit auswirken. Sogenannte Scoringverfahren, wie beispielsweise Social Scoring oder Geoscoring basieren auf Korrelationen.

Anzeige

 

Scheinkorrelationen

Nicht immer besteht tatsächlich eine Korrelation, auch wenn die statistischen Werte einem das vorgaukeln. In der Zeitachse besteht beispielsweise offensichtlich eine Korrelation zwischen dem Pillenknick in den 1960er Jahren und dem Rückgang der Klapperstörche. Es wäre jedoch eine Fehlinterpretation, wenn man daraus schliessen würde, dass die Kinder vom Storch gebracht werden. Solche Korrelationen werden Scheinkorrelationen genannt. Gerade bei der Analyse von Big Data kann es all zu leicht zu Fehlinterpretationen kommen. Gerade wenn man von Korrelation auf Kausalität schliessen möchte, kann man zu Fehlschlüssen kommen. Der Fehlschluss von Korrelation auf Kausalität wird auch als Cum hoc ergo propter hoc bezeichnet.
Frank Bindmann
Frank Bindmannhat ursprünglich Medizinpädagogik an der Martin-Luther Universität in Halle studiert. Herr Dipl. med. paed. Frank Bindmann ist seit 1999 im Netz unterwegs, alleinerziehender Vater einer inzwischen volljährigen Tochter und heute Geschäftsführer eines Reiseunternehmens für Alleinerziehende. Er schreibt unter anderem für diesen Blog, hauptsächlich zu den Themenfeldern Datenhandel und Direktmarketing. Frank Bindmann

Anzeige
Warenkorb:

Der Warenkorb ist leer

Kundenstimmen

Die Meinungen von einigen unserer Kunden

KundenstimmeJan Zimmermann
Schüler

"Ich biete hier regelmäßig Daten von Firmenneugründungen an und bessere so mein Taschengeld auf."

KundenstimmeThomas Fischer
Start Up Unternehmer

"Wir kaufen hier monatlich Adressen von Neugründungen, um neue Kunden zu gewinnen."
www.gewinnspiel-abwicklung.de

KundenstimmeAngelika Martin
Programmiererin

"Wir haben hier die Adressen von Ausflugszielen für ein Internetprojekt erworben."
www.ausflugsfee.de

Kontakt

Tel: +49 203 98418133

Legal Conditions

© daten-marktplatz.de