In unserer heutigen Welt sind Daten überall. Egal wo Sie hinsehen, überall werden Daten gesammelt. Von der täglichen Benutzung Ihrer EC-Karte und Ihrer Kreditkarte, über das Einkaufen im Internet und das Liken in sozialen Netzwerken, bis hin zum Streaming Ihrer Lieblingsfilme und -serien auf Netflix, es ist kaum zu vermeiden, dass Sie Datenspuren hinterlassen. Jeder von uns produziert Daten, so viele Daten, dass diese in unüberschaubaren großen Mengen anfallen. Treten derart gehäufte Daten in einer Datensammlung auf spricht man von Big Data. Doch wie ging man früher mit Daten um, wie wird Big Data heute verwendet und was könnte morgen mit Big Data möglich sein?

Wie war es früher?

In den Jahren bevor es Computer und elektronische Datenverarbeitung gab war es sehr schwer Daten zu sammeln, aufzubereiten, zu verarbeiten oder zu speichern. Es bedeutete immer einen hohen Aufwand große Datenmengen zu aggregieren und mit einfachen Mitteln zu verdichten.  Volksbefragungen beispielsweise waren und sind entscheidende statistische Mitteln für einen modernen Staat. In einer Zeit bevor es elektronische Datenverarbeitungsmittel gab, waren diese Volkszählungen aber eine riesen Herausforderung.  Egal ob in Europa oder den USA überall wurden und werden Volkszählungen gemacht. In den USA fanden und finden seit 1790 alle 10 Jahren diese Volkszählungen statt, und obwohl zwischen 1790 und 1880 die Bevölkerung der USA von ca. 4 Millionen auf gerade einmal 50 Millionen Einwohner anwuchs und das Erheben der Daten dank vieler Helfer in wenigen Tagen und Wochen geschah, dauerten die Auswertung dieser Daten meist Jahre. Erst bei der Volkszählung 1890 wurden in den USA erste mechanische Lochkartenmaschinen eingesetzt um die Auswertung der schier riesigen Datenmenge einfacher verarbeitbar zu machen.  Erst seit den 1960ern und 1970ern werden Daten in elektronischer Form verarbeitet, dennoch ist das aufbereiten dieser Daten, trotz unserer modernen Mittel heute immer noch eine große Herausforderung.  Eine derart große Datenmenge, die bei so einer Volkszählung gesammelt wird, fordert uns also heute genauso wie früher.

Definition Big-Data

Die Definition von Big-Data die wir heutzutage verwenden geht auf John Mashey zurück, er beschreibt in den 1990er Jahren Big-Data als eine derart große und komplexe Datenmenge, dass herkömmliche Mittel nicht ausreichen um diese Daten verarbeiten und auswerten zu können.

Wo stehen wir heute?

Es klingt paradox, doch obwohl sich seit 1790 unsere Tools und Technologien in Bezug auf die Datenverarbeitung stark verbessert haben, scheinen wir immer noch vor den selben Herausforderungen zu stehen wie damals die Beamten der Volkszählung in den USA. Denn obwohl sich unsere Tools und Technologien, mit denen wir Daten auswerten können extrem verbessert haben, ist es auch bedeutend einfacher geworden Daten zu erzeugen. Wir merken es in den meisten fällen nicht einmal, dass wir gerade Daten produzieren. Unser Smartphones erzeugen ständig Daten, hat ein User beispielsweise die GPS-Location aktiviert und verwendet eine App wie Google-Maps so werden Daten über die Position, Bewegungsrichtung und Geschwindigkeit dieser Person gleichzeitig erzeugt und gespeichert. Es sind somit nicht nur die Suchdaten die wir explizit eingeben sondern auch sehr viele Metadaten, die wir täglich unbewusst produzieren und freigeben. Und nicht jeder ist sich einerseits dieser Tatsache bewusst und gibt diese Daten andererseits gerne privaten Konzernen wie Google. In unserer vernetzten digitalen Welt ist es aber auch fast gar nicht mehr möglich keine Datenspuren zu hinterlassen. Smartphones, bargeldloses Bezahlen, Soziale Medien, und intelligente vernetzte Dinge wie intelligente Kühlschränke, Stromzähler sogar Navigationsgeräte und selbstfahrende Autos produzieren Daten und machen uns zu gläsernen Menschen. Konzerne, die diese Daten besitzen können diese dann dazu verwenden uns maßgeschneiderte Werbung anzuzeigen oder unser Einkaufsverhalten analysieren und dieses Wissen dann weiterverkaufen. Daten sind mittlerweile viel mehr als Bits und Bytes auf Festplatten, Daten sind das Öl von morgen.

Die Technologien diesen neuen Öl-Schatz zu heben sind über die Zeit nun herangereift. Wir sind aber erst am Beginn diese Mittel und Technologien einzusetzen und die Daten zu Geld zu machen. Und viele User gehen zu sorglos mit ihren Daten um. So kann ein unscheinbares Like auf Facebook allein zwar nichts über einen Menschen aussagen, die Summe aller Likes einer Person, zusammen mit einem vergleichbaren psychologischen Profil einer Person, die ähnliches geliked hat kann aber sehr gute Rückschlüsse auf dessen Vorlieben und Verhaltensweisen bieten. So hat eine Studie die 2012/2013 von der National Academy of Science veröffentlicht wurde fast 60.000 freiwillige einen psychologischen Test unterzogen und danach deren Facebook-Likes analysiert. Aufgrund dieser Daten konnten dann sehr genaue Aussagen über weitere User gemacht werden, nur indem man deren Facebook-Likes mit den vorhandenen Daten verglich. Die Studie ergab, dass beispielsweise Personen die Gewitter, Wissenschaft und Curley-Fryes unter den Facebook-Likes hatten, sehr intelligent waren.

So wie in dieser Studie nutzt auch Facebook selbst Likes seiner User um Profile über diese anzulegen und dann an Werbetreibende zu verkaufen. Diese Daten werden dann beispielsweise verwendet um möglichst zielgerichtete Werbung auf Facebook zu ermöglichen.

Wenn Sie jetzt vor schreck diesen Artikel zur Seite legen und sich lieber entspannt auf die Couch legen und eine Serie auf Netflix schauen sein Sie gleich gewarnt. Denn auch Netflix nutzt Big-Data um seine Angebote für User zu verbessern. So werden beispielswiese Daten wie gesehene Filme, Filme auf der „Watch-Later-List“, und deren Genres, die Kategorie in der sich diese Filme befinden, den Zeitpunkt an dem Filme gesehen werde, Dauer und Intensität des Streamingverhaltens, und vieles mehr verwendet, um das für Sie angebotene Entertainment-Programm zu optimieren und Ihnen passende Filme vorzuschlagen. Und damit nicht genug Netflix passt sogar die Titelbilder seiner Filme und Serien auf ihren Geschmack an. Sind Sie eher ein Romantischer Typ, so werden Ihnen mehr Paarfotos als Titelbild der Filme gezeigt, sind Sie eher der Action-Fan so weisen die Titelbilder eher actionreiche Szenen auf.

Was passiert mit Big-Data in der Zukunft?

Nicht nur in der digitalen Welt auch in der realen Welt hat Big-Data einen großen Einfluss auf unser Leben, Google-Maps kann nur deswegen so gut Staus erkennen und Autofahrer den kürzesten Weg anzeigen, weil viele Google-Maps User ihre GPS Daten freigeben und Google aufgrund der Position und der Geschwindigkeit Rückschlüsse auf den Verkehr machen kann. Auch hier sind Meta-Daten wichtig um einen Mehrwert zu erzeugen. Dass bei Google Maps Staus live angezeigt werden begeistert heutzutage aber kaum jemanden mehr. In der chinesischen Stadt Hangzhou geht Alibaba noch einen Schritt weiter. Gemeinsam mit der Stadtregierung steuert eine von Alibaba mit Hilfe von Big-Data erzeugte künstliche Intelligenz (KI) 104 Ampeln und Kreuzungsanlagen. Dabei gibt Alibaba an, dass sie mit der „City-Brain“-KI den Verkehr in der Region um diese 104 Kreuzungsanlagen um 15% schneller machen konnten. Big-Data kann also zukünftig in Kombination mit anderen Techniken wie Machine-Learning, KI und Data-Science noch große Verbesserungspotentiale für uns Menschen bieten. So könnte mit Hilfe großer DNA-Datenbanken und KI personalisierte Medikamente generiert werden, die weniger Nebenwirkungen haben und effizienter von Patienten aufgenommen werden. Es könnte mit Hilfe von Big-Data auch Sicherheitsrisiken am Arbeitsplatz reduziert werden und beispielsweise gefährliche Situationen erkannt und vorgebeugt werden. Die Möglichkeiten für Big-Data in Kombination mit Technologien wie KIs, Machine-Learning und Data-Science sind vielzählig. Es darf dabei nur nicht auf die Privatsphäre und die Persönlichkeitsrechte der einzelnen User vergessen werden. Schauen Sie gerne mal auf den Blog des Autors.

Autor

David Theil aus Linz Oberösterreich ist Digitalisierungs-Coach, Software-Entwickler und als Head of Software-Engineering für über 30 Softwareentwickler verantwortlich. Beruflich beschäftigt er sich bereits jahrelang mit der Digitalisierung und betreibt den Blog https://digitalisierungscoach.com/. Er bewegt sich in Themen wie Digitalisierung, agiles Projektmanagement, Scrum und Softwareentwicklung sowohl beratend als auch praktisch mit echten Lösungen.

Durch die weitere Nutzung der Seite stimmen Sie der Verwendung von Cookies zu. Weitere Informationen

Die Cookie-Einstellungen auf dieser Website sind auf "Cookies zulassen" eingestellt, um das beste Surferlebnis zu ermöglichen. Wenn du diese Website ohne Änderung der Cookie-Einstellungen verwendest oder auf "Akzeptieren" klickst, erklärst du sich damit einverstanden.

Schließen