Im Rahmen von Big Data benötigt man immer wieder leistungsstarke Plattformen, die eine große Menge an Daten effizient speichern können. Eine solche Plattform nennt man auch Data Warehouse. Dieses analysiert dabei die enthaltenen Informationen nach bestimmten Mustern.

Data-Warehousing-Prozess

Der Data Warehousing Prozess, mit den die Funktionsweise häufig umschrieben wird, umfasst vier wesentliche Hauptschritte zur Analyse von Daten, indem die Daten im Datenlager verwaltet und auf Ergebnisse ausgewertet werden.

Der 4-stufige Analyseprozess eines Data Warehouse

  1. Beschaffung von Daten aus den Quellsystem
  2. Laden der Daten
  3. Sicherung der Daten
  4. Analyse und Auswertung der gespeicherten Daten

So ist ein Data Warehouse aufgebaut

Ein Data Warehouse ist im Grunde wie ein reales Gebäude ein Konstrukt aus mehreren Elementen. Das Fundament bildet dabei eine operationale Datenbank die eine große Menge von Informationen enthält. Aus dem Fundament erhebt sich schließlich die sogenannte Staging Area, die eine Vorsortieren der Informationen zur Aufgabe hat. Erst nach speziellen ETL-Prozessen, die das Sammeln, Extrahieren, Transformieren und Laden der Daten nach einer vorbestimmten Struktur vornehmen, gelangen die Informationen schließlich in das Data Warehouse. Dieses ermöglicht somit einen separaten Zugriff auf Daten, unabhängig von operationalen Datenlagern. Mit speziellen Data Access Tools kann schließlich auf die Informationen zugegriffen werden. Dies ist dabei auf verschiedenen Ebenen, den sogenannten Data Marts, möglich.

Um bei großen Datenmengen eine noch bessere Struktur zu erhalten, kann man zusätzlich sogenannte OLAP-Datenbanken verwenden. Diese ermöglichen die Verdichtung von Informationen aus unterschiedlichen Bereichen und können dabei Zusammenhänge sowie Hierarchien effizient abbilden.

Jedoch ist zu beachten, dass jedes Data Warehouse nur so hochwertig, wie auch die ihm zugrundeliegenden Daten ist. Eine schlechte Qualität von Daten oder lückenhafte Datenbestände können zu erheblichen Problemen bei den Analysevorgängen führen.

Aufgaben des Data Warehouse

Im Rahmen von Big Data ist es für Unternehmen mittlerweile essenziell einen Überblick über die Masse an Informationen zu erhalten, um die gespeicherten Daten effizient auswerten zu können. Aus diesem Grund verfolgt ein Data Warehouse in der Regel vier wichtige Aufgaben.

  • Zentrale Sammlung aller Daten: Daten werden an einem Sammelpunkt komprimiert.
  • Sortierung der Datenstämme: Trennung in analytische und unverarbeitete Datenbestände, um unverfälschte Ergebnisse zu erhalten.
  • Datenintegration: Zusammenfassung von Daten aus verschiedenen Quellen mit unterschiedlichen Formaten zu einem auswertebaren Modell.
  • Langfristige Speicherung der Daten: Sicherung der Daten in Form einer Historie für spezifische Abfragemöglichkeiten und zeitraumbezogene Analysen.

Vor- und Nachteile

Ein Data Warehouse wird von vielen Unternehmen als hilfreiches Tool verwendet, wenn es um die Speicherung großer Datenmengen geht. Neben zahlreichen Vorteilen ergeben sich allerdings bei der Nutzung auch einige Nachteile.

Vorteile

  • leistungsstarke Funktion zur Speicherung großer Datenmengen
  • spezielle Tools für die einzelnen Bereiche
  • Management der Datenqualität

Nachteile

  • teilweise lange Ladezeiten (ins. bei steigenden Volumen an Daten)
  • unstrukturierte Daten können nicht verarbeitet werden (ins. Filme oder Audios)
  • kein Möglichkeit des Echtzeitstreamings

Mehr zum Thema Daten und Big Data liefern zudem folgende Artikel:

Genderhinweis: Ich habe zur leichteren Lesbarkeit die männliche Form verwendet. Sofern keine explizite Unterscheidung getroffen wird, sind daher stets sowohl Frauen, Diverse als auch Männer sowie Menschen jeder Herkunft und Nation gemeint. Lesen Sie mehr dazu.

Helfen Sie meinem Blog, vernetzen Sie sich oder arbeiten Sie mit mir

Ich suche aktuell Werbepartner für meinen Blog. Sollte es für Sie spannend sein Fachkräfte oder Kunden auf Ihre Seite zu leiten, dann bekommen Sie mehr Informationen hier.

Vernetzen Sie sich in jedem Fall auf Xing oder LinkedIn oder kontaktieren Sie mich direkt für einen Austausch, wenn Sie gleich mit mir ins Gespräch kommen wollen. Werfen Sie auch einen Blick in meine Buchvorschläge zur Digitalisierung, vielleicht wollen Sie mir auch ein Buch empfehlen?

Ich arbeite gerne mit Unternehmen zusammen. Sie können mich ebenfalls gerne bezüglich folgender Punkte anfragen:

Sie haben eigene, interessante Gedanken rund um die Themenwelt des Blogs und möchten diese in einem Gastartikel auf meinem Blog teilen? – Aber gerne!

Bildquelle: pixabay.com

Avatar
Autor

Externer Doktorand an der Universität Erlangen-Nürnberg am Lehrstuhl für IT-Management. Ich untersuche wie sinnvoll skalierte Agilität im Zuge des digitalen Wandels zur Zukunftsfähigkeit von Unternehmen beitragen kann. Neben der Promotion arbeite ich Vollzeit in einem Unternehmen.

Schreiben Sie einen Kommentar

*

Durch die weitere Nutzung der Seite stimmen Sie der Verwendung von Cookies zu. Weitere Informationen

Die Cookie-Einstellungen auf dieser Website sind auf "Cookies zulassen" eingestellt, um das beste Surferlebnis zu ermöglichen. Wenn du diese Website ohne Änderung der Cookie-Einstellungen verwendest oder auf "Akzeptieren" klickst, erklärst du sich damit einverstanden.

Schließen