Im Zeitalter der Digitalisierung und von Big Data dreht sich vieles vor allem um eins: Daten. Dabei fallen regelmäßig Begriffe wie Data Mart und Data Lineage ins Auge. Nicht immer ist dabei genau klar, worum es sich bei den Fachwörtern genau handelt, weshalb dieser Artikel einen kleinen Überblick liefern soll.
Was ist Data Mart?
Data Marts sind eine Art Sammelstelle für benutzerdefinierte Daten. Dabei werden Daten aus großen Datenstämmen extrahiert und für bestimmte Benutzergruppen isoliert zugänglich gemacht. Sie bilden damit ein Teilsegement eines Data Warehouses und können dabei helfen bestimmte Daten schneller und mit weniger Aufwand für den Nutzer zugänglich zu machen. Dadurch kann man schließlich nicht nur Zeit, sondern auch Kosten sparen.
Data Mart vs Data Warehouse
Sowohl Data Mart als auch Data Warehouses dienen dazu Datensätze bis zu ihrer Verwendung zu speichern und zu verwalten. Data Warehouses sind dabei darauf spezialisiert die gesamten Daten eines Unternehmens zu ordnen, während Data Marts Sammelpunkte für die Daten lediglich einzelner Abteilungen organisieren. Damit stellen sie ein Tool dar, dass bestimmte Datensätze isoliert und dem jeweiligen Funktionsfeld gesondert zur Verfügung stellt.
Arten
Grundsätzlich unterscheidet man bei Data Marts zwischen 3 verschiedenen Kategorien.
Abhängig
Abhängige Data Marts stehen stets im direkten Zusammenhang mit einem Enterprise Data Warehouse, indem sie nach dem Top-Down-Prinzip entwickelt werden. Dafür werden Daten zunächst an einem Sammelpunkt zusammengefasst und anschließend bestimmte Datensätze extrahiert, die dann in ihren vorgesehenen Data Mart verteilt werden.
Unabhäng
Ein unabhängiger Data Mart ist hingegen an kein Data Warehouse gekoppelt und bildet damit ein autonomes System. Daten werden statt aus der Sammelstelle des Data Warehouses aus internen sowie externen Datenquellen einer Organisation gewonnen und dann spezifisch an die einzelnen Data Marts verteilt. Damit ist diese Art von Data Marts deutlich einfacher umzusetzen und besonders hilfreich bei der Verfolgung kurzfristiger Geschäftsziele.
Hybrid
Hybride Data Marts beschreiben die Verbindung abhängiger und unabhängiger Data Marts in einem System, indem sie Daten aus einem Data Warehouse sowie aus internen und externen Quellen eines Unternehmens gewinnen. Dadurch kann man die Vorteile beider Methoden vereinen und ein komplexes aber übersichtliches System schaffen.
Vorteile
Aufgrund ihrer Funktion als Beschleuniger beim Zugriff auf spezielle Datensätze bieten Data Mart viele Vorteile.
- Minimierung des Zeitaufwands beim Beschaffen bestimmter Daten
- Deutlich schneller Einsatzbereit als ein Enterprise Data Warehouse
- Data Mart benötigen vergleichsweise wenig Fachkenntnisse bei der Implementierung
- Preiswerte Alternative zu einem Enterprise Data Warehouse
- Data Mart helfen dabei, die Performance eines Data Warehouses zu verbessern, da sie Daten mit weniger Aufwand beschaffen können
- KPIs sind dank Data Mart leichter zu überwachen
- Data Mart unterstützen die Datenpflege, indem sich Datensätze bestimmten Abteilungen zuordnen lassen, die diese wiederum selbstständig überwachen können
Was ist Data Lineage?
Data Lineage spielt eine Rolle im Zusammenhang mit der Herkunft von Daten, weshalb man den Begriff gerne auch als Synonym verwendet. Data Lineage hat dabei die Aufgabe Änderungen sowie Optimierungen von Daten sowie die Entwicklung von deren Elementen in einer Historie festzuhalten. Dabei verfolgt es einen Datensatz auf seiner Reise von der Entstehung über Anpassungen bis zur finalen Destination und dokumentiert gleichzeitig auch die zugehörigen Eigenschaften. Vereinfacht kann man sich Data Lineage also als eine Art Biografie eines Datensatzes vorstellen.
Vorteile
Mit seiner Funktion bietet Data Lineage viele Vorteile für den Anwender.
- Daten können jederzeit und vollständig überwacht werden
- Erhöhte Transparenz über die Entwicklung und den Verlauf von Datensätzen
- Qualität der Daten bleibt erhalten
- Hilfreich, wenn es um vertrauliche Daten geht, die geschützt werden müssen
- Unternehmen können sich mithilfe von Data Lineage leichter an datenbasierte Normen und Vorschriften halten
Über Data Mart und Data Lineage hinaus
Mehr zum Thema Daten und Big Data liefern zudem folgende Artikel:
- Was ist Big Data?
- Big Data: gestern, heute und morgen!
- Chancen von Big Data – Daten sind das neue Öl?
- Risiken von Big Data – Eine Frage der Umsetzung!
Rechtschreibung: Ich führe diesem Blog neben dem Job und schreibe viele Artikel in Bahn/Flugzeug oder nach Feierabend. Ich möchte meine Gedanken und Ansätze als Empfehlungen gerne teilen. Es befinden sich oftmals Tippfehler in den Artikeln und ich bitte um Entschuldigung, dass ich nicht alle korrigieren kann. Aber Sie können mir helfen: Sollten Sie Fehler finden, schreiben Sie mich gerne an! Lesen Sie mehr dazu.
Helfen Sie meinem Blog, vernetzen Sie sich oder arbeiten Sie mit mir
Sie haben eigene, interessante Gedanken rund um die Themenwelt des Blogs und möchten diese in einem Gastartikel auf meinem Blog teilen? – Aber gerne! Sie können dadurch Kunden und Fachkräfte ansprechen.Ich suche aktuell außerdem Werbepartner für Bannerwerbung für meinen Blog. Sollte es für Sie spannend sein Fachkräfte oder Kunden auf Ihre Seite zu leiten, dann bekommen Sie mehr Informationen hier.
Tipp: Ich vergebe auch über den Blog eine gratis Zertifizierung zum Digital & Agile Practioner!
Vernetzen Sie sich in jedem Fall auf Xing oder LinkedIn oder kontaktieren Sie mich direkt für einen Austausch, wenn Sie gleich mit mir ins Gespräch kommen wollen. Werfen Sie auch einen Blick in meine Buchvorschläge zur Digitalisierung, vielleicht wollen Sie mir auch ein Buch empfehlen?
Ich arbeite gerne mit Unternehmen zusammen. Sie können mich ebenfalls gerne bezüglich folgender Punkte anfragen:
- Sehen Sie übersichtlich alle Möglichkeiten zur Zusammenarbeit
- Halten von Vorträgen zu Arbeit, Führung und Agilität
- Veröffentlichung von Gastartikeln
- Content Marketing & Texterstellung
- Workshops und Seminare
- Softwareentwicklung für Unternehmen
- Whitepaper für B2B Leads
- IT-Administation AWS, Kubernetes, Ansible, Cloud und Terraform
- Public Relations (PR) für Unternehmen
- Influencer Marketing
- Whitepaper für B2B Leads
Bildquelle: pixabay.com