Big Data Analysen benötigen in der Regel einen großen Datenspeicher, um alle Informationen in rohem Zustand zu erfassen und zu sammeln. Dieser Datenspeicher gleicht dabei einem regelrechten Meer an Größe, weshalb sich dafür der Fachbegriff “Data Lake” etabliert hat. Was es damit genau auf sich hat, erfahren Sie in diesem Artikel.

Definition

Als großer Datenspeicher verwaltet der Data Lake die gesamte Masse an Daten in ihrer ursprünglichen Form, also quasi im Rohformat. Er bedient sich dabei bei der Sammlung von Informationen aus den unterschiedlichsten Quellen. Dabei spielt es für den Data Lake keine Rolle, ob die Daten eine Struktur besitzen oder nicht. Ebenso benötigt dieser große Datenspeicher auch keine vorherige Validierung oder Neuformatierung der Daten. Ein Data Lake kann dabei aber nicht zur zahlen- bzw. textbasierte Daten verwalten. Zusätzlich kann er auch Informationen aus dem Medienbereich, wie beispielsweise Bilder und Videos speichern.

Was als eine chaotische Sammlung von Daten erscheint, folgt allerdings einem System. Denn auch wenn der Data Lake alle Informationen in ihren individuellen Rohzuständen aufnimmt, so strukturiert er diese sobald die Daten einem Bedarf unterliegen. Anschließend leitet er, wenn nötig, auch eine Umstrukturierung der Daten ein.

Nutzung eines Data Lake

Die vielen verschiedenen Möglichkeiten der Nutzung und Verwendung der von einem Data Lake gesammelten Informationen, wie flexible Analysen machen den großen Datenspeicher äußerst attraktiv. Allerdings bedarf die Applikation einiger Anforderungen um das System optimal anwenden zu können.

So besteht die wichtigste Grundfunktion des Data Lake in erster Linie darin überhaupt Daten aus den verschiedensten Quellen sammeln und verwalten zu können. Durch die Gruppierung aller Daten an einem Ort können somit Datensilos vermieden werden und Informationen sind schneller griffbereit. Doch bei der großen Menge der Daten bietet auch ein einziger Speicherplatz keine Garantie für eine problemlose Datenverwaltung. Deshalb erfordern Data Lakes gängige Frameworks sowie das Erstellen von Protokollen der beinhalteten Datenbänke um mehr Struktur in die Masse von Informationen zu bringen.

Im Zuge der Sicherheit und den Anforderungen an den Datenschutz sind zusätzlich Zugriffskontrollen zu implementieren, sowie eine eine Verschlüsselung der Informationen zu gewährleisten. Gleichzeitig sollte Data Lakes immer eine Funktion der Sicherung und Wiederherstellung von Daten ermöglichen.

Vor- und Nachteile

Die Nutzung eines Data Lake ist vor allem dann sinnvoll, wenn immer wieder große Mengen von Daten anfallen, die verwaltet werden müssen. Gleichzeitig kann eine so große Sammlung von Informationen aber auch einige Hürden mit sich bringen.

Vorteile

  • schnelle und unkomplizierte Datenspeicherung im Rohformat
  • geringe Anforderungen bezüglich der benötigten Rechenleistung
  • bietet die Basis für detaillierte und inhaltsreiche Analysen
  • viele Möglichkeiten der Auswertung von Daten, da alle Daten ohne vorherige Sortierung gesammelt werden
  • Big-Data-Analysen können einen Wettbewerbsvorteil darstellen

Nachteile

  • Hohe Anforderungen bei Datenschutz sowie -sicherheit
  • Notwendigkeit eines komplexen Datenschutzsystems
  • Bedarf der vorherigen Implementierung von Zugriffsrechten und regelmäßigen Nutzerkontrollen

Fazit

Wie man erkennen kann, ist ein Data Lake insbesondere für Unternehmen mit großen Mengen eine echte Bereicherung. Dies liegt darin begründet, da, bei der optimalen Verwendung, dank tiefgehender Big Data Analysen echte Wettbewerbsvorteile erreicht werden können. Gleichzeitig muss bei der Menge der Daten aber auch auf ausreichenden Datenschutz geachtet werden. Dies macht die Verwendung eines Data Lake jedoch teilweise sehr aufwendig.

Mehr zum Thema Daten und Big Data liefern zudem folgende Artikel:

Genderhinweis: Ich habe zur leichteren Lesbarkeit die männliche Form verwendet. Sofern keine explizite Unterscheidung getroffen wird, sind daher stets sowohl Frauen, Diverse als auch Männer sowie Menschen jeder Herkunft und Nation gemeint. Lesen Sie mehr dazu.

Helfen Sie meinem Blog, vernetzen Sie sich oder arbeiten Sie mit mir

Sie können dem Blog helfen, indem Sie rechts in der Seitenleiste oder in der Mitte/Ende des Beitrags auf eine Werbeanzeige klicken. Das Forschungsprojekt erhält dadurch einen Euro.

Vernetzen Sie sich in jedem Fall auf Xing oder LinkedIn oder kontaktieren Sie mich direkt für einen Austausch, wenn Sie gleich mit mir ins Gespräch kommen wollen. Werfen Sie auch einen Blick in meine Buchvorschläge zur Digitalisierung, vielleicht wollen Sie mir auch ein Buch empfehlen?

Ich arbeite gerne mit Unternehmen zusammen. Sie können mich ebenfalls gerne bezüglich folgender Punkte anfragen:

Sie haben eigene, interessante Gedanken rund um die Themenwelt des Blogs und möchten diese in einem Gastartikel auf meinem Blog teilen? – Aber gerne!

Bildquelle: pixabay.com

Avatar
Autor

Externer Doktorand an der Universität Erlangen-Nürnberg am Lehrstuhl für IT-Management. Ich untersuche wie sinnvoll skalierte Agilität im Zuge des digitalen Wandels zur Zukunftsfähigkeit von Unternehmen beitragen kann. Neben der Promotion arbeite ich Vollzeit in einem Unternehmen.

Schreiben Sie einen Kommentar

*

Durch die weitere Nutzung der Seite stimmen Sie der Verwendung von Cookies zu. Weitere Informationen

Die Cookie-Einstellungen auf dieser Website sind auf "Cookies zulassen" eingestellt, um das beste Surferlebnis zu ermöglichen. Wenn du diese Website ohne Änderung der Cookie-Einstellungen verwendest oder auf "Akzeptieren" klickst, erklärst du sich damit einverstanden.

Schließen