Was ist ein Data Lake? Flexible Großdatenspeicher erklärt

Ein Data Lake kann ein flexiblerer Speicherort, als ein Datenlager sein. Oder ein Mistkübel dessen Inhalt wächst und wächst. [...]

Big Data ist ein immer aktueller werdendes Thema. Vor allem Unternehmen zerbrechen sich darüber den Kopf. Was ein Data Lake für Vorteile bringt erfahren Sie hier. (c) Pixabay
Big Data ist ein immer aktueller werdendes Thema. Vor allem Unternehmen zerbrechen sich darüber den Kopf. Was ein Data Lake für Vorteile bringt erfahren Sie hier. (c) Pixabay

Wenn Sie sich für die aktuellsten Neuigkeiten rund um Technologiekonzepte im Bereich Big Data interessieren, ist Ihnen der Begriff „Data Lake“ wahrscheinlich bereits untergekommen. Bei dem Wort Lake, aus dem Englischen = See, kommt einem schnell eine große Menge, ein Speicher, an Wasser in den Sinn. Und im Grunde ist genau das das Konzept: Ein Data Lake ist ein Speicher für Daten.


Data Lake definiert
Ein Data Lake ist ein Speicherbehältnis, das große Mengen an rohen, unstrukturierten Daten in ihrer ursprünglichen Form, aufbewahrt.

Das bedeutet, das alles was Sie dazu brauchen ein Gerät ist, dass eine Flat-File-Datenbank unterstützt. Wenn Sie wollen, können Sie also einen Großspeicher benutzen. Die Daten werden auf andere Server verteilt, um sie zu verarbeiten. Die meisten Unternehmen nutzen hierfür das Hadoop File System (HDFS), da es für schnelles verarbeiten von großen Datensätzen entworfen wurde und meist in Big Data Umfeldern, wo Data Lakes am ehesten vorkommen, genutzt wird.

Dieser Unterstützung für Ursprungsdaten bringt wesentliche Vorteile mit sich. „Wenn ich eine unglaublich große Anzahl an Datensätzen bekomme und herausfinden muss, was ich damit später mache, ist das genau das, wozu wir Data Lakes momentan nutzen.“, so Michael Hiskey, Chefstratege bei Semarc...

Um diese Inhalte abzurufen, registrieren Sie sich bitte für den kostenlosen Business Account.

Werbung

Mehr Artikel