Was ist ein Data Lake? Flexible Großdatenspeicher erklärt

Ein Data Lake kann ein flexiblerer Speicherort, als ein Datenlager sein. Oder ein Mistkübel dessen Inhalt wächst und wächst. [...]

Big Data ist ein immer aktueller werdendes Thema. Vor allem Unternehmen zerbrechen sich darüber den Kopf. Was ein Data Lake für Vorteile bringt erfahren Sie hier. (c) Pixabay
Big Data ist ein immer aktueller werdendes Thema. Vor allem Unternehmen zerbrechen sich darüber den Kopf. Was ein Data Lake für Vorteile bringt erfahren Sie hier. (c) Pixabay

Wenn Sie sich für die aktuellsten Neuigkeiten rund um Technologiekonzepte im Bereich Big Data interessieren, ist Ihnen der Begriff „Data Lake“ wahrscheinlich bereits untergekommen. Bei dem Wort Lake, aus dem Englischen = See, kommt einem schnell eine große Menge, ein Speicher, an Wasser in den Sinn. Und im Grunde ist genau das das Konzept: Ein Data Lake ist ein Speicher für Daten.


Data Lake definiert
Ein Data Lake ist ein Speicherbehältnis, das große Mengen an rohen, unstrukturierten Daten in ihrer ursprünglichen Form, aufbewahrt.

Das bedeutet, das alles was Sie dazu brauchen ein Gerät ist, dass eine Flat-File-Datenbank unterstützt. Wenn Sie wollen, können Sie also einen Großspeicher benutzen. Die Daten werden auf andere Server verteilt, um sie zu verarbeiten. Die meisten Unternehmen nutzen hierfür das Hadoop File System (HDFS), da es für schnelles verarbeiten von großen Datensätzen entworfen wurde und meist in Big Data Umfeldern, wo Data Lakes am ehesten vorkommen, genutzt wird.

Dieser Unterstützung für Ursprungsdaten bringt wesentliche Vorteile mit sich. „Wenn ich eine unglaublich große Anzahl an Datensätzen bekomme und herausfinden muss, was ich damit später mache, ist das genau das, wozu wir Data Lakes momentan nutzen.“, so Michael Hiskey, Chefstratege bei Semarc...

Um diese Inhalte abzurufen, registrieren Sie sich bitte für den kostenlosen Business Account.

Werbung


Mehr Artikel

Proofpoint hat den Proofpoint Targeted Attack Protection Index (TAP) vorgestellt. (c) pixabay
News

Proofpoint führt Index zur Bewertung gefährdeter Mitarbeiter durch Cyberangriffe ein

Proofpoint hat den Proofpoint Targeted Attack Protection Index (TAP) vorgestellt mit dem IT-Security-Teams in den Unternehmen die aktuelle Gefährdung einzelner Personen im Unternehmen einschätzen können. Der Hintergrund ist die Strategie der Cyberkriminellen, nicht die technische Infrastruktur direkt anzugreifen, sondern über Mitarbeiter Zugang zu Systemen im Unternehmen zu erlangen. […]

(c) MariaDB
Whitepaper

Open-Source-Datenbanken für Unternehmen: MariaDB vs. Oracle MySQL vs. EnterpriseDB

In diesem Whitepaper vergleichen wir die Datenbanken von MariaDB, Oracle und EnterpriseDB: MariaDB TX, MySQL Enterprise Edition und EnterpriseDB Postgres Platform. Zunächst vergleichen wir di Geschäftsmodelle und Lizenzen und gehen dann genauer auf die folgenden Datenbankfunktionen ein: Notfallwiederherstellung, Hochverfügbarkeit, Sicherheit, Firewall, Leistung und Skalierbarkeit, Entwicklung, Oracle-Kompatibilität […]