Data Lakes als ergänzende Plattform für analytische Anwendungen - Mehrwerte aus Ihren Daten gewinnen ohne dabei die Produktivsysteme zu belasten:
Die Produktivsysteme in einem Unternehmen dienen in erster Linie der Erfüllung des Tagesgeschäfts und sind von ihrer Skalierung auch daran angepasst. Insbesondere Daten-haltende Systeme sind dabei vorrangig auf die schnelle Verarbeitung von vielen kleinen parallelen Anfragen ausgelegt.
Data Analytics und Data Science Anwendung haben aber in der Regel einen stark explorativen Charakter mit ad-hoc Anfragen, die auf einen größeren Teil des Datenbestands auf einmal zugreifen. Das kann die produktiven Systeme unter große Last setzen und damit das Tagesgeschäft beeinträchtigen. Auch das Datenvolumen kann schnell anwachsen und die Produktivsysteme belasten.
Ein Ansatz hierfür liefert ein Data Lake als Sekundär-Plattform für analytische Anwendungen, um so die Produktivsysteme zu entlasten und gleichzeitig den Daten Analysten ein entsprechendes Toolset zur Verfügung zu stellen. Auch semi- und unstrukturierte Daten lassen sich in einem Data Lake abspeichern und auswerten.
Die größte Herausforderung bei einem Data Lake Ansatz liegt in der Integration mit den bestehenden Systemen und den nötigen Schnittstellen. Gemeinsam mit unserem Partner doubleSlash, der sich auf das Thema Daten-Integration und Daten-Workflows spezialisiert hat, entwickeln wir Lösungen und Workflows, die auf die Anforderungen unserer Kunden maßgeschneidert sind.
Ihre Vorteile:
- Explorative Daten-Analysen
- Maßgeschneiderte Daten-Workflows
- Produktivsysteme schlank und leistungsfähig halten
- Auch für semi- und unstrukturierte Daten anwendbar