Heute Big Data - Morgen Data Warehouse (DWH) 2.0?

von Sven Bosinger (Kommentare: 0)

Das neue Schlagwort im Bereich Business Intelligence heißt „Big Data“.

Ist das nur ein neuer Hype, der genauso schnell wieder verschwindet wie er aufgetaucht ist, oder gibt es hier mehr Substanz? Diese Frage lässt sich nicht so einfach beantworten. Zuerst muss man dazu verstehen was mit "Big Data" gemeint ist und wieso dieser Ansatz in der BI-Gemeinde auf sehr viel Widerhall trifft.

Die aktuelle Situation bei vielen Unternehmen, die ein klassisches Data Warehouse betreiben, ist durch zwei Faktoren gekennzeichnet, die in Konkurrenz zueinander stehen: Datenqualität und Geschwindigkeit. Data Warehouse Daten werden mittlerweile in fast allen Unternehmen als erfolgskritisch eingestuft. Das heisst unternehmerische Entscheidungen werden auf Basis des Data Warehouse getroffen. Je besser die Qualität der Daten, desto besser die Entscheidungen. Daher ist die Data Warehouse-Entwicklung in entsprechende Prozesse eingebunden, die dafür sorgen sollen, dass möglichst nur belastbare und qualitätsgesicherte Informationen bereitgestellt werden. Der Nachteil der daraus resultierenden, stark formalisierten und prozessorientierten Entwicklung ist, dass Sie in der Regel einen gewissen "Overhead" mit sich bringt und somit langsam ist.

Demgegenüber steht die Schnelllebigkeit der heutigen Zeit, besonders in der IT. So müssen z.B. Apps für Smartphones und Tablets ihren Gewinn in wenigen Wochen erwirtschaften, da schon nach kurzer Zeit Nachahmerprodukte zum Preisverfall führen. Um in diesem Markt überlebensfähig zu sein, müssen Entscheidungen schnell getroffen und die dafür benötigten Entwicklungen in wenigen Tagen oder gar Stunden durchgeführt werden.

Ein langwieriger Data Warehouse-Entwicklungsprozess zur Unterstützung derartiger Entscheidungen ist nicht praktikabel. Genau in diesem Kontext verspricht "Big Data" schnelle Ergebnisse auf großen unstrukturierten Datenmengen - und das möglichst in Echtzeit.

Momentan kann man zwei Schwerpunkte im "Big Data" Umfeld erkennen:

  • Das Herausfiltern relevanter Informationen aus einem Grundrauschen von nahezu unendlich großen Datenströmen
  • Der Zugriff auf Social Media Daten.

Beides schließt sich gegenseitig nicht aus.

Hierzu zwei Beispiele:

Ein Fahrzeughersteller überwacht alle von ihm gefertigten und verkauften Fahrzeuge "Online". Dabei werden von mehreren Millionen Fahrzeugen permanent, alle relevanten Motor und Abgasdaten, an einen zentralen Rechner übertragen. Bei der Überschreitung systemrelevanter Parameter werden zusätzliche Wartungsintervalle pro Fahrzeug veranlasst, um größere Schäden zu vermeiden. Des Weiteren werden alle diese Daten systematisch auf versteckte Regelmäßigkeiten untersucht um Serienfehler zu erkennen, bevor sie zu Problemen beim einzelnen Kunden führen.

Um die Bindung von Prepaid-Kunden bei einem Telekommunikationsanbieter zu erhöhen, wird vor dem Aufbrauchen des Restbetrags per SMS ein neues Angebot gesendet. Bei Annahme des Angebots kann der Kunde in einem Coffee-Shop, in der Nähe seines aktuellen Aufenthaltsortes, sofort ein Gratisgetränk beziehen. Die Art des Getränkes und der Anbieter werden dabei aus seinen, in diversen Social Media Portalen geposteten Vorlieben, abgeleitet.

Science Fiction? Keineswegs, alle Bausteine dafür sind heute schon vorhanden. "Big Data" ist ein Weg sie zusammenzubringen!

Beide Beispiele bergen allerdings auch datenschutzrechtlichen Sprengstoff:

  • In wie weit dürfen öffentlich zugängliche Informationen zusammengebracht und in Beziehung gesetzt werden?
  • Unter welchen Bedingungen muss hier die Zustimmung der betroffenen Kunden eingeholt werden?
  • Wie gläsern werden wir oder sind es bereits?

Wer jetzt allerdings glaubt durch "Big Data" sein bisweilen als behäbig, langsam und teures verschrienes Data Warehouse ersetzen zu können, der sitzt einem Irrglauben auf. "Big Data" ist als Ergänzung und nicht als Konkurrenz zu einem klassischen Data Warehouse zu sehen. Nach wie vor sind die Anforderungen, die zu den heute vorhandenen Data Warehouse-Lösungen geführt haben, gültig. Nicht jede Information in einem Unternehmen muss den Anspruch des "Real-Time" gerecht werden. Nicht alle Daten sind hochgradig unstrukturiert. Was "Big Data" allerdings leistet ist: das Data Warehouse von nicht dafür geeigneten Aufgaben zu entlasten.

Mit "Big Data" wird somit ein breites Spektrum von Anwendungsmöglichkeiten eröffnet, dass bisher aus Kosten- und Praktikabilitätsgründen nicht im Kontext eines klassischen Data Warehouse angegangen wurde oder konnte. Ob diese Anwendungsmöglichkeiten positiv zum Umsatz eines Unternehmens beitragen muss im Einzelfall entschieden werden.

Die traditionellen Datenströme in einem Data Warehouse sind davon unbenommen. Nach wie vor wird es Ladeprozesse für die internen und wohl strukturierten Informationen geben, die aus den einzelnen ERP-Systemen geliefert werden können. Es macht sicher keinen Sinn, die Finanzkennzahlen über einen Big Data Ansatz in das Data Warehouse zu laden.

Zurück zur Eingangsfrage: Hype oder Substanziell?

Diese Frage lässt sich zum heutigen Zeitpunkt wohl nicht abschließend beantworten. Für Unternehmen bietet "Big Data" das Potential ganz neue Geschäftstaktiken und -praktiken auszuprobieren. Viel schneller als bisher gewohnt zu reagieren und ganze Geschäftsmodelle auf diesen Gewinn an Reaktionszeit aufzubauen. Das Risiko besteht allerdings in der gesellschaftlichen Akzeptanz dieses Vorgehens.

Zurück

Einen Kommentar schreiben