Viele Unternehmen stehen gerade vor der Herausforderung, dass ihr altbewährte Data Warehouse nicht mehr ausreicht um den stetig steigenden Anforderungen und deren Komplexität gerecht zu werden. Häufig sind organisch bereits Data Lakes entstanden, die zwar größere Mengen an Daten günstig abspeichern, die aber wenig Vertrauen im Unternehmen genießen und sehr schwer zu operationalisieren sind. Als direkte Folge davon verschlechtert sich die Datensituation zusehends und stellt die Entscheider vor schwierige Herausforderungen. Der klassische zentralistische Ansatz funktioniert nicht mehr und moderne Konzepte wie Data Fabric oder Data Mesh müssen etabliert werden.
Produkte sind nicht die Lösung
Zunehmende Probleme und die sich gleichzeitig ergebenden hohen Potenziale zwingen Unternehmen in neue Richtungen zu denken. Es werden mögliche Großprojekte und umfangreiche Investitionssummen mit hohen unternehmerischen Risiken thematisiert. Gleichzeitig lassen sich aktuell noch wenig erfolgreiche Projekte mit ernstzunehmender Substanz im Markt finden. Der Vertrieb großer Beratungsfirmen, der mit großen Versprechungen winkt, erschwert die Situation weiter. Doch die Herausforderungen lassen sich nicht mit der Einführung von Produkten beantworten sondern mit Change-Management, Prozessveränderung, Know-How Aufbau und Kulturwandel. Bevor ich im nächsten Beitrag moderne Lösungsansätze diskutiere, möchte ich die Probleme der klassischen Datenlösungen vorstellen. Dies hilft bei der Verdeutlichung der konkreten Probleme, welche von alternativen Ansätzen adressiert werden.
Zentralistischer Flaschenhals
Traditionell haben sich Unternehmen an ein zentralisiertes Servicemodell für IT und Daten gehalten. Ein zentralisierter Ansatz gibt einem Kernteam die Verantwortung und Leitung für eine Funktion. Dabei entsteht eine ganzheitliche Sicht auf Daten und ein zentraler Service der diese zur Verfügung stellt. Alle anderen im Unternehmen müssen Anfragen an diesen zentralen Service stellen, wenn sie etwas benötigen. So funktioniert die IT seit Jahrzehnten.
Dieses Kernteam kümmert sich um die Speicherung, Bereinigung, Optimierung, Ausgabe und Nutzung von Daten an einem zentralen Ort. Es stellt dabei sicher, dass Daten von einer zentralen Quelle aus verwaltet werden, ist jedoch darauf ausgelegt, die Daten von vielen verschiedenen Punkten aus zugänglich zu machen. Es dient dazu, Datensilos zu minimieren, die Zusammenarbeit zu fördern und Einblick in neue Trends und Auswirkungen im gesamten Unternehmen zu geben. Eine zentralisierte Datenansicht hilft dabei, die Datenstrategie an der Geschäftsstrategie auszurichten, indem sie eine 360-Grad-Ansicht von Trends, Erkenntnissen und Vorhersagen liefert, sodass alle im Unternehmen in die gleiche Richtung gehen können.
Geschäftsbereiche werden zur Schatten IT gedrängt
Bei diesem klassischen Ansatz spricht man von den bekannten Data Warehouses oder Data Lakes. Diese stehen vor der Herausforderung, dass Prozesse ohne Beschleuniger oder eine Art Self-Service-Strategie langsam sein können. Den Flaschenhals bildet hier eine zentrale Stelle (oftmals sogar nur ein einziges Team), welches vor zunehmend größeren Aufgaben und Herausforderungen steht und gleichzeitig oftmals auch durch die zuliefernden Datenquellen blockiert werden kann. Die Erledigung von Anfragen dauert in solchen Ansätzen entsprechend lange. Da Bereiche in Unternehmen zu Ergebnissen gedrängt werden, beginnt der Organismus neue Wege zu suchen und umgeht die zentralen Datenteams. Es entsteht Schatten IT. Dies kann wiederum zu groben Corporate Governance Verstöße und Sicherheitsrisiken führen.
Förderale Ansätze müssen gesteuert werden
Moderne datengesteuerte Unternehmen haben keine Zeit, auf Daten zu warten. Sie brauchen sie in Echtzeit und demokratisiert, damit jeder im Unternehmen, der sie nützlich machen kann, die Möglichkeit dazu hat. Datendezentralisierung ist in den letzten Jahren eine Antwort auf träges Datenmanagement geworden. Unternehmen mussten überdenken, wie jeder Teil der Organisation funktioniert, um schneller voranzukommen. Die Dezentralisierung verteilt die Verantwortung zurück in die Geschäftsbereiche und gibt ihnen Zugriff auf Daten. Damit ein föderaler Ansatz nicht ungesteuert ins Chaos verfällt, werden ein föderales Regelwerk und Prozesse benötigt. Hierfür gibt es Vorgehensweise und Frameworks, die ich in den kommenden Beiträgen vorstellen werde.
- Data Fabric, Gartner, https://www.gartner.de/de/artikel/data-fabric-architecture-zur-modernisierung-von-datenmanagement-und-integration
- Data Mesh, Thoughtworks, https://www.thoughtworks.com/de-de/what-we-do/data-and-ai/data-mesh
- Data Warehouse, Wikipedia, https://de.wikipedia.org/wiki/Data_Warehouse
- Data Lake, talend, https://www.talend.com/de/resources/data-lake/