Was sind Datensilos?
Ein Datensilo ist eine Ansammlung von Daten, die sich im Besitz einer Gruppe befinden und auf die andere Gruppen im selben Unternehmen nicht einfach oder uneingeschränkt zugreifen können. Finanz-, Verwaltungs-, Personal- oder Marketingteams und weitere Abteilungen benötigen für ihre Arbeit verschiedene Informationen. Daher neigen diese Abteilungen dazu, ihre Daten an separaten Orten zu speichern. Diese werden als Datensilos oder Informationssilos bezeichnet – in Anlehnung an die Lagerstätten, die Landwirte für verschiedene Getreidesorten verwenden. Nehmen Menge und Vielfalt dieser Datenbestände zu, so wachsen auch die Datensilos in gleichem Maße an.
Auf den ersten Blick mögen Datensilos harmlos erscheinen, aber solcherart isolierte Daten erschweren den Informationsaustausch und die Zusammenarbeit zwischen den Abteilungen. Aufgrund von siloübergreifenden Dateninkonsistenzen leidet zudem die Datenqualität. Schließlich erschweren es Datensilos Führungskräften, eine ganzheitliche Sicht auf Unternehmensdaten zu gewinnen.
Kurzum: Daten in Silos sind keine gesunden Daten. Daten sind dann gesund, wenn sie im gesamten Unternehmen zugänglich und leicht nachvollziehbar sind. Wenn Daten nur schwer zu finden und nicht zeitnah zu nutzen sind oder man nach dem Finden feststellt, dass sie nicht vertrauenswürdig sind, bringen sie für Analysen und Entscheidungsprozesse keinen Mehrwert. Ein Unternehmen, das auf Digitalisierung setzt, ohne Datensilos aufzubrechen, kann die Vorteile der digitalen Transformation nicht vollständig ausschöpfen. Unternehmen, die wirklich datengesteuert werden wollen, müssen Entscheidungsträgern eine 360°-Sicht auf die Daten bieten, die für ihre Analysen relevant sind.
Die Analyse unternehmensweiter Daten unterstützt eine fundierte Entscheidungsfindung und eine ganzheitliche Sicht auf verborgene Chancen – oder auch Bedrohungen! Zudem stellen isolierte Daten an sich ein Risiko dar. Daten in Silos machen unternehmensweite Data Governance unmöglich, erschweren die Einhaltung von Vorschriften und öffnen dem Missbrauch sensibler Daten Tür und Tor.
Wenn Sie besser verstehen möchten, ob Datensilos in Ihrem Unternehmen die Möglichkeiten einer ganzheitlichen Datenanalyse einschränken, müssen Sie zunächst einmal wissen, wie Datensilos entstehen, wie sie die optimale Nutzung Ihrer Daten verhindern und welche Möglichkeiten Ihnen zur Verfügung stehen, um Daten zu integrieren und Datensilos zu beseitigen.
Wie entstehen Datensilos?
Datensilos entstehen im Laufe der Zeit auf ganz natürliche Weise und spiegeln die Organisationsstrukturen wider. Jede Abteilung erfasst und speichert die Daten, die sie für ihre Zwecke benötigt: So schafft sich jede Abteilung ihr eigenes Datensilo. In den meisten Unternehmen lässt sich das Problem der Datensilos auf die folgenden Ursachen zurückführen:
Eine Organisationsstruktur, die die Silobildung fördert
Bevor Big Data und die Cloud für eine Revolution in der Unternehmenswelt sorgten, betrachtete man es nicht als Nachteil, dass jede Abteilung ihre eigenen Daten erstellte und verwaltete. Jede Abteilung hat schließlich eigene Richtlinien, Verfahren und Ziele. Die Teams haben ihre eigenen Arbeitsweisen entwickelt: Sie haben die Verarbeitung und Analyse der Daten an ihre Bedürfnisse angepasst. Silos entstehen folglich rund um die einzelnen Abteilungen eines Unternehmens, weil die Daten nach Abteilungen erfasst und gespeichert wurden.
Unternehmenskultur
Im Zusammenhang mit dem Gesagten steht auch, dass Abteilungen in vielen Unternehmen es gewohnt sind, in ihrer jeweils eigenen Welt zu agieren. Jede dieser Welten hat ihren eigenen Fachjargon, eigene Prozesse und eigene Herausforderungen. Wenn Mitarbeiter in physisch getrennten Bereichen mit jeweils eigenen Prozessen und Zielen arbeiten, betrachtet sich jede Abteilung naturgemäß als eigene Geschäftseinheit, die von anderen Teams separat agiert. Diese „Separationskultur“ bezieht auch Daten ein. So kann es selbst dann, wenn Vertrieb und Marketing mit Kundendaten arbeiten, sein, dass sie ihre Datenbestände – durch die Unternehmenskultur ermutigt – getrennt halten, ohne dies zu hinterfragen. Daten mit dem gesamten Unternehmen zu teilen, ist ein relativ neues Ziel. Die einzelnen Abteilungen waren deshalb zunächst nicht besonders motiviert, ihre Daten zu vereinheitlichen.
Technologie
Die sehr technisch ausgelegten Hilfsmittel und Datenverwaltungssysteme, die in vielen Unternehmen eingesetzt werden, haben die Entstehung von Datensilos begünstigt. Zur Unterstützung ihrer betrieblichen Prozesse nutzen verschiedene Abteilungen tendenziell unterschiedliche Technologielösungen und Tools, z. B. Tabellenkalkulationslösungen, Buchhaltungssoftware oder ein CRM wie Salesforce. Altsysteme sind dagegen in der Regel nicht darauf ausgelegt, den Datenaustausch zu ermöglichen. Jede Lösung speichert und verwaltet Daten auf unterschiedliche Weise, wobei die Ansätze von den jeweiligen Anbietern häufig individuell entwickelt wurden und daher proprietär sind – ein Umstand, der die gemeinsame Nutzung von Datensätzen mit Beteiligten aus anderen Abteilungen erheblich erschwert.
4 Wege, wie Datensilos Ihr Unternehmen heimlich, still und leise ruinieren
Jede Abteilung existiert, um ein übergeordnetes Ziel zu unterstützen. Die Abteilungen arbeiten zwar eigenständig, sind aber auch voneinander abhängig. Zumindest ein Teil der internen Daten, die in der Finanzabteilung erstellt und verwaltet werden, ist z. B. relevant für die Analysen des Managements und anderer Abteilungen.
Der Wettbewerbsdruck, erforderliche Kosteneinsparungen und der Wunsch, Chancen zu nutzen, veranlassen Unternehmen dazu, mehr aus ihren Daten herauszuholen. Um maximale betriebliche Effizienz zu erzielen und neue Möglichkeiten zu erkennen, muss der Zugriff auf für das gesamte Unternehmen relevante Informationen gegeben sein.
Aber Datensilos stellen ab irgendeinem Punkt ein Erfolgshindernis dar. Im Folgenden sind vier Möglichkeiten beschrieben, wie Datensilos Unternehmen schädigen können:
1. Datensilos schränken die Sicht auf die Daten ein
Silos verhindern, dass relevante Daten geteilt werden können. Die Analysen jeder einzelnen Abteilung werden durch ihre Sicht auf die Daten eingeschränkt. Ohne eine unternehmensweite Sicht auf Daten besteht keine Chance, unternehmensweite Ineffizienzen aufzudecken. Wie können Sie z. B. versteckte Chancen für die Einsparung von Betriebskosten aufdecken, wenn die Betriebs- und Kostendaten nicht konsolidiert sind?
2. Datensilos bedrohen die Datenintegrität
Wenn Daten in Silos isoliert sind, werden die gleichen Informationen häufig in verschiedenen Datenbanken gespeichert, was zu Inkonsistenzen zwischen den Daten der einzelnen Abteilungen führt. Daten, die älter werden, büßen im Laufe der Zeit an Korrektheit und so auch an Nutzen ein. Werden etwa Daten desselben Patienten in verschiedenen Systemen gespeichert, dann stimmen sie nach einiger Zeit möglicherweise nicht mehr überein.
3. Datensilos verschwenden Ressourcen
Wenn die gleichen Informationen an verschiedenen Orten gespeichert werden und Benutzer die Daten in ihren persönlichen oder ihren Gruppenspeichern herunterladen, dann leiden die Ressourcen darunter. Durch die Bündelung von Daten in einer Quelle wird wertvoller Speicherplatz frei. Dieses entlastet die IT-Abteilung von der Notwendigkeit, Speicherplatz zu kaufen und zu warten, der möglicherweise nicht benötigt wird. Wenn beispielsweise viele Mitarbeiter Daten herunterladen, um sie in einer Tabellenkalkulation zu analysieren, ist jeder Download eine redundante Kopie der vorhandenen Daten.
4. Datensilos erschweren die Zusammenarbeit
Die Unternehmenskultur führt zu Silos – und durch jedes Silo verfestigt sich die Kultur weiter. Für datengetriebene Unternehmen ist Zusammenarbeit ein leistungsstarkes Tool, das ihnen hilft, neue Erkenntnisse zu gewinnen und zu nutzen. Damit sich die Zusammenarbeit leichter gestaltet, müssen die einzelnen Abteilungen ihre Daten austauschen können. Können Daten nicht oder nur schwierig für andere freigegeben werden, beeinträchtigt das die Zusammenarbeit.
Wie man Datensilos in 4 Schritten aufbricht
Die Lösungen für Silos sind technischer und organisatorischer Natur. Die Zusammenführung von Daten für die Analyse ist durch die Cloud viel schneller und einfacher geworden. Cloud-basierte Tools optimieren den Prozess der Datenerfassung in einem gemeinsamen Pool und einem vereinheitlichten Format, um die Effizienz der Analyse zu steigern. Was früher Wochen, Monate oder womöglich Jahre gedauert hat, kann jetzt in wenigen Tagen oder gar Stunden erledigt werden.
1. Änderungsverwaltung
Wenn die Unternehmenskultur Datensilos erschaffen kann, dann ist sie auch der Schlüssel zum Aufbrechen dieser Silos. Kommunizieren Sie, welche Vorteile gemeinsame Datennutzung und Datenintegrität bieten, damit die Mitarbeiter die Umstellung nachvollziehen können. Erläutern Sie außerdem, welche Probleme Silos aufwerfen. Sprechen Sie dabei u. a. Aspekte wie Datenqualitätsprobleme und Wettbewerbsfähigkeit an. Ein Kulturwandel ist alles andere als trivial. Daher muss die Geschäftsführung mit Engagement an die Sache herangehen.
2. Entwickeln Sie einen Weg, um die Daten zusammenzuführen
Im Bereich der Datenverwaltungssysteme besteht der beste Weg zur Beseitigung von Silos in der Zusammenführung aller Unternehmensdaten in einem Cloud-basierten Data Warehouse oder Data Lake, d. h. einem zentralen Daten-Repository, das für effiziente Analysen optimiert ist. Daten aus unterschiedlichen Quellen werden homogenisiert und konsolidiert, und einzelne Nutzer oder Gruppen können Berechtigungen erhalten, um einen Zugriff zu gewährleisten, der geschäftliche Anforderungen mit Datenschutz- und Sicherheitsbedürfnissen in Einklang bringt.
3. Integrieren Sie Ihre Daten
Die effiziente und korrekte Integration von Daten ist eine sichere Methode, um die Entstehung von Datensilos künftig zu verhindern. Unternehmen nutzen zur Datenintegration eine von mehreren möglichen Methoden:
Skripts
Unternehmen können ihre IT damit beauftragen, Skripts in SQL, Python oder anderen Skriptsprachen zu erstellen, um Daten von Silo-Datenquellen in das Data Warehouse zu verschieben. Der Nachteil der Skriptentwicklung besteht darin, dass sie sehr komplex sein kann: Je umfangreicher die Datenquellen, desto stärker nimmt auch die Komplexität zu. Änderungen an Datenquellen erfordern zudem oft eine Aktualisierung der Skripts. Die Pflege der manuell programmierten Skripts ist kostenintensiv und zeitaufwendig.Lokale ETL-Tools
ETL (Extrahieren, Transformieren und Laden) und ELT-Tools automatisieren den Prozess der Datenschiebung aus verschiedenen Quellen in das Data Warehouse. Diese Tools extrahieren Daten aus Quellen, wandeln sie für die Analyse in ein einheitliches Format um und laden das Ergebnis in ein Data Warehouse im Rechenzentrum des Unternehmens.Cloud-basierte ETL-Prozesse
Cloud und Daten gehen Hand in Hand und fortschrittliche Cloud-Anbieter gestalten den ETL-Prozess einfacher und schneller. Cloud-basierte ETL-Prozesse nutzen die Infrastruktur des Cloud-Providers – u. a. Data-Warehouse- und ETL-Tools, die entwickelt wurden, um effizient in der jeweiligen Umgebung zu arbeiten. ETL bricht Silos auf: Es werden die technologischen Mittel bereitgestellt, um Daten aus verschiedenen Quellen zur Analyse an einem zentralen Ort zusammenzuführen. ETL hilft Probleme in puncto Datenintegrität zu beheben, damit alle Beteiligten immer mit frischen Daten arbeiten können.
4. Ermöglichen Sie einen verwalteten Selfservice-Zugriff
Wenn Daten zentralisiert und integriert werden, haben Sie auch die Möglichkeit, mit einem Data-Governance-Framework Datenzugriff und Kontrolle zu zentralisieren. Robuste Datenzugriffsrichtlinien erleichtern die Selfservice-Analyse, d. h., Business-Anwender mit entsprechender Berechtigung können unkompliziert auf die erforderlichen Daten zugreifen, ohne dass es zu Problemen oder Verzögerungen käme, wie sie typischerweise auftreten, wenn IT-Mitarbeiter die Abläufe beaufsichtigen müssen.
Die Cloud und die Zukunft der Datenspeicherung
Die Cloud hat sich als natürlicher Weg herauskristallisiert, Daten aus verschiedenen Quellen zusammenzuführen, damit im Büro, zu Hause, unterwegs oder an entfernten Standorten leichter darauf zugegriffen werden kann.
Cloud-Datenlösungen tragen dazu bei, die technologischen Hindernisse für die Zusammenarbeit zu beseitigen, und bieten eine sofort einsatzbereite Lösung zur Verknüpfung von Daten in Silos. Mithilfe eines etablierten ETL-Prozesses werden irrelevante Daten entfernt und Duplikate beseitigt. So können Unternehmen neue und aktualisierte Daten schnell in einem Cloud Data Warehouse ablegen, und die verschiedenen Abteilungen werden in die Lage versetzt, unverbrauchte, saubere und aktuelle Daten auf einer zentralen und leicht zugänglichen Plattform, die zudem nach Bedarf skaliert werden kann, gemeinsam zu nutzen.
Cloud-Technologie und Cloud Data Warehouses vernetzen separate Geschäftsbereiche zu einem zusammenhängenden Ökosystem. Datenanalysten erhalten einen besseren Überblick darüber, wie sich ihre Arbeit auf das Unternehmen insgesamt auswirkt und wie sich die Arbeit aller Beteiligten gegenseitig beeinflusst. Durch den Zugriff auf unternehmensweit gültige Daten erhalten Analysten eine 360°-Sicht auf das Unternehmen.
Datensilos aufbrechen
Datensilos untergraben die Produktivität, behindern die Gewinnung von Erkenntnissen und beeinträchtigen die Zusammenarbeit. Datensilos stellen allerdings kein Hindernis mehr dar, wenn die Daten zusammengeführt und für die Analyse optimiert werden sollen. Die Cloud-Technologie wurde dahin gehend verbessert, eine solche Zentralisierung möglich zu machen.
Tausende von Unternehmen weltweit entscheiden sich für die Zentralisierung von Daten in der Cloud mit Talend Data Fabric, denn Talend vereinfacht ETL für die Datenintegration, Data Governance, Sicherheit und regulatorische Compliance, ermöglicht abteilungsübergreifenden Datenzugriff und beseitigt entstandene Silos. So hat beispielsweise für Covanta, einem Energieversorger, der Strom aus Abfall gewinnt, die Überwindung von Datensilos höchste Priorität, um Daten besser erfassen, verwalten, transformieren und freigeben zu können. Sobald die Abteilungen im gesamten Unternehmen in Echtzeit mit einer einzigen einheitlichen Datenquelle kommunizieren konnten, ließen sich Ineffizienzen leicht erkennen und beseitigen. Convanta senkte allein die Kosten für Wartungsaktivitäten um 10 % pro Jahr.
Talend Data Fabric ermöglicht es Anwendern im gesamten Unternehmen, mithilfe einer umfassenden Anwendungssuite zusammenzuarbeiten – eine Lösung, die den nachhaltigen Abbau von Silos vereinfacht. Sie können Talend Data Fabric testen, um sich selbst davon zu überzeugen, wie Talend Ihnen helfen kann, Silos zu beseitigen, Abläufe zu optimieren und Ihren Gewinn für eine ganze Reihe von Anwendungsfällen anzukurbeln. Wir helfen Ihnen dabei, Datensilos aufzubrechen und sicherzustellen, dass die Entscheidungsträger in Ihrem Unternehmen immer einen vollständigen Überblick über die Unternehmensdaten haben.
Sind Sie bereit, mit Talend durchzustarten?
Weitere Artikel zu diesem Thema
- Datenextraktion – Eine Definition
- Talend „Job Design Patterns“ und Best Practices: Teil 4
- Talend „Job Design Patterns“ und Best Practices: Teil 3
- Was ist Datenmigration?
- Was ist Daten-Mapping?
- Datenbankintegration: Vorteile, Arten und Instrumente
- Was ist Datenintegration?
- Datenmigration verstehen: Strategie und Best Practices
- Talend Job Design Modelle und Best Practices: Teil 2
- Talend „Job Design Modelle“ und Best Practices: Teil 1
- Change Data Capture: Informationen und Anwendungsmöglichkeiten
- 5 erfolgreiche Datenintegrationsstrategien
- Ein Talend Überblick für Informatica PowerCenter-Entwickler: Teil 1