Was ist Datenredundanz?
Eine Datenredundanz liegt vor, wenn in einem Datenbank- oder Datenspeichersystem dieselben Daten gehalten werden. Identische Daten können in zwei unterschiedlichen Feldern innerhalb einer einzigen Datenbank oder zwei unterschiedlichen Punkten in mehreren Softwareplattformen oder Umgebungen vorliegen. Datenredundanz kann unbeabsichtigt auftreten oder gezielt zu Back-up- und Wiederherstellungszwecken genutzt werden.
Zur versehentlichen Datenredundanz kommt es etwa, wenn Daten aufgrund ineffizienter Codierung oder hoher Prozesskomplexität dupliziert werden. Im Gegensatz dazu lassen sich durch zielgerichtete Datenredundanz häufig Daten schützen und die Einheitlichkeit fördern.
Es ist in Ordnung, Daten an verschiedenen Orten zu speichern. Um Probleme zu vermeiden, ist es wichtig, ein zentrales Feld oder einen zentralen Bereich für diese Daten zu haben, sodass man alle redundanten Daten über einen einzigen Zugriffspunkt aktualisieren kann. Andernfalls kann diese Art von Datenredundanz zu inkonsistenten Daten führen (d. h. bei einem Update findet keine automatische Aktualisierung der anderen Felder statt). Daten, die identisch sein sollten, haben so unterschiedliche Werte, was Probleme bei der Verarbeitung verursachen kann.
Wie MDM die Datenredundanz reduzieren kann
Datenredundanz ist in vielen Organisationen ein Thema. Die meisten großen Unternehmen verfügen über ein heterogenes Anwendungsportfolio, wobei Fragmente oft ungenauer, unvollständiger und uneinheitlicher Daten in verschiedenen Anwendungssilos vorliegen. Häufig tritt Datenredundanz in Unternehmen auf, die eine einheitliche Sicht auf ihren Kundenstamm erzielen möchten. Doch wenn Daten über viele operative Systeme verteilt vorliegen, ist ein Abgleich eine echte Herausforderung.
Zum Beispiel könnte ein und dieselbe Kundin in einem System als Frau Smith vorliegen und in einem anderen als Theresa Smith. Eine intelligente Entscheidungsfindung wird so erheblich erschwert. Für die Lösung dieser Probleme kommt es auf den Umgang mit gemeinsam genutzten Daten an.
Durch die Stammdatenverwaltung (Master-Data-Management, MDM) können Unternehmen all ihre kritischen Daten zu einer „Masterdatei“ zusammenführen, die einen einheitlichen Bezugspunkt bildet. Stammdaten sind beispielsweise Informationen zu Kunden, Produkten, Ressourcen, Standorten, Mitarbeitern und Organisationseinheiten.
MDM wurde entwickelt, um gemeinsam genutzte Daten effizienter zu verwalten, Datenredundanz zu verhindern und eine „einzige Version der Wahrheit“ – die oft schwer zu erreichen ist – sicherzustellen. MDM ermöglicht sowohl Datenkonsistenz als auch Flexibilität und bietet somit einen enormen Wettbewerbsvorteil und einen hohen ROI.
Heute haben Unternehmen alle Hände voll damit zu tun, ihre Kosten zu reduzieren, Compliance-Reporting-Vorgaben einzuhalten, ihre Umsätze zu steigern und ihren Kunden und Lieferanten einen überragenden Service zu bieten. Für Analysten sind das genau die Bereiche, in denen MDM einen Unterschied machen kann.
Das Stammdatenmanagement umfasst eine Reihe von Prozessen und Tools, mit denen sich die nicht transaktionalen Dateneinheiten einer Organisation einheitlich definieren und verwalten lassen. Ziel ist es, Prozesse bereitzustellen, um solche Daten organisationsweit zu erfassen, zu aggregieren, abzugleichen, zu konsolidieren, zu persistieren, zu verteilen und deren Qualität zu sichern. So lassen sich eine hohe Konsistenz und Kontrolle bei der laufenden Wartung und der Nutzung dieser Informationen in Anwendungen sicherstellen.
Wie die Talend-MDM-Lösung Probleme mit der Datenredundanz löst
Talend MDM ist eine modellbasierte, nicht intrusive Lösung, die sich denkbar einfach an individuelle Geschäftsanforderungen anpassen und schnell implementieren lässt. Entwickelt wurde sie speziell, um die Herausforderungen bei der Erstellung und Verwaltung von Stammdaten in sämtlichen Arten von Organisationen zu meistern, in denen (unter Umständen extrem flüchtige) Daten in verschiedenen Formaten und Systemen vorliegen.
Talend MDM bietet eine umfassende Funktionalität für die unternehmensweite Verwaltung, Steuerung und Integration von Daten und gruppiert sämtliche Stammdaten in einem zentralen Hub. Mithilfe von Datenmodellen schafft dieses standardisierte Repository die Voraussetzungen, um Daten und Updates zu prüfen.
Als wichtiger Bestandteil der Talend-MDM-Lösung eignet sich Talend Studio besonders gut zur Lösung von Datenredundanzproblemen. Mit den erforderlichen Verarbeitungsebenen ausgestattet, bietet Talend Studio die richtigen Tools für die richtigen User, um Stammdaten zentral zu modellieren und zu bearbeiten – darunter auch alle relevanten Features für Stammdaten-Governance und -Stewardship.
Data-Governance ist der Prozess, in dem die Regeln für alle Stammdaten definiert werden. Durch Data-Stewardship wird sichergestellt, dass die Daten diese Regeln befolgen. Dementsprechend ist es notwendig, sowohl eine Governance-Funktion einzurichten, um sicherzustellen, dass die richtigen Kontrollen vorhanden sind, als auch eine Stewardship-Funktion, um zu gewährleisten, dass diese Kontrollen auch durchgesetzt werden.
Talend Studio bietet:
- Data-Profiling- und Datenqualitätsfeatures in der Profiling-Perspective: Diese ermöglichen das Profiling und die Bereinigung der Quelldaten, bevor sie in den MDM-Hub geladen werden, und stellen hohe Standards für die Stammdatenqualität in Ihrem Unternehmen sicher. In der Profiling-Perspective können Benutzer Daten aus verschiedenen Quellen bereinigen und ein Profiling durchführen, bevor sie diese Informationen in den MDM-Hub laden.
- Stammdatenmanagement-Features in der MDM-Perspective: Damit können Sie Datenmodelle erstellen und dabei die nötigen Unternehmens- und Datenregeln anwenden, um eine einzige Masterkopie der Daten zu generieren, die anschließend an die Quell- und Zielsysteme weitergeleitet wird.
- Features zur Lösung von Datenkonflikten in der Talend MDM-Weboberfläche über die Talend Data Stewardship Console: Diese wurden für Einträge konzipiert, die nach einem Abgleich auf Basis unterschiedlicher Datenquellen generiert werden und für die eine Entscheidung getroffen werden muss, um den „goldenen Stammdatensatz“ zu erzeugen.
Je größer die Menge und Vielfalt an Daten und je größer die Anzahl an Quellen, aus denen sie stammen, desto mehr Kopfzerbrechen bereitet die Datenredundanz – auch datengestützten Unternehmen. Vor diesem Hintergrund können Stammdatenmanagement-Lösungen einen großen Beitrag leisten, um Probleme mit der Datenredundanz zu minimieren.
Testen Sie das Open-Source-basierte MDM-Produkt von Talend noch heute.
Sind Sie bereit, mit Talend durchzustarten?
Weitere Artikel zu diesem Thema
- Data-Profiling: Definition, Tools und Nutzen
- Datenintegrität: Bedeutung, Arten & Risiken
- Durch hohe Datenqualität richtige Entscheidungen treffen
- Datensynchronisation: Definition, Methoden, Herausforderungen
- Leistungsstarkes Datenqualitätsmanagement mit Talend
- Data Quality Tools richtig auswählen und Datenqualität sichern
- Einsatz von maschinellem Lernen für Data Quality