Was ist Vertrauen in Daten?

Können Sie den Daten Ihres Unternehmens vertrauen?

Eine Untersuchung zur Datengesundheit aus dem Jahr 2021 zeigt, dass 60 % der Führungskräfte nicht immer den Daten ihres Unternehmens vertrauen. Mehr als ein Drittel stützt die meisten Entscheidungen noch immer nicht auf Daten. Das ist eine Krise für Unternehmen aus allen Branchen und weltweit. Wie kann ein Entscheidungsträger, der seinen Daten nicht vertraut, Vertrauen in die eigenen Entscheidungen haben? 
 
Sehen wir uns zunächst an, was diese Daten sind. In den letzten Jahren ist die Welt zunehmend datengesteuert geworden, sodass die Netzwerke von Unternehmen mit Informationen gesättigt wurden. Ein Teil der Daten kommt über SaaS- und Webanwendungen. Andere Daten stammen aus der direkten Dateneingabe – denken Sie an Webformulare. Einige Daten sind unstrukturiert, wie Social Media-Beiträge. Und immer mehr Daten stammen von Endgeräten wie Smartphones und IoT-Devices. Schätzungen zufolge beläuft sich die jährlich erzeugte Datenmenge auf mehrere Zettabytes. Ein Zettabyte ist mehr als eine Milliarde Terabyte. Das ist eine unvorstellbare Datenmenge.
 
Manuelles Datenqualitätsmanagement kann einfach nicht auf diese Mengen skaliert werden. Menschen machen Fehler. Maschinen sind nicht narrensicher. Darüber hinaus durchlaufen die Daten häufig komplexe Informationssysteme, die von mehreren Entwicklern programmiert wurden. Das erhöht das Risiko, durch falschen Code Fehler einzuschleppen. 
 
Aber was bedeutet es, Ihren Daten zu vertrauen? 

Definition des Vertrauens in Daten

Vertrauen in Daten bedeutet, dass die Daten Ihres Unternehmens gesund und einsatzbereit sind.  

Vertrauen ist einer der Schlüssel zur erfolgreichen Nutzung Ihrer Daten. In Kombination mit Kultur und Agilität führt Vertrauen in Daten beim Unternehmen dazu, Datengesundheit zu erreichen. Durch die Sicherstellung des Vertrauens in Daten im gesamten Unternehmen und in allen Abteilungen bietet ein Unternehmen seinen Teams die Möglichkeit, außergewöhnliche Kundenerlebnisse zu gestalten, Abläufe zu verbessern, Entscheidungen zu rationalisieren, Compliance sicherzustellen und Innovationen voranzutreiben. Aber das Vertrauen in Daten muss verdient und quantifiziert werden. Blindes Vertrauen ist fehl am Platz. Bevor Sie den Daten Ihres Unternehmens vertrauen, sollten Sie nachweisen, dass sie zuverlässige Analysen ermöglichen, um fundierte Geschäftsentscheidungen zu unterstützen.

Dimensionen der Datenqualität

Wie messen Sie das Vertrauen in Daten? Die Data Management Association of the UK definiert sechs Dimensionen der Datenqualität:  

  • Richtigkeit – Der Grad, zu dem Daten das beschriebene reale Objekt oder Ereignis korrekt beschreiben.
    • Beispiel: Ein Buchhaltungsdatensatz verwendet das US-Datumsformat MM/TT/JJJJ. Daten, die im europäischen Format TT/MM/JJJJ eingegeben wurden, können dazu führen, dass eine am 8. Mai fällige Rechnung erst am 5. August bezahlt wird.
  • Vollständigkeit – Das Verhältnis zwischen den gespeicherten Daten und dem Potenzial, 100 % zu erreichen.
    • Beispiel: Leere Werte geben an, dass bestimmte Daten nicht eingepflegt wurden. Ein Adressdatensatz mit 300 Zeilen und 12 fehlenden Postleitzahlen enthält nutzbare Daten für 288 Adressen und eine Abschlussrate von 288/300 oder 96 %. 
  • Konsistenz – Das Fehlen von Abweichungen, wenn zwei oder mehr Darstellungen eines Konzepts mit einer Definition verglichen werden.
    • Beispiel: Verwenden die Personal-, Rechts- und Finanzteams eines Unternehmens alle ein Datumsformat, oder würde dasselbe Datum in Berichten, die von verschiedenen Abteilungen erstellt wurden, als 11.12.2022, 12.11.22 und 22. NOV-12 erscheinen? 
  • Aktualität – Der Grad, in dem die Daten aktuell genug sind, um die Realität so darzustellen, wie sie zur Unterstützung von Geschäftsfunktionen erforderlich ist.
    • Beispiel: In einem Feld, das die Unternehmensgewinne darstellt, ist es wichtig, Zugriff auf die neuesten Daten zu haben. Was ist die Verzögerung bei der Bereitstellung dieser Daten – liegt sie in der Größenordnung von Minuten, Tagen oder Wochen? 
  • Eindeutigkeit – Kein Element oder keine Entitätsinstanz wird mehr als einmal aufgezeichnet, basierend darauf, wie dieses Element identifiziert wurde. 
    • Beispiel: Duplizierung eines Datensatzes eines einzelnen Kunden basierend auf mehreren Einträgen, z. B. Lee, Alan R. Lee, und Alan Lee , der als drei Personen mit derselben Adresse und denselben Kontaktinformationen auftritt. 
  • Gültigkeitbzw. Gleichförmigkeit – Der Grad, in dem Daten mit der Syntax (Format, Typ oder Bereich) ihrer Definition übereinstimmen.
    • Beispiel: Die Adresse 1000 Integration Drive ist gültig, aber nicht unbedingt richtig. Die Adresse H/* 27 Integration Drive ist nicht gültig. 

Je höher Sie die Daten in jeder dieser Dimensionen für alle Tabellen, Datensätze und Felder bewerten können, desto mehr können Sie ihnen vertrauen – und desto entscheidungsunterstützender sind Ihre Daten. Aber nur weil bestimmte Aufzeichnungen oder Datensätze in einer Dimension eine gute Bewertung haben, bedeutet das nicht unbedingt, dass sie zu 100 % vertrauenswürdig sind. Wie oben gezeigt, verfügen Sie möglicherweise über Informationen, die gültig, aber nicht korrekt oder korrekt, aber unvollständig sind.

Was am wichtigsten ist, hängt vom geschäftlichen Bedarf ab. Zum Beispiel benötigen Finanzteams ein besonders hohes Maß an Genauigkeit, während andere Abteilungen stattdessen Wert auf zeitnahe Bereitstellung legen. Datenteams müssen ihre eigenen Bewertungen der Metriken vornehmen, die Daten erfüllen müssen. Sie sollten auch die Zertifizierung der Datenqualität für Datennutzer quantifizieren. Eine Kombination aus Vertrauen und Transparenz gibt den Entscheidungsträgern das Vertrauen, die Daten zu nutzen.

Bedenken Sie jedoch, dass die Datenqualität nur ein Aspekt des Vertrauens in Daten ist. Die Vision von Talend für vertrauenswürdige Daten umfasst auch Faktoren wie Tools, mit denen Daten leicht zu finden, zu verbessern, zu verifizieren und zu verwenden sind, sowie Selfservice-Apps, mit denen Benutzer von Geschäftsbereichsdaten die Kontrolle über ihre eigenen Daten haben. Wenn beispielsweise Daten von hoher Qualität sind, aber die Menschen, die sie benötigen, keinen Zugang dazu haben, tragen diese Daten dann wirklich zum Vertrauen in Daten bei? Welche Faktoren Sie auch in Ihre Messung vertrauenswürdiger Daten einbeziehen, es geht darum, zu quantifizieren, wie nutzbar Ihre Daten im gesamten Unternehmen sind: Sind sie entscheidungsunterstützend?

Rahmen für das Vertrauen in Daten

Um Vertrauen in Daten in einer Welt zu erreichen, in der man in Daten erstickt, müssen Unternehmen Prozesse für die Prüfung, Bewertung und Bereinigung ihrer Daten implementieren und automatisieren. Vertrauen in Daten kann jedoch nicht allein durch Technologie erreicht werden. Vollständige Lösungen für das Vertrauen in Daten erfordern eine Dateninfrastruktur, die menschliche Prozesse und Software berücksichtigt. Es ist notwendig, eine datenzentrierte Kultur zu schaffen, die mit der Automatisierung der Datenqualität zusammenarbeitet.

Die Infrastruktur für Datengesundheit nutzt das Wissen der Beteiligten in den Geschäftsbereichen, um Daten zu bereinigen, sowie modernste Tools und künstliche Intelligenz, mit denen Dateningenieure komplexe Vorgänge ausführen können, ohne dass Programmierkenntnisse erforderlich sind. Kurz gesagt: Technologielösungen, die mit Blick auf die Menschen ausgewählt werden. Die richtige Lösung erleichtert es allen Mitarbeitern im Unternehmen, mit Daten zu arbeiten, Daten auszutauschen, Daten zu verstehen und den Daten zu vertrauen.

Die modularen Selfservice-Apps und der Trust Score von Talend beseitigen kompetenzbasierte Hindernisse für das Vertrauen in Daten über Abteilungen hinweg, indem Geschäftsbereiche in die Aufbereitung und Qualitätskontrolle ihrer eigenen Daten einbezogen werden. Unsere Cloud-native Plattform vereint Funktionen für Datenintegration, Datenintegrität, Daten-Stewardship und Data Governance in einer einzigen, benutzerfreundlichen Umgebung. Diese Plattform ist in einzigartiger Weise in der Lage, jeden Aspekt der Arbeit mit Daten in Ihrer gesamten Datenumgebung zu vereinfachen.

Um einen Rahmen für das Vertrauen in Daten in jedem Unternehmen bereitzustellen, verfügt Talend Data Fabric über den Talend Trust Score™, eine branchenweit führende Innovation, die die Zuverlässigkeit jedes Datensatzes bewertet. Er macht Vertrauen greifbar, und zwar mit Standards, die einen sofortigen Einblick geben, wie sehr Sie Ihren Daten vertrauen können. Diese Datenvertrauensmetrik zeigt auf einen Blick, inwieweit Ihre Daten die Kriterien für fehlerfreie Daten erfüllen:

  • Gründlich – Sind die Daten in Ihren Systemen sauber, vollständig und konsistent?
  • Transparent – Sind die Daten zugänglich und verständlich? 
  • Pünktlich – Sind die Daten aktuell und für die Menschen, die sie benötigen, sofort verfügbar? 
  • Verfolgbar – Sagen Ihnen die Daten, woher sie stammen und wie sie verwendet wurden? 
  • Getestet – Wurden die Daten von anderen Benutzern bewertet und zertifiziert? 

Mit offenem Zugriff auf vollständige, saubere und vertrauenswürdige Daten können Datenendnutzer mit Zuversicht bessere, mutigere Entscheidungen treffen. Datenwissenschafts- und Analytikteams und Citizen Analysts erhalten ein vollständiges Bild des Unternehmens und können den von ihnen verwendeten Daten vertrauen und sie überprüfen, um bessere Einblicke, reaktionsschnelle strategische Empfehlungen und fundierte Entscheidungen zu ermöglichen. Darüber hinaus verbessert das Vertrauen in Daten sogar die Beziehung zwischen Geschäfts- und IT-Abteilungen.

Case-Studys zum Vertrauen in Daten

Um die Bedeutung des Vertrauens in Daten zu verstehen, ist es hilfreich, die Praxis zu betrachten. Die folgenden Case-Studys zeigen Anwendungsfälle, die in einer Reihe von Organisationen üblich sind, von privaten Unternehmen bis hin zu öffentlichen Einrichtungen:

Beneva – Vertrauen in Daten schaffen, um drei Millionen Klienten besser zu bedienen und sie zu loyalen Kunden zu machen

Als eine der größten Versicherungsgesellschaften in Kanada bedient Beneva (ehemals SSQ Insurance) über drei Millionen Kunden mit einer vollständigen Palette von Versicherungs- und Anlageprodukten. Wie es nach 75 Jahren im Geschäft passieren kann, stellte das Unternehmen fest, dass seine Datensysteme zu komplex und isoliert geworden waren, um Kundendaten effektiv zu nutzen.

Während Finanz- und Versicherungskunden ein hohes Maß an Personalisierung erwarten, konnten Mitarbeiter Kundendaten nicht in allen Geschäftsbereichen einsehen. „Wenn sie wegen eines anderen Produkts angerufen haben, war es, als ob wir die Kunden überhaupt nicht kennen würden“, sagt Simon Latouche, Director of Data Engineering bei Beneva.

Um gesunde Daten in den Mittelpunkt des Geschäfts zu stellen und den Datenaustausch zu verbessern, hat Beneva ein einheitliches Kundenportal erstellt. Es registriert automatisch die Abläufe der Kunden und Talend Data Quality und Data Stewardship sorgen dafür, dass die Daten vertrauenswürdig sind. Jetzt haben Mitarbeiter Zugriff auf umfassende, zuverlässige Kundendaten. Dadurch können Call Center Kunden effizienter helfen und Vermarkter können Kampagnen mit Vorhersagemodellen anpassen. Tatsächlich war Beneva in der Lage, die Rückgewinnung von Kunden um das Dreifache zu steigern.

Aeroporti Di Roma – Datenanalyse für 48,8 Millionen Reisende in Übereinstimmung mit der DSGVO

Aeroporti Di Roma (ADR) verwaltet und entwickelt die Flughäfen Roma Fiumicino (Leonardo da Vinci) und Ciampino. Fast 100 Fluggesellschaften operieren von diesen Flughäfen aus und befördern Passagiere zu mehr als 230 Zielen weltweit.

Die ADR wissen, wie wichtig vertrauenswürdige Daten sind, um das Kundenverhalten schnell zu verstehen und vorauszusehen. Sie verstehen außerdem ihre Verantwortung für den Schutz personenbezogener Daten für ihre Kunden. Um den Datenaustausch zu verbessern und gleichzeitig den Schutz personenbezogener Daten zu gewährleisten, bauten ADR und seine Partner eine Big-Data-Analytics-Plattform auf, die Cloudera für den Data Lake und Talend Big Data für die Aufnahme-Engine verwendet. Pietro Caminiti, Head of IT Solutions für Aeroporti Di Roma SpA, berichtet von ausgezeichneten Ergebnissen: „Mit Talend können wir große Datenmengen analysieren, um strategische Informationen durch fortschrittliche statistische Algorithmen zu extrahieren und gleichzeitig die Datenschutz-Grundverordnung (DSGVO) einzuhalten.“

„Wir haben sowohl das Erlebnis unserer 48,8 Millionen Passagiere als auch unsere operative Effizienz verbessert“, sagt Pietro Caminiti. „Und wir wurden im Rahmen des weltweiten „Airport Service Quality“-Programms des ACI World als Europas Nummer eins unter den Flughäfen mit über 40 Millionen Passagieren ausgezeichnet.“

Wolters Kluwer Health – Den Weg für bessere Geschäftsentscheidungen ebnen

Wolters Kluwer Health bietet professionelle Informationen, Services und Lösungen für die Gesundheitsbranche. Als der Bedarf des Unternehmens an vertrauenswürdigen Daten die Kapazität der Business Intelligence (BI)-Mitarbeiter zu überfordern drohte, startete das Unternehmen eine innovative „Citizen Analyst“-Initiative, um die Datennutzung zu demokratisieren.

Talend verfügte über die Kombination aus Modularität, Skalierbarkeit, Einfachheit, Kosteneffizienz und Unterstützung für extrem hohe Datenqualität, die Wolters Kluwer Health benötigte, um seine unmittelbaren Ziele und seine langfristige Vision für die Initiative zu erreichen. Die Umstellung auf Talend hat Millionen von Dollar gespart und es dem BI-Team ermöglicht, fortschrittliche, prädiktive Analytik und KI zu nutzen, um neue Muster in Daten zu finden, die eine bessere Entscheidungsfindung ermöglichen.

Die Citizen Analyst-Initiative hat nicht-technischen Mitarbeitern geholfen, ihre eigenen Datenanalysen mithilfe einfacher Schnittstellen, benutzerfreundlicher Tools und hochwertiger Daten durchzuführen, die alle von Talend integriert wurden, um eine bessere Patientenversorgung und optimale Geschäftsentscheidungen zu ermöglichen.

„Wir schaffen eine Kultur der Neugier“, erläutert Kevin Ryan, Director of Business Intelligence bei Wolters Kluwer Health. „Das ist ein Wandel der Unternehmenskultur, aber ein Wandel, den die Mitarbeiter begrüßen, weil alle davon profitieren. Die Produktteams erhalten schneller Einblicke, sie sind weniger abhängig vom BI-Team, können ihre Ergebnisse mit den Entscheidungsträgern im Unternehmen teilen und erhalten schneller die erforderlichen Rückmeldungen. Das Ergebnis sind schlussendlich bessere Produkte und Dienstleistungen, die Ärzten und Patienten zugute kommen.“

Unsere Lösungen für das Vertrauen in Daten testen 

Mit vertrauenswürdigen Daten profitiert jeder im Unternehmen. Alle Mitarbeiter gewinnen das Vertrauen, Entscheidungen auf einem vollständigen, genauen und aktuellen Bild der realen Welt zu treffen. Wenn sie Entscheidungen auf der Grundlage vertrauenswürdiger Daten treffen, treffen sie wahrscheinlich Entscheidungen, die zu besseren Ergebnissen, höheren Umsätzen und mehr Wachstum führen.  

Haben Sie Vertrauen in die Qualität der Daten Ihres Unternehmens? Fragen Sie sich, wie genau, vollständig und aktuell die Daten sind? Hier kann Talend helfen. Exportieren Sie eine Teilmenge Ihrer Daten und führen Sie sie über den Talend Trust Assessor aus. Mit diesem kostenlosen Tool haben Sie Zugriff auf unsere Trust Score™-Technologie. Sie erhalten einen schnellen Bericht mit Rückmeldungen zur Gültigkeit, Vollständigkeit und Eindeutigkeit Ihrer Daten. Sie können es auch mit unserem Beispieldatensatz ausprobieren, um zu sehen, wie es funktioniert. Stellen Sie sich das als ersten Schritt auf Ihrem Weg zur Datengesundheit vor.

Sind Sie bereit, mit Talend durchzustarten?