Guide de la gestion de la qualité des données
La qualité des données implique de préparer les données afin qu’elles répondent aux besoins spécifiques des utilisateurs métiers. Les données sont le bien le plus précieux de votre organisation, et les décisions prises sur la base de données erronées peuvent nuire à votre activité. C’est pourquoi vous devez pouvoir avoir confiance en la qualité de vos données avant de les partager avec ceux qui en ont besoin.
L’impact de données de mauvaise qualité
La qualité des connaissances qu’une entreprise peut tirer de données est inhérente à la qualité des données. Les données de mauvaise qualité peuvent provenir de n’importe où dans votre entreprise et prendre diverses formes. Elles peuvent compliquer l’exploration de connaissances et en définitive, vous faire prendre de mauvaises décisions.
La qualité des données est un sujet préoccupant pour beaucoup de dirigeants. Selon Forbes Insights et « 2016 Global CEO Outlook » de KPMG, 84 % des dirigeants s’inquiètent de la qualité des données qu’ils utilisent pour leur veille économique. Les données de mauvaise qualité peuvent coûter cher ; une étonnante étude menée par MIT Sloan indique que les données de mauvaise qualité peuvent coûter de 15 à 25 % du chiffre d’affaires.
La bonne nouvelle, c’est que rien ne vous oblige à laisser votre entreprise perdre plus de temps et d’argent à cause de données de mauvaise qualité. Concentrez vos initiatives de collecte de données sur les six indicateurs de la qualité des données. Vous favoriserez ainsi une performance optimale des systèmes de votre entreprise et encouragerez les utilisateurs à croire en la fiabilité de vos données.
Définir les attentes en matière de qualité des données
Indépendamment de sa taille, de sa fonction ou de son secteur, chaque organisation doit être attentive à la qualité des données pour bien comprendre ses activités et prendre des décisions éclairées. Il existe pléthore de types et sources de données, et leur qualité aura différentes répercussions sur les activités en fonction de ce pourquoi elles sont utilisées. C’est la raison pour laquelle votre entreprise doit définir et convenir d’attentes, sélectionnées de manière collaborative, pour chacun des six indicateurs mentionnés précédemment, en fonction de ce que vous espérez tirer des données.
Les données acquièrent de la valeur essentiellement lorsqu’elles soutiennent un processus d’entreprise, ou une prise de décision fondée sur la veille économique. Les règles convenues en matière de qualité des données doivent donc tenir compte de la valeur que les données peuvent offrir à une organisation. S’il est établi que les données ont une valeur importante dans un certain contexte, cela peut donc indiquer que ce contexte requiert des règles plus rigoureuses en matière de qualité des données. Les entreprises doivent donc convenir de normes de qualité des données basées non seulement sur les dimensions de la qualité des données elles-mêmes (et bien sûr, sur les normes externes auxquelles la qualité des données doit se conformer), mais aussi sur l’impact potentiel de la non-conformité.
Le coût élevé de la négligence de la qualité des données
Ne rien faire finit par coûter très cher La mauvaise qualité des données peut être facilement atténuée lorsqu’elle est identifiée avant toute utilisation, dès son point d’origine. Si vous vérifiez ou normalisez les données au point d’entrée, avant qu’elles n’atteignent vos systèmes back-end, disons qu’il vous en coûtera 1 $ pour les normaliser. Si vous nettoyez vos données plus tard, avec la mise en correspondance et le nettoyage qu’il faudra effectuer en plusieurs endroits, il vous en coûtera 10 $ en temps et efforts, par rapport au premier dollar. En laissant les données de mauvaise qualité s’installer dans votre système et dégrader les informations à partir desquelles vous prenez vos décisions, que vous envoyez à vos clients, ou présentez à votre entreprise, il vous en coûtera 100 $, par rapport au dollar que cela vous aurait coûté si vous vous étiez occupé de ces données au point d’entrée. Plus les données de mauvaise qualité passent de temps dans votre système, plus le coût augmente. L’objectif est donc de traquer ces données de mauvaise qualité avant même qu’elles pénètrent vos systèmes.
Une approche gagnante de la qualité des données
Pour cela, vous devez établir dans votre entreprise une approche généralisée, proactive et collaborative en matière de qualité des données. Chaque équipe (et pas seulement les équipes techniques) doit assumer la responsabilité de la qualité des données. Chaque système doit intégrer la qualité des données et l’entreprise doit établir des règles et politiques pour stopper les données de mauvaise qualité à ses portes.
Cela vous semble impossible ? Ça ne l’est pas. Voici votre feuille de route pour développer cette approche :
- Constituez votre équipe interdisciplinaire : recrutez des architectes de données, des professionnels, des data scientists et des experts de la protection des données qui constitueront l’équipe principale de qualité des données. Elle doit être dirigée par un responsable du déploiement, qui fera office de chef d’équipe et de promoteur des projets de qualité des données.
- Définissez vos attentes dès le départ : Pourquoi la qualité des données ? Trouvez les réponses à vos questions sur la qualité des données auprès de professionnels. Assurez-vous que votre équipe et vous-même connaissiez votre objectif final. Assurez-vous de fixer des objectifs à fort impact pour votre entreprise.
- Anticipez les modifications de la réglementation et gérez la conformité : employez votre équipe principale de qualité des données pour traiter les initiatives de conformité à court terme telles que le RGPD. Vous gagnerez alors une valeur immédiate à court terme et une visibilité stratégique.
- Établissez des objectifs ambitieux à fort impact : au moment d’établir votre plan de qualité des données, n’hésitez pas à définir des objectifs ambitieux en phase avec votre entreprise. Votre plan captera l’attention de la direction et étendra les compétences des collaborateurs.
- Assurez quand même des victoires rapides : ces victoires rapides commencent par l’engagement de l’entreprise dans la gestion des données. Citons par exemple l’intégration des données, une migration plus rapide des données dans le cloud, ou encore le nettoyage de vos données Salesforce.
- Soyez réaliste : définissez et exploitez activement des indicateurs de performance clés quantifiables, acceptés et compris de tous. La qualité des données est liée à l’entreprise, utilisez donc les indicateurs de votre entreprise tels que le retour sur investissement ou le taux d’amélioration des économies pour mener vos projets.
- Célébrez vos réussites : lorsque vous terminez un projet aux résultats mesurables, prenez du temps pour le faire voir aux principales parties prenantes. Si le savoir-faire est bénéfique, il est encore plus efficace associé à un bon sens de la communication.
Gérez les données dans toute l’entreprise
Une approche proactive en matière de qualité des données vous permet de vérifier et mesurer le niveau de qualité de ces données avant qu’elles soient intégrées à vos systèmes centraux. L'accès à ces données et leur surveillance dans des applications internes, cloud, web, et mobiles constituent un défi de taille. Le seul moyen d’échelonner ce type de suivi sur l’ensemble de ces systèmes est d’utiliser l’intégration des données. Il devient donc essentiel de contrôler la qualité des données en temps réel.
Il est évidemment crucial d’intégrer à vos processus d’intégration des données des règles de contrôle pour éviter toute propagation de données erronées. Avec les outils de qualité des données et des données intégrées adaptés, vous pouvez créer des systèmes d’alerte qui détectent certaines causes fondamentales des problèmes généraux de qualité des données. Vous devrez ensuite suivre les données dans l'ensemble de vos applications et systèmes. Ceci vous permettra d'analyser, de normaliser et de faire correspondre les données en temps réel. Vous pouvez organiser le processus et vérifier les données correctes au besoin.
Le coût d’une mauvaise qualité des données peut se chiffrer en opportunités manquées, en mauvaises décisions et en temps nécessaire pour traquer, nettoyer et corriger les erreurs. La gestion collaborative des données et les outils de correction des erreurs au point d’origine sont des moyens clairs de garantir la qualité des données pour tous ceux qui en ont besoin. Découvrez les nombreuses applications que vous offre Talend Data Fabric pour vous aider à atteindre ces objectifs.