Che cosa si intende per fiducia nei dati?

Ti puoi fidare dei dati della tua organizzazione?

Uno studio sulla Data Health condotto nel 2021 indica che il 60% dei dirigenti non sempre si fida dei dati della propria azienda. E oltre un terzo non basa le proprie decisioni sui dati. Questo è indubbiamente un aspetto critico per qualsiasi organizzazione, in tutti i settori e in tutto il mondo. Come può una figura decisionale che non si fida dei dati prendere decisioni con sicurezza? 
 
Cominciamo a capire di quali dati stiamo parlando. Negli ultimi anni il mondo è diventato sempre più data-driven, saturando le reti delle organizzazioni di informazioni. Alcuni dati provengono da applicazioni SaaS e web. Altri vengono immessi direttamente compilando moduli, pensiamo ad esempio ai form online. Alcuni dati sono destrutturati, come i post sui social network. E sempre più dati arrivano da "macchine" come smartphone e dispositivi IoT (Internet of Things). Secondo alcune stime, la quantità di dati generati annualmente ammonta ormai a diversi zettabyte (unità corrispondente a un miliardo di terabyte). Una quantità di dati incredibile.
 
Gestirne manualmente la qualità è semplicemente impossibile con questi volumi. Le persone commettono errori. Le macchine non sono sempre perfette. Inoltre, i dati passano spesso attraverso complessi sistemi informatici basati su codice scritto da diversi sviluppatori. Aumenta quindi il rischio di avere un codice difettoso che introduce errori nel flusso. 
 
Ma che cosa significa fidarsi dei dati? 

Definizione di fiducia nei dati

Avere fiducia nei dati significa sapere che i dati di un'organizzazione sono "sani" e pronti per essere utilizzati.  

La fiducia è fondamentale per utilizzare i dati con successo. Unita alla cultura e all'agilità, la fiducia porta le organizzazioni a raggiungere l'obiettivo della Data Health. Assicurando che in tutta l'organizzazione e in tutti i reparti si abbia fiducia nei dati, l'azienda mette i propri team nelle condizioni di poter progettare esperienze eccezionali per i clienti, migliorare le attività operative, snellire i processi decisionali, garantire la conformità e promuovere l'innovazione. Tuttavia, la fiducia nei dati deve essere conquistata e quantificata. Non può essere una questione di mera fede. Per poterti fidare dei dati, devi dimostrare che questi producano analisi affidabili a supporto di decisioni informate.

Misurazione della qualità dei dati

Come si misura la fiducia nei dati? La Data Management Association del Regno Unito definisce sei parametri per la qualità dei dati:  

  • Precisione — La misura in cui i dati descrivono correttamente l'oggetto o l'evento nel mondo reale.
    • Esempio: Supponiamo che una registrazione contabile utilizzi il formato di data americano MM/GG/AAAA. Eventuali dati inseriti con il formato europeo GG/MM/AAAA potrebbero far sì che una fattura con scadenza 8 maggio non venga pagata fino al 5 agosto.
  • Completezza — La porzione di dati immagazzinati rispetto al potenziale totale del 100%.
    • Esempio: I campi vuoti indicano che alcuni dati non sono stati inseriti. Una serie di indirizzi con 300 righe e 12 codici di avviamento postale (CAP) mancanti avrebbe dati utilizzabili per 288 indirizzi, quindi un tasso di completezza di 288/300, pari al 96%.
  • Coerenza/Omogeneità — Assenza di differenze quando si confrontano due o più rappresentazioni di un oggetto rispetto a una definizione.
    • Esempio: Gli uffici HR, legale e finanziario di un'organizzazione utilizzano tutti lo stesso formato di data, oppure la stessa può comparire come 11/12/2022, 12/11/22 o 22-NOV-12 a seconda del reparto?
  • Tempestività — La misura in cui i dati sono sufficientemente aggiornati da rappresentare la realtà nel momento in cui sono richiesti per supportare le funzioni aziendali.
    • Esempio: In un campo che rappresenta i guadagni di un'azienda, è fondamentale avere accesso ai dati più recenti. Quali sono i tempi di attesa per averli? Si tratta di minuti, giorni o settimane?
  • Unicità — Nessun elemento, o istanza, viene registrato più volte in base all'identificazione di tale elemento.
    • Esempio: Duplicazione del record di un singolo cliente a causa della presenza di più voci, ad esempio A.Lee, Alan R. Lee e Alan Lee, che appaiono come tre diversi individui con lo stesso indirizzo e gli stessi contatti. 
  • Validitào conformità — La misura in cui i dati sono conformi alla sintassi (formato, tipo o intervallo) della loro definizione.
    • Esempio: L'indirizzo stradale Via dei Dati 1000 è valido (anche se non è detto che sia corretto), mentre l'indirizzo Via dei Dati H/*27  non lo è.

Più alto è il punteggio dei dati in ciascuno di questi parametri in ogni tabella, record o campo, più i dati sono affidabili... e più sono pronti per essere utilizzati a supporto delle decisioni. Se alcuni record o set di dati raggiungono punteggi elevati in un parametro, non significa che possano essere affidabili al 100%. Come mostrato in precedenza, alcune informazioni possono essere valide ma imprecise, oppure precise ma incomplete.

L'importanza dei vari parametri dipende dalle esigenze. Ad esempio, gli uffici finanziari richiedono un livello di precisione particolarmente elevato, mentre altri reparti possono essere più interessati alla tempestività. I team di gestione dei dati devono fare le proprie valutazioni sulle metriche che i dati devono soddisfare. Dovrebbero anche quantificare la qualità dei dati per gli utilizzatori dei dati stessi. La combinazione di affidabilità e trasparenza permette alle figure decisionali di avere fiducia nei dati.

Tuttavia, è importante ricordare che la qualità dei dati è solo un aspetto della loro affidabilità. La visione di Talend sull'affidabilità dei dati tiene conto anche di fattori come gli strumenti utilizzati per renderli facilmente reperibili, migliorarli, verificarli e utilizzarli, oltre alle app self-service che consentono a ogni reparto di avere il pieno controllo sui dati posseduti. Ad esempio, se la qualità è elevata, ma le persone non vi hanno accesso, quei dati contribuiscono effettivamente ad aumentarne la fiducia? A prescindere dai fattori considerati per misurare l'affidabilità dei dati, il punto è quantificare quanto questi siano utilizzabili in tutta l'azienda: sono pronti ai fini dei processi decisionali?

Infrastruttura per l'affidabilità dei dati

Per raggiungere la fiducia nei dati in un mondo che sta letteralmente affogando in un mare di informazioni, le organizzazioni devono implementare e automatizzare processi di revisione, valutazione e pulizia dei dati. Tuttavia, la fiducia non può essere ottenuta solo con la tecnologia. Le soluzioni complete per l'affidabilità dei dati richiedono un'infrastruttura che tenga conto del fattore umano e non solo del software. È necessario creare una cultura che mette il dato al centro, pienamente integrata con l'automazione della qualità dei dati.

L'infrastruttura di Data Health sfrutta le conoscenze degli addetti di una specifica divisione aziendale per la pulizia dei dati, e usa strumenti sofisticati e intelligenza artificiale per consentire ai data engineer di svolgere attività complesse senza avere competenze nella scrittura di codice. In breve, le soluzioni tecnologiche devono essere scelte pensando alle persone. La soluzione giusta è quella che agevola tutti gli addetti dell'organizzazione nell'utilizzo, nella condivisione e nella comprensione dei dati, favorendo di conseguenza la fiducia nei dati stessi.

Le app self-service modulari di Talend e il Trust Score abbattono le barriere rappresentate dalle competenze specifiche necessarie per verificare l'affidabilità dei dati, coinvolgendo i vari dipartimenti nella preparazione e nel controllo di qualità dei loro dati. La nostra piattaforma nativa per il cloud riunisce funzionalità di integrazione, integrità, stewardship e governance dei dati in un unico ambiente facile da usare. Questa piattaforma ha la capacità unica di semplificare ogni aspetto dell'utilizzo dei dati in tutto l'ambiente di gestione dei dati stessi.

Per creare un contesto di fiducia nei dati in qualsiasi organizzazione, Talend Data Fabric mette a disposizione il Talend Trust Score™, una soluzione innovativa, la prima nel settore, che misura l'affidabilità di qualsiasi set di dati. Il Trust Score offre una misura tangibile dell'affidabilità dei dati secondo regole che forniscono una panoramica immediata e approfondita del grado di affidabilità. Questa metrica determina in che misura i dati soddisfano i criteri di Data Health, ovvero quanto questi dati sono:

  • Totali — i dati sono puliti, completi e omogenei in tutti i sistemi?
  • Trasparenti — i dati sono accessibili e comprensibili? 
  • Tempestivi — i dati sono aggiornati e prontamente accessibili alle persone che ne hanno bisogno? 
  • Tracciabili — i dati mostrano la loro provenienza e come sono stati utilizzati? 
  • Testati — i dati sono stati verificati e certificati da altri utenti? 

Con un accesso aperto a dati completi, puliti e affidabili, gli utilizzatori possono prendere decisioni più efficaci e coraggiose con maggiore sicurezza. I team di data science e analisi e i citizen analyst hanno un quadro completo dell'attività e possono fidarsi dei dati utilizzati per ottenere informazioni più approfondite, fornire raccomandazioni strategiche con grande reattività e prendere decisioni in totale fiducia. Fra i tanti vantaggi, la fiducia nei dati migliora anche i rapporti fra l'azienda e il reparto IT

Casi di successo relativi alla fiducia nei dati

Per capire l'importanza della fiducia nei dati, può essere utile analizzare alcuni casi concreti. I casi di successo proposti di seguito illustrano situazioni comuni in diverse organizzazioni, da aziende private a enti pubblici:

Beneva – Ottenere la fiducia nei dati per soddisfare e fidelizzare tre milioni di clienti

La più grande società di mutua assicurazione canadese, Beneva (ex-SSQ Insurance) serve tre milioni di clienti con un'ampia gamma di prodotti assicurativi e di investimento. Dopo 75 anni di attività, l'azienda si è resa conto che i sistemi di gestione dei dati erano diventati troppo complessi e poco integrati per sfruttare le informazioni sui clienti in modo efficace.

I clienti nel settore finanziario e assicurativo si aspettano un alto livello di personalizzazione, ma i dipendenti di Beneva non riuscivano ad accedere alle informazioni sparse sulle diverse linee di business. “Quando i clienti chiamavano per chiedere informazioni su un altro prodotto, era come se non li conoscessimo affatto,” racconta Simon Latouche, Director of Data Engineering di Beneva.

Per mettere dati sani al centro dell'attività e migliorarne la condivisione, Beneva ha creato un portale clienti unificato. Il portale registra automaticamente le attività dei clienti, mentre Talend Data Quality e Data Stewardship verificano che i dati siano affidabili. Ora i dipendenti hanno accesso a dati dei clienti completi e affidabili. In questo modo, i call center possono fornire una migliore assistenza e gli addetti del marketing possono personalizzare le campagne con modelli predittivi. Beneva è riuscita ad aumentare di tre volte il tasso di recupero dei clienti persi.

Aeroporti Di Roma — Analizzare i dati di 48,8 milioni di viaggiatori nel rispetto del GDPR

Aeroporti Di Roma (ADR) gestisce e sviluppa l'attività degli scali di Roma Fiumicino (Leonardo da Vinci) e Ciampino. Su questi aeroporti operano quasi 100 linee aeree che trasportano passeggeri verso oltre 230 destinazioni in tutto il mondo.

ADR conosce bene l'importanza di avere dati affidabili per comprendere e prevedere i comportamenti dei clienti con grande rapidità. Ed è anche ben consapevole della responsabilità di proteggere i dati personali dei clienti. Per migliorare la condivisione delle informazioni, tutelando al tempo stesso i dati personali, ADR e i suoi partner hanno costruito una piattaforma per l'analisi dei Big Data utilizzando Cloudera per il data lake e Talend Big Data per il motore di acquisizione. Pietro Caminiti, Head of IT Solutions di Aeroporti Di Roma SpA, riferisce risultati eccellenti: "Con Talend siamo in grado di analizzare grandi volumi di dati al fine di estrarre informazioni strategiche attraverso algoritmi statistici avanzati rispettando al tempo stesso la conformità alle norme del regolamento GDPR."

"Abbiamo migliorato l'esperienza dei nostri 48,8 milioni di passeggeri e l'efficienza operativa," afferma Pietro Caminiti. "Inoltre, siamo stati riconosciuti come l'aeroporto numero uno in Europa con oltre 40 milioni di passeggeri, secondo il programma di qualità del servizio aeroportuale stabilito da ACI World in tutto il mondo."

Wolters Kluwer Health — Spianare la strada a decisioni più efficaci

Wolters Kluwer Health fornisce informazioni, servizi e soluzioni professionali nel settore sanitario. Quando la "fame" di dati affidabili rischiava di sopraffare la capacità dello staff di Business Intelligence (BI), l'azienda ha lanciato l'innovativa iniziativa “Citizen Analyst” per democratizzare l'uso dei dati.

Talend offriva la combinazione di modularità, scalabilità, semplicità, efficienza dei costi e supporto per un'eccellente qualità dei dati di cui Wolters Kluwer Health aveva bisogno per raggiungere i suoi obiettivi immediati e realizzare la sua visione a lungo termine. Il passaggio a Talend ha consentito all'azienda di risparmiare milioni di dollari e al team BI di sfruttare analisi predittive avanzate e AI per individuare nei dati schemi ricorrenti (pattern) che permettono di prendere decisioni più efficaci.

L'iniziativa Citizen Analyst ha aiutato il personale non tecnico a fare analisi sui propri dati utilizzando interfacce semplici, strumenti di facile uso e dati di alta qualità — tutto integrato con Talend — per migliorare l'assistenza ai clienti e supportare decisioni più efficaci.

“Stiamo creando una cultura della curiosità,” spiega Kevin Ryan, Director of Business Intelligence di Wolters Kluwer Health. “Si tratta di una svolta culturale ed è un cambiamento che le persone stanno accettando perché tutti ne traggono beneficio. I team di prodotto acquisiscono informazioni approfondite più rapidamente, sono meno dipendenti dal team BI, possono condividere i risultati con i responsabili e ottenere consenso più velocemente: il risultato finale sono prodotti e servizi migliori con benefici per dottori e pazienti."

Prova le nostre soluzioni per l'affidabilità dei dati

Tutta la tua organizzazione trae beneficio da dati affidabili. La fiducia nei dati aumenta se tutti possono basare le proprie decisioni su una fotografia completa, precisa e aggiornata del mondo reale. Prendendo decisioni basate su dati affidabili, è più probabile che le scelte intraprese portino a risultati migliori, maggiori ricavi e più crescita.

Hai fiducia nella qualità dei dati della tua organizzazione? Ti stai chiedendo quanto siano precisi, completi e aggiornati? Talend ti può aiutare. Esporta un sottoset dei tuoi dati e valutali con Talend Trust Assessor, lo strumento gratuito che dà accesso alla nostra tecnologia Trust Score™. Otterrai rapidamente un report sulla validità, completezza e univocità dei tuoi dati. Puoi provare lo strumento anche con il nostro dataset campione per vedere come funziona. Considera questa prova come la prima tappa del tuo percorso verso la Data Health.

Sei pronto a iniziare con Talend?