Teoria e pratica

Il data lineage nella gestione del patrimonio informativo aziendale: la strategia corretta

Per un’efficace data governance aziendale prende sempre più piede la tecnica del data lineage, che consiste nell’identificazione e rappresentazione del ciclo di vita del dato. La sua definizione viene costruita partendo dai metadati e trova applicazioni anche nella data security

15 Feb 2019
P
Erika Pinto

Data Governance & Quality manager presso PwC Italy

Per le aziende è oggi necessario definire ed attuare una strategia di data governance che renda possibile la gestione del patrimonio informativo aziendale. Pratica indispensabile per un’efficace strategia gestionale a lungo termine, è la definizione del data lineage.

L’utilità del data lineage

La disponibilità pressoché infinita di informazioni digitali, provenienti dalle fonti più disparate, pone inevitabilmente una serie di problematiche di gestione che investono l’intero perimetro aziendale. La necessità di avere dati pronti, coerenti e corretti è sempre più sentita da tutti gli attori aziendali poiché consentono di operare scelte corrette e consapevoli. La quasi totalità dei dati esistenti (90%) è stata creata nello spazio di pochissimi anni: il motivo di tale consistente e repentina crescita va ricercato nella digital transformation. Di conseguenza, a prescindere dal settore e dalle dimensioni, nella scala delle priorità delle aziende non figura più la necessità di reperire informazioni, quanto quella di gestirle in maniera tale da riuscire a trarne un reale vantaggio competitivo.

WHITEPAPER
Come gestire in maniera efficiente i dati nel Finance?
Big Data
Finanza/Assicurazioni

Nell’ambito della strategia di data governance, uno degli aspetti basilari è rappresentato dalla definizione del data lineage, prerequisito per una efficace data quality e data protection. Il data lineage consiste nell’identificazione e rappresentazione del ciclo di vita del dato, dal sistema di origine fino a quello di destinazione, esplicitando le trasformazioni subite dal dato, i processi di riferimento e le relazioni di interdipendenza con gli altri dati: da questa prospettiva, il Data Lineage è un prerequisito per una ottimale data quality perché tanto più approfondita è la conoscenza dei sistemi e delle trasformazioni coinvolte nel ciclo di vita dei dati, tanto più efficace è la definizione dei controlli su di essi. Anche la data protection, tema diventato di grande attualità con l’entrata in vigore del regolamento sulla protezione dei dati (GDPR), beneficia di un corretto e completo data lineage: per procedere alla cancellazione dei dati personali, ad esempio, è prima di tutto necessario sapere esattamente in quali sistemi sono conservati così come, per assicurarne il corretto livello di accesso e la riservatezza, è essenziale sapere chi accede effettivamente a quei dati. Al di là di questi due importanti aspetti, i benefici del disporre di un data lineage corretto, completo e fruibile, sono molteplici e comprendono:

  • Rappresentazione esplicita del ciclo di vita del dato dall’origine alla destinazione.
  • Evidenza delle regole e delle trasformazioni subite da ogni dato/flusso.
  • Possibilità di operare una “what-if analysis” in caso di modifiche a sistemi, flussi e dati.
  • Supporto all’identificazione delle golden source per ogni nuova esigenza progettuale.
  • Supporto all’identificazione delle ridondanze dei dati e riuso delle informazioni esistenti.
  • Supporto alla verifica della completezza dei dati e della coerenza delle regole di business applicate.
  • Identificazione del significato dei campi presenti nei report.
  • Supporto all’identificazione degli utilizzatori dei dati e dei report.
  • Supporto alla collaborazione tra le varie strutture aziendali su tematiche legate ai dati.

È evidente che un Data Lineage corretto e fruibile va a beneficio di diverse tipologie di utenti, sia in ambito business che IT: oltre al team di data governance ovviamente, i team di sviluppo e supporto, la cyber security, gli analisti, il Rischio e la Compliance possono trarre vantaggi tangibili dal disporre di una rappresentazione del ciclo di vita del dato attraverso i sistemi aziendali. È il caso, per fare un esempio, di una modifica al set informativo input di un sistema di front-end richiesta dalla funzione Compliance per garantire la conformità ad una normativa: in una situazione del genere, molto frequente, sapere quali sistemi siano interessati dalla modifica richiesta, quali siano gli utenti autorizzati all’accesso e i livelli di protezione garantiti, i report per il business o le autorità di vigilanza eventualmente impattati e, non ultima, l’esaustività dei controlli di data quality implementati e/o previsti, consente una razionalizzazione dell’effort necessario ad attuare la modifica in questione.

Data lineage dalla teoria alla pratica

Nella pratica, la definizione del data lineage viene realizzata a partire dalla conoscenza dei metadati. I metadati rappresentano le informazioni sui dati e possono essere riferiti a due grandi categorie: i metadati tecnici (o operativi) e i metadati di business.

I metadati tecnici descrivono la struttura, il formato e le regole per la memorizzazione dei dati, i metadati di business descrivono invece la terminologia aziendale, le regole e il contesto cui si riferiscono i dati. Comunemente, molti metadati di business sono detenuti dal know how personale dei dipendenti: in questi casi è importante prevedere un trasferimento di questa conoscenza in un formato elettronico fruibile per consentirne l’utilizzo e la condivisione con il resto dell’organizzazione.

Metadati di BusinessMetadati Tecnici
  • Nome di business
  • Processo di business
  • Data Steward
  • Normativa di riferimento
  • Privacy Level
  • Security Level
  • Acronimi
  • Regole di business
  • Nome Tecnico (es. colonna del database)
  • Nome Schema DB
  • Data Type (e.g. VARCHAR(14))
  • Dominio dei valori
  • Nullability
  • Campo chiave
  • Access Permissions

La gestione dei metadati può aiutare a razionalizzare l’archiviazione dei dati in tutta l’organizzazione, portando a significativi incrementi di efficienza, riduzione dei costi e riduzione dei rischi di mancata compliance alle normative o anche rischi reputazionali dovuti a definizioni errate.

Diverse le soluzioni oggi disponibili sul mercato a supporto di una strategia di Metadata Management: sebbene i metadati di business provengano da fonti prevalentemente non digitali, una gestione ottimale si realizza puntando all’implementazione di unico repository che sia poi punto di riferimento per un efficiente ed efficace decision making e auditing.

Gli indispensabili tool

Tipicamente l’implementazione dei tool per la gestione dei metadati prevede una fase di acquisizione /estrazione dei metadati dai repository/sistemi di origine per poi procedere ad una fase di razionalizzazione ed archiviazione in un repository unico.

Tale repository ha la finalità di rendere la consultazione accessibile e comprensibile ad una vasta platea di utenti, non necessariamente in possesso di specifiche competenze tecniche, favorire la collaborazione tra gli utenti interessati all’utilizzo del dato e agevolare la produzione di reportistica ai fini regolamentari e di business. Difficilmente la gestione dei metadati può prescindere dal ricorso a tali tool: in primo luogo perché la raccolta dei metadati richiede un effort considerevole e protratto nel tempo, spesso reso difficoltoso dalle continue modifiche ai sistemi informativi, secondariamente perché senza una loro razionalizzazione, archiviazione e la possibilità di una rapida consultazione, i benefici di una strategia di MDM sono pressoché azzerati.

Ovviamente la spinta regolamentare ha fatto sì che siano stati soprattutto gli istituti bancari e i grandi gruppi assicurativi ad avere intrapreso azioni di MDM inserite in una più ampia strategia di data governance, tuttavia la necessità di razionalizzare, gestire e quindi valorizzare il proprio patrimonio informativo riguarda tutti i settori industriali, sempre più data driven e orientati all’innovazione dei propri prodotti, processi e servizi.

In definitiva, la gestione dei dati non può essere concepita come una problematica di esclusiva competenza IT ma anzi richiede una stretta collaborazione tra funzioni di business e funzioni IT, di conseguenza l’adozione di soluzioni fruibili da entrambi i mondi costituisce una scelta molto sensata. Non va poi dimenticato che la data governance, e le discipline connesse, richiedono un cambio culturale notevole, che non può essere confinato ad alcuni reparti o ambiti dell’organizzazione ma deve avere una sponsorship forte e deve essere diffusa con iniziative di formazione e change management ad hoc. Una visione strategica e ed il coinvolgimento di tutte le strutture aziendali sono quindi assolutamente necessari per realizzare un reale data driven business.

@RIPRODUZIONE RISERVATA

Speciale PNRR

Tutti
Incentivi
PA
Sostemibilità
Analisi
Formazione
Salute digitale
Sicurezza
Sostenibilità
Digital Economy
Formazione
Trasferimento tecnologico, il Mise mette sul piatto 7,5 milioni
Strategie
PSN e Strategia Cloud Italia: a che punto siamo e come supportare la PA in questo percorso
Dispersione idrica
Siccità: AI e analisi dei dati possono ridurre gli sprechi d’acqua. Ecco gli interventi necessari
PNRR
Cloud, firmato il contratto per l’avvio di lavori del Polo strategico
Formazione
Competenze digitali, stanziati 48 milioni per gli Istituti tecnologici superiori
Iniziative
Digitalizzazione delle reti idriche: oltre 600 milioni per 21 progetti
Competenze e competitività
PNRR, così i fondi UE possono rilanciare la ricerca e l’Università
Finanziamenti
PNRR, si sbloccano i fondi per l’agrisolare
Sanità post-pandemica
PNRR, Missione Salute: a che punto siamo e cosa resta da fare
Strategie
Sovranità e autonomia tecnologica nazionale: come avviare un processo virtuoso e sostenibile
La relazione
Pnrr e PA digitale, l’alert della Corte dei conti su execution e capacità di spesa
L'editoriale
Elezioni 2022, la sfida digitale ai margini del dibattito politico
Strategie
Digitale, il monito di I-Com: “Senza riforme Pnrr inefficace”
Transizione digitale
Pnrr: arrivano 321 milioni per cloud dei Comuni, spazio e mobilità innovativa
L'analisi I-COM
Il PNRR alla prova delle elezioni: come usare bene le risorse e centrare gli obiettivi digitali
Cineca
Quantum computing, una svolta per la ricerca: lo scenario europeo e i progetti in corso
L'indice europeo
Desi, l’Italia scala due posizioni grazie a fibra e 5G. Ma è (ancora) allarme competenze
L'approfondimento
PNRR 2, ecco tutte le misure per cittadini e imprese: portale sommerso, codice crisi d’impresa e sismabonus, cosa cambia
Servizi digitali
PNRR e trasformazione digitale: ecco gli investimenti e le riforme previste per la digitalizzazione della PA
Legal health
Lo spazio europeo dei dati sanitari: come circoleranno le informazioni sulla salute nell’Unione Europea
Servizi digitali
PNRR e PA digitale: non dimentichiamo la dematerializzazione
Digital Healthcare transformation
La trasformazione digitale degli ospedali
Governance digitale
PA digitale, è la volta buona? Così misure e risorse del PNRR possono fare la differenza
Servizi digitali
Comuni e digitale, come usare il PNRR senza sbagliare
La survey
Pnrr e digitale accoppiata vincente per il 70% delle pmi italiane
Missione salute
Fascicolo Sanitario Elettronico alla prova del PNRR: limiti, rischi e opportunità
Servizi pubblici
PNRR: come diventeranno i siti dei comuni italiani grazie alle nuove risorse
Skill gap
PNRR, la banda ultra larga crea 20.000 nuovi posti di lavoro
Il Piano
Spazio, Colao fa il punto sul Pnrr: i progetti verso la milestone 2023
FORUMPA2022
PNRR e trasformazione digitale: rivedi i Talk di FORUM PA 2022 in collaborazione con le aziende partner
I contratti
Avio, 340 milioni dal Pnrr per i nuovi propulsori a metano
Next Generation EU
PNRR, a che punto siamo e cosa possono aspettarsi le aziende private
Fondi
Operativo il nuovo portale del MISE con tutti i finanziamenti per le imprese
Servizi comunali
Il PNRR occasione unica per i Comuni digitali: strumenti e risorse per enti e cittadini
Healthcare data platform
PNRR dalla teoria alla pratica: tecnologie e soluzioni per l’innovazione in Sanità
Skill
Competenze digitali, partono le Reti di facilitazione
Gli obiettivi
Scuola 4.0, PNRR ultima chance: ecco come cambierà il sistema formativo
Sistema Paese
PNRR 2, è il turno della space economy
FORUM PA 2022
FORUM PA 2022: la maturità digitale dei comuni italiani rispetto al PNRR
Analisi
PNRR: dalla Ricerca all’impresa, una sfida da cogliere insieme
Innovazione
Pnrr, il Dipartimento per la Trasformazione digitale si riorganizza
FORUM PA 2022
PA verde e sostenibile: il ruolo di PNRR, PNIEC, energy management e green public procurement
Analisi
PNRR, Comuni e digitalizzazione: tutto su fondi e opportunità, in meno di 3 minuti. Guarda il video!
Rapporti
Competenze digitali e servizi automatizzati pilastri del piano Inps
Analisi
Attuazione del PNRR: il dialogo necessario tra istituzioni e società civile. Rivedi lo Scenario di FORUM PA 2022
Progetti
Pnrr, fondi per il Politecnico di Torino. Fra i progetti anche IS4Aerospace
Analisi
PNRR, Colao fa il punto sulla transizione digitale dell’Italia: «In linea con tutte le scadenze»
La Svolta
Ict, Istat “riclassifica” i professionisti. Via anche al catalogo dati sul Pnrr
Analisi
Spazio, Colao fa il punto sul Pnrr: i progetti verso la milestone 2023
FORUM PA 2022
Ecosistema territoriale sostenibile: l’Emilia Romagna tra FESR e PNRR
Il Piano
Innovazione, il Mise “centra” gli obiettivi Pnrr: attivati 17,5 miliardi
Analisi
PNRR: raggiunti gli obiettivi per il primo semestre 2022. Il punto e qualche riflessione
Analisi
PNRR: dal dialogo tra PA e società civile passa il corretto monitoraggio dei risultati, tra collaborazione e identità dei luoghi
Webinar
Comuni e PNRR: un focus sui bandi attivi o in pubblicazione
Analisi
Formazione 4.0: cos’è e come funziona il credito d’imposta
PA e Sicurezza
PA e sicurezza informatica: il ruolo dei territori di fronte alle sfide della digitalizzazione
PA e sicurezza
PNRR e servizi pubblici digitali: sfide e opportunità per Comuni e Città metropolitane
Water management
Water management in Italia: verso una transizione “smart” e “circular” 
LE RISORSE
Transizione digitale, Simest apre i fondi Pnrr alle medie imprese
Prospettive
Turismo, cultura e digital: come spendere bene le risorse del PNRR
Analisi
Smart City: quale contributo alla transizione ecologica
Decarbonizzazione
Idrogeno verde, 450 milioni € di investimenti PNRR, Cingolani firma
Unioncamere
PNRR, imprese in ritardo: ecco come le Camere di commercio possono aiutare
I fondi
Industria 4.0: solo un’impresa su tre pronta a salire sul treno Pnrr
Formazione
Trasferimento tecnologico, il Mise mette sul piatto 7,5 milioni
Strategie
PSN e Strategia Cloud Italia: a che punto siamo e come supportare la PA in questo percorso
Dispersione idrica
Siccità: AI e analisi dei dati possono ridurre gli sprechi d’acqua. Ecco gli interventi necessari
PNRR
Cloud, firmato il contratto per l’avvio di lavori del Polo strategico
Formazione
Competenze digitali, stanziati 48 milioni per gli Istituti tecnologici superiori
Iniziative
Digitalizzazione delle reti idriche: oltre 600 milioni per 21 progetti
Competenze e competitività
PNRR, così i fondi UE possono rilanciare la ricerca e l’Università
Finanziamenti
PNRR, si sbloccano i fondi per l’agrisolare
Sanità post-pandemica
PNRR, Missione Salute: a che punto siamo e cosa resta da fare
Strategie
Sovranità e autonomia tecnologica nazionale: come avviare un processo virtuoso e sostenibile
La relazione
Pnrr e PA digitale, l’alert della Corte dei conti su execution e capacità di spesa
L'editoriale
Elezioni 2022, la sfida digitale ai margini del dibattito politico
Strategie
Digitale, il monito di I-Com: “Senza riforme Pnrr inefficace”
Transizione digitale
Pnrr: arrivano 321 milioni per cloud dei Comuni, spazio e mobilità innovativa
L'analisi I-COM
Il PNRR alla prova delle elezioni: come usare bene le risorse e centrare gli obiettivi digitali
Cineca
Quantum computing, una svolta per la ricerca: lo scenario europeo e i progetti in corso
L'indice europeo
Desi, l’Italia scala due posizioni grazie a fibra e 5G. Ma è (ancora) allarme competenze
L'approfondimento
PNRR 2, ecco tutte le misure per cittadini e imprese: portale sommerso, codice crisi d’impresa e sismabonus, cosa cambia
Servizi digitali
PNRR e trasformazione digitale: ecco gli investimenti e le riforme previste per la digitalizzazione della PA
Legal health
Lo spazio europeo dei dati sanitari: come circoleranno le informazioni sulla salute nell’Unione Europea
Servizi digitali
PNRR e PA digitale: non dimentichiamo la dematerializzazione
Digital Healthcare transformation
La trasformazione digitale degli ospedali
Governance digitale
PA digitale, è la volta buona? Così misure e risorse del PNRR possono fare la differenza
Servizi digitali
Comuni e digitale, come usare il PNRR senza sbagliare
La survey
Pnrr e digitale accoppiata vincente per il 70% delle pmi italiane
Missione salute
Fascicolo Sanitario Elettronico alla prova del PNRR: limiti, rischi e opportunità
Servizi pubblici
PNRR: come diventeranno i siti dei comuni italiani grazie alle nuove risorse
Skill gap
PNRR, la banda ultra larga crea 20.000 nuovi posti di lavoro
Il Piano
Spazio, Colao fa il punto sul Pnrr: i progetti verso la milestone 2023
FORUMPA2022
PNRR e trasformazione digitale: rivedi i Talk di FORUM PA 2022 in collaborazione con le aziende partner
I contratti
Avio, 340 milioni dal Pnrr per i nuovi propulsori a metano
Next Generation EU
PNRR, a che punto siamo e cosa possono aspettarsi le aziende private
Fondi
Operativo il nuovo portale del MISE con tutti i finanziamenti per le imprese
Servizi comunali
Il PNRR occasione unica per i Comuni digitali: strumenti e risorse per enti e cittadini
Healthcare data platform
PNRR dalla teoria alla pratica: tecnologie e soluzioni per l’innovazione in Sanità
Skill
Competenze digitali, partono le Reti di facilitazione
Gli obiettivi
Scuola 4.0, PNRR ultima chance: ecco come cambierà il sistema formativo
Sistema Paese
PNRR 2, è il turno della space economy
FORUM PA 2022
FORUM PA 2022: la maturità digitale dei comuni italiani rispetto al PNRR
Analisi
PNRR: dalla Ricerca all’impresa, una sfida da cogliere insieme
Innovazione
Pnrr, il Dipartimento per la Trasformazione digitale si riorganizza
FORUM PA 2022
PA verde e sostenibile: il ruolo di PNRR, PNIEC, energy management e green public procurement
Analisi
PNRR, Comuni e digitalizzazione: tutto su fondi e opportunità, in meno di 3 minuti. Guarda il video!
Rapporti
Competenze digitali e servizi automatizzati pilastri del piano Inps
Analisi
Attuazione del PNRR: il dialogo necessario tra istituzioni e società civile. Rivedi lo Scenario di FORUM PA 2022
Progetti
Pnrr, fondi per il Politecnico di Torino. Fra i progetti anche IS4Aerospace
Analisi
PNRR, Colao fa il punto sulla transizione digitale dell’Italia: «In linea con tutte le scadenze»
La Svolta
Ict, Istat “riclassifica” i professionisti. Via anche al catalogo dati sul Pnrr
Analisi
Spazio, Colao fa il punto sul Pnrr: i progetti verso la milestone 2023
FORUM PA 2022
Ecosistema territoriale sostenibile: l’Emilia Romagna tra FESR e PNRR
Il Piano
Innovazione, il Mise “centra” gli obiettivi Pnrr: attivati 17,5 miliardi
Analisi
PNRR: raggiunti gli obiettivi per il primo semestre 2022. Il punto e qualche riflessione
Analisi
PNRR: dal dialogo tra PA e società civile passa il corretto monitoraggio dei risultati, tra collaborazione e identità dei luoghi
Webinar
Comuni e PNRR: un focus sui bandi attivi o in pubblicazione
Analisi
Formazione 4.0: cos’è e come funziona il credito d’imposta
PA e Sicurezza
PA e sicurezza informatica: il ruolo dei territori di fronte alle sfide della digitalizzazione
PA e sicurezza
PNRR e servizi pubblici digitali: sfide e opportunità per Comuni e Città metropolitane
Water management
Water management in Italia: verso una transizione “smart” e “circular” 
LE RISORSE
Transizione digitale, Simest apre i fondi Pnrr alle medie imprese
Prospettive
Turismo, cultura e digital: come spendere bene le risorse del PNRR
Analisi
Smart City: quale contributo alla transizione ecologica
Decarbonizzazione
Idrogeno verde, 450 milioni € di investimenti PNRR, Cingolani firma
Unioncamere
PNRR, imprese in ritardo: ecco come le Camere di commercio possono aiutare
I fondi
Industria 4.0: solo un’impresa su tre pronta a salire sul treno Pnrr