DATA PROTECTION

Tutela del capitale intellettuale e sistemi esperti: applicazioni pratiche di intelligenza artificiale

I sistemi esperti rappresentano un’interessante applicazione pratica delle capacità dei sistemi di intelligenza artificiale e machine learning nell’individuare relazioni fra dati elementari grazie alla possibilità di elaborarne velocemente grandi quantità e per questo risultano utili per la tutela del capitale intellettuale aziendale. Ecco perché

24 Set 2020
B
Giancarlo Butti

Internal Auditor - Esperto Privacy e Cyber Security


La tutela del capitale intellettuale, realizzata mediante una serie di misure di sicurezza fisica, logica, organizzativa, legali e contrattuali, non può prescindere dalla piena consapevolezza di quali siano gli asset da proteggere e i rischi che incombono sugli stessi.

In questo senso, possono tornare utili le capacità dei sistemi di intelligenza artificiale (IA) e machine learning di individuare relazioni fra dati elementari grazie alla possibilità di elaborarne velocemente grandi quantità.

Fra le varie cause della veloce evoluzione delle applicazioni di intelligenza artificiale (IA) negli ultimi anni, in contrapposizione alle promesse non mantenute negli anni precedenti, oltre che dall’aumento esponenziale della capacità elaborativa, vi è la grande disponibilità di dati (big data) prodotta da internet e dai social.

Tuttavia anche con pochi dati forniti da un esperto umano è possibile, grazie all’IA, non solo automatizzare la risoluzione di un problema, ma molto più ambiziosamente formalizzare in un’applicazione una conoscenza che altrimenti rischierebbe di andare persa con il suo detentore.

Ma andiamo con ordine.

Le informazioni come patrimonio aziendale

Le informazioni costituiscono il bene aziendale per eccellenza nelle aziende di servizi ed una parte importante del patrimonio aziendale anche in quelle manifatturiere o commerciali.

La disponibilità di impianti e materie prime non serve infatti a nulla se manca l’informazione su come attivare il processo produttivo, su come tarare le macchine, su come allestire gli impianti.

In un mondo estremamente competitivo e soggetto a continui cambiamenti il valore del know how è sempre maggiore.

È di vitale importanza per la sopravvivenza di un’azienda sapere cosa produrre, come produrre, quando produrre, a chi vendere…e cosa fa la concorrenza.

Salvo alcune eccezioni consolidate (brevetti, dati amministrativi, sistema informativo…), la “percezione” di quali asset contengano informazioni importanti per l’azienda e l’attribuzione del corretto livello di protezione non è facile ed intuitiva.

In molti casi, infatti, le informazioni non sono esplicitate in un asset ben definito ed identificato (un documento, un database), ma sono implicitamente presenti, ad esempio, in un processo consolidato, nella taratura di strumenti, nella configurazione di una macchina.

Per tale motivo l’informazione viene classificata in:

  • esplicita
  • implicita.

La maggior parte delle informazioni esplicite sono racchiuse nei documenti e nel sistema informativo aziendale, mentre una buona parte delle conoscenze implicite è parte del patrimonio delle persone che per prassi eseguono determinati processi.

Si tratta di quella parte di conoscenza individuale o aziendale che non è mai stata formalizzata, costituite da prassi, competenze e conoscenze dei singoli collaboratori dell’azienda.

È composta fra gli altri da conoscenze personali, lezioni apprese, interpretazioni, riflessioni, processi non documentati.

Fa parte dell’esperienza personale ed è quindi difficile da formalizzare e da trasferire; è inoltre in continua crescita ed evoluzione, in quanto basata su informazioni e stimoli continui, solo in parte formalizzati e controllati.

Nel loro insieme tutte queste informazioni contribuiscono al capitale intellettuale[1] dell’azienda e la loro perdita può costituire un grave danno.

Ad esempio, se una parte di processo produttivo è conosciuta “solo” dalle persone che lo eseguono, in caso di “perdita” di queste risorse l’azienda potrebbe trovarsi in difficoltà.

Per quanto riguarda questo tipo di informazioni, il primo passo per la loro protezione consiste nella esplicitazione, o quantomeno nella loro condivisione.

Tale operazione può essere però molto difficile. La capacità di rendere esplicita la conoscenza acquisita mediante l’esperienza non è certo una qualità della quale siano dotati molti individui.

Molte informazioni sono talmente radicate nell’esperienza personale che è particolarmente difficile esplicitarle.

Ci sono anche dei buoni motivi per cui un individuo non desidera esplicitare la propria conoscenza e renderla fruibile a terzi.

Conoscere qualcosa, specialmente in modo esclusivo, costituisce sicuramente una fonte di prestigio e di potere; deve essere pertanto incentivato chi esplicita la propria conoscenza affinché diventi patrimonio comune.

WHITEPAPER
Ricerca IDC: come aggregare i dati per un'analisi ottimale
Big Data
Business Analytics

I rischi connessi alla scarsa formalizzazione o diffusione della conoscenza si manifestano molto spesso con l’uscita dall’azienda di alcune figure chiave.

Gli esempi possibili sono infiniti e possono riguardare sia le competenze tecniche che quelle commerciali (ad esempio ricambi generazionali…). In letteratura esistono molteplici casi di aziende che hanno dovuto richiamare al lavoro dipendenti in pensione anche dopo anni dalla cessazione della loro attività (ad esempio per la mancata documentazione di software realizzato in linguaggi ormai obsoleti o per la mancata documentazione su come realizzare mescole particolari…).

Tutela del capitale intellettuale: i sistemi esperti

Una delle applicazioni dell’IA è costituita dai sistemi esperti (SE), cioè di programmi informatici in grado di rispondere ad un problema come (teoricamente) risponderebbe un esperto umano.

Rispetto a quest’ultimo un SE ha il vantaggio di essere neutro e non influenzabile in merito alla risposta data ed è inoltre in grado di dare evidenza delle motivazioni che hanno portato a quella specifica risposta.

La realizzazione di un SE richiede la presenza:

  • dell’esperto di dominio, cioè una persona (o un gruppo di persone) che abbia lavorato sull’argomento che deve essere trasformato in SE, affrontandolo normalmente senza strumenti informatici specializzati;
  • dell’esperto della tecnologia, cioè una persona (o un gruppo di persone) che conosce la tecnologia specifica e quella informatica.

La relazione fra esperto di dominio ed esperto della tecnologia non è tuttavia univoco ed uguale in tutte le situazioni.

Uno dei problemi nella realizzazione dei SE è infatti legato alle difficoltà che l’esperto incontra nel tentativo di descrivere le proprie competenze rispetto alla realizzazione di un SE. Non sempre, infatti, l’esperto di dominio è in grado di esplicitare in termini formali e logicamente/matematicamente descrivibili le REGOLE che descrivono le proprie conoscenze.

Le regole rappresentano infatti il processo di inferenza che l’esperto applica sul dominio e sono composte da due parti: un antecedente ed un conseguente.

L’antecedente identifica quali condizioni debbono verificarsi affinché il risultato descritto dal conseguente abbia luogo.

La sintassi utilizzata è la seguente:

SE antecedente ALLORA conseguente

Chiariamo con un semplice esempio.

Consideriamo il problema costituto dalla esecuzione di un’analisi dei rischi in ambito aziendale.

Il rischio viene definito con una relazione fra probabilità che un evento dannoso abbia luogo e le conseguenze derivanti da tale evento (impatto).

I valori di Probabilità, Impatto e Rischio sono descritti o in termini quantitativi, o molto più spesso in termini qualitativi.

La regola che mette in relazione Probabilità ed Impatto può essere la seguente:

IF (PROBABILITÀ IS xx AND IMPATTO IS xx) THEN RISCHIO IS xx

Dove XX rappresenta un valore quali/quantitativo come quello presentato nelle tabelle riportate nel seguito.

È evidente che sta all’esperto definire sia la regola, sia il valore del Rischio in conseguenza dei possibili valori attribuiti a Probabilità e Impatto.

Variabili

Esempio di valori di probabilità

Probabilità di un evento Frequenza
RaroMai accaduta ed impossibile1
ImprobabileMai accaduta, ma possibile2
PossibileMeno di una volta all’anno3
ProbabilePiù di una volta all’anno4
Molto probabilePiù di una volta al mese5

Esempio di valori del danno

Danno di un evento Quantificazione del danno
TrascurabileMinimo o nessun impatto1
MinoreNessuno sforzo extra richiesto per riparare il danno2
SignificativoDanno tangibile, sforzo extra richiesto per riparare il danno3
SerioSignificativa quantità di risorse richieste4
GraveGrandi quantità di dati, servizi o impianti compromessi, interruzione del servizio o della produzione esteso5

Espressione qualitativa dei valori di rischio

MB Molto Basso
B Basso
MMedio
AAlto
MAMolto Alto

Regole

Molto
probabile
BBMAMA
ProbabileBBMAMA
PossibileMBBBMA
ImprobabileMBMBBBM
RaroMBMBMBBB
TrascurabileMinoreSignificativoSerioGrave

Tutela del capitale intellettuale: esplicitare la conoscenza

La definizione di SE più complessi di quello qui descritto può comportare oggettivamente delle difficoltà, derivanti da una reale incapacità degli esperti umani di formalizzare le loro conoscenze esprimendole sotto forma di regole.

Una particolare categoria di SE in grado di superare questa limitazione, sono i SE neurofuzzy, realizzati mediante tecniche di soft computing. Con tale termine si intendono alcune tecnologie di IA utilizzabili in funzione dell’esigenza in modo congiunto o separato, fra le quali:

  • logica fuzzy, che si indirizza al trattamento di un aspetto che normalmente viene rappresentato con difficoltà mediante un elaboratore e cioè l’incertezza
  • reti neurali sono una struttura di calcolo che, semplificandolo, riproduce la logica di apprendimento del cervello
  • algoritmi genetici, uno strumento che consente di trovare la soluzione tendenzialmente ottima ad un problema complesso facendo evolvere le soluzioni attraverso generazioni successive che raggiungono il risultato richiesto (solo le soluzioni più promettenti, infatti, sopravvivono nel processo di evoluzione).

La logica fuzzy, in particolare, consente una più accurata descrizione della realtà introducendo il concetto di grado di appartenenza ad un insieme.

Se si considerano alti gli uomini sopra 1,80 m, un uomo altro 1,79 m nella logica tradizionale sarebbe considerato basso, mentre molto più correttamente nella logica fuzzy avrebbe un alto grado di appartenenza all’insieme degli uomini alti.

Per tornare all’esempio sopra citato, l’Impatto rappresentato sotto forma di insiemi fuzzy può assumere un valore qualunque fra i 2 estremi:

La descrizione di uno specifico strumento per la creazione di sistemi esperti basato sulla logica fuzzy o meglio sulla combinazione delle tre tecnologie sopra citate (e di una serie di applicazioni pratiche utilizzate in vari settori con lo stesso realizzate) è descritta in un volume[2] pubblicato dall’autore congiuntamente al prof. Lorenzo Schiavina (già docente di Ricerca Operativa alla facoltà di Matematica all’Università Cattolica di Brescia), che da oltre 30 anni si occupa di logica fuzzy e di programmazione a oggetti.

LOGICA FUZZY

La logica fuzzy è una estensione della logica tradizionale nella quale non è valido il principio del terzo escluso (chi è giovane non è vecchio, chi è alto non è basso, chi è bianco non è nero, ecc.).

La logica fuzzy è nata per trattare tutte le sfumature di grigio che ci sono tra il bianco ed il nero e che rappresentano l’incertezza, cosa del tutto differente dalla probabilità.

Per capire i vantaggi della logica fuzzy come strumento di soluzione, si consideri il celebre sillogismo di Socrate:

  • l’uomo è mortale (precedente)
  • Socrate è un uomo (precedente)
  • quindi Socrate è mortale. (conseguente)

Ma non tutti i problemi sono così semplici e diretti; si consideri questo esempio:

  • l’uomo sano vive a lungo
  • Socrate ha il raffreddore
  • quindi Socrate vivrà a lungo oppure no?

A differenza di qualsiasi essere umano che risponderebbe che Socrate vivrà a lungo (visto che Socrate ha un semplice raffreddore), una normale applicazione software non sarebbe in grado di trovare una soluzione.

Infatti il termine “sano” non è direttamente correlabile al “raffreddore” di Socrate, dato che (come si dice tecnicamente) l’appartenenza all’insieme degli esseri sani è soggetta ad incertezza.

Nella logica fuzzy l’appartenenza ad un insieme è una questione di grado, espresso in modo continuo, in un intervallo zero-uno.

Utilizzando la conoscenza della natura del raffreddore (cioè una lieve malattia), mediante la logica fuzzy è semplice stabilire che il grado di sanità di Socrate (anche se non è perfettamente sano e quindi non è uno) è assai vicino a quello di un essere perfettamente sano; quindi Socrate (rispetto alla domanda) vivrà a lungo.

Utilizzando il grado di appartenenza, Socrate con il raffreddore è contemporaneamente sano e malato:

  • sano con un alto grado (ma non completamente sano e quindi non con un grado di appartenenza uno, ma lievemente inferiore)
  • malato con un piccolo grado.

Tutto questo verrebbe formalizzato in un sistema fuzzy mediante una serie di regole del tipo:

IF Socrate IS raffreddato THEN Socrate vivrà a lungo.

Si osservi che il “vivrà a lungo” non identifica un grado di probabilità ma una forma di asserzione logica, anche se la probabilità e la logica fuzzy utilizzano valori fra zero e uno.

Queste regole sono molto leggibili, ma hanno la contropartita per l’utilizzatore, di dovere scrivere direttamente le regole da utilizzare per ottenere la risposta.

La logica fuzzy trova anche una sua autonoma applicazione nella lotta al terrorismo indipendentemente dal suo uso in un SE neuro-fuzzy

ALGORITMI GENETICI

Gli algoritmi genetici sono una recente tecnica di ottimizzazione che identificano l’“ottimo” mediante un processo di evoluzione degli individui che si succedono nelle generazioni.

La tecnica utilizzata dagli algoritmi genetici è quella di trovare casualmente una serie di possibili differenti soluzioni di partenza, che rappresentano la generazione iniziale da cui partirà l’evoluzione.

Ogni singolo elemento della soluzione rappresenta un individuo della popolazione evolutiva e come tale sarà caratterizzato dalle proprietà dei suoi cromosomi.

L’algoritmo genetico prevedrà uno schema di accoppiamento fra gli individui atto a selezionare i migliori (cioè le soluzioni più adatte alla sopravvivenza degli individui).

La fase di accoppiamento produrrà una nuova generazione di soluzioni che sarà mediamente migliore della precedente.

Questi due passi elementari (accoppiamento e generazione di una nuova popolazione) continueranno per un numero predefinito di generazioni fino a quando sarà trovata la soluzione tendenzialmente ottimale.

Si osservi che la soluzione “matematicamente” ottima può non essere raggiungibile per la natura stessa del problema o può essere una (soddisfacente) soluzione inferiore a quella teoricamente raggiungibile matematicamente.

RETI NEURALI

La rete neurale simula, pur in forma enormemente semplificata, il funzionamento di neuroni e sinapsi.

Se si considera un bambino che impara a camminare, si capisce immediatamente che il cervello umano impara a gestire una quantità rilevantissima di informazioni per ottenere il risultato desiderato (muoversi senza cadere) grazie a ripetuti tentativi.

Tuttavia nessuno di noi è in grado di formalizzare quali regole il proprio cervello ha ideato per riuscire a camminare, tanto è vero che riuscire a tradurre questa acquisita capacità in formule utilizzabili ad esempio da un robot, è particolarmente difficile. La nostra mente si comporta al riguardo come una black box e le reti neurali fanno altrettanto. La buona notizia è che un sistema fuzzy è una rete neurale a 2 strati, senza avere il problema di essere una black box, dato che le sue regole di comportamento sono facilmente osservabili.

[Tabella tratta da: G.BUTTI, A. PIAMONTE, Misurare la physical cyber security, 2017.

In termini pratici nella seguente videata vi è la definizione delle variabili nello strumento[3] utilizzato per lo sviluppo del SE.

e la definizione delle regole:

Se prendiamo come esempio di problema la realizzazione di un SE per la realizzazione di un’analisi dei rischi più articolato di quanto sopra rappresentato, come quello qui schematizzato:

Si potrebbe procedere secondo una logica tradizionale, nella quale l’esperto umano deve essere in grado di formulare le relazioni fra le varie entità e quindi valorizzare:

  • l’impatto economico (come conseguente) partendo dalle 3 variabili antecedenti;
  • l’impatto sociale (come conseguente) partendo dalle 2 variabili antecedenti;
  • l’impatto (come conseguente), partendo da impatto economico e impatto sociale (come antecedenti);
  • il rischio (come conseguente), partendo da impatto e probabilità (come antecedenti);

ovvero si potrebbe affrontare il problema da un altro punto di vista.

Questa tipologia di SE può essere addestrata partendo direttamente dai dati che rappresentano gli antecedenti ed i conseguenti, riportando tali informazioni semplicemente in un foglio Excel come quello qui rappresentato.

In questo caso l’esperto umano non si deve preoccupare di individuare le relazioni esistenti fra antecedenti e conseguenti in termini di REGOLE, ma solo in termini di valori.

Sarà lo strumento, che analizzando i dati ricostruirà tali regole creando automaticamente il SE[4].

Ulteriore vantaggio di tale strumento è che, a differenza di una normale rete neurale che si comporta solitamente come una black box è che l’algoritmo individuato è trasparente e quindi può essere ulteriormente affinato dall’esperto umano.

È evidente come questa impostazione possa applicarsi virtualmente a qualunque tipo di problema.

L’esperto umano che è in grado di individuare la soluzione di un problema basandosi sulla sua esperienza, partendo da una serie di variabili e traendone delle conclusioni, potrà limitarsi a descrivere gli antecendenti e conseguenti, senza preoccuparsi di descrivere le relazioni che ha implicitamente attivato e che molto probabilmente non è in grado di descrivere (ad esempio perché derivano dall’esperienza e dalle osservazioni e non dall’applicazione di specifiche regole formalizzate).

Ruolo dell’esperto di dominio e della tecnologia disponibile per la realizzazione del SE

Modalità di realizzazione del SECoinvolgimento dell’espertoTipologia di strumento
Impostazione manuale di regoleL’esperto è in grado di formulare le soluzioni matematiche e logiche alle varie situazioni.

L’esperto ha quindi una conoscenza esplicita del problema che è in grado di esprimere mediante variabili e formule.

Sistema fuzzy tradizionale
Data In, Rules OutL’esperto indica le soluzioni di una serie di esempi, ma non è in grado di formulare soluzioni matematiche.

L’esperto ha quindi una conoscenza implicita del problema derivante dalla sua esperienza, ma non è in grado di tradurre questa in specifiche formule.

Più esperti possono contribuire con propri esempi.

Le soluzioni matematiche prodotte dal SE sono visibili dall’esperto che può intervenire successivamente alla loro generazione per integrarle attraverso un processo interattivo.

Sistema neuro-fuzzy

Conclusioni

L’IA non consente soltanto di trovare relazioni nascoste fra migliaia di dati, ma anche di esplicitare la conoscenza che persone esperte non sarebbero altrimenti in grado di formalizzare.

Un grosso aiuto quindi anche per le aziende, che possono in questo modo formalizzare una parte del proprio patrimonio informativo che rischierebbero di perdere alla conclusione del loro rapporto con i loro collaboratori più validi.

NOTE BIBLIOGRAFICHE

Argomenti, immagini e tabelle di questo articolo sono tratte dalle pubblicazioni:

  • L. Schiavina, G. Butti, Intelligenza artificiale e Soft Computing: applicazioni pratiche per aziende e professionisti, FrancoAngeli, Milano 2017
  • G. Butti, A. Piamonte, Governance del rischio. Dall’analisi al reporting e la sintesi per la Direzione, ITER, 2020

NOTE

  1. 1 Una definizione formale è quella proposta da Th. A. STEWART, Intellectual Capital: The New Wealth of Organizations, New York 1997, che lo considera come insieme di:• il capitale umano quale insieme delle competenze, abilità, capacità e conoscenze (sia implicite, sia esplicite) possedute dai membri di un’organizzazione che permettono di svolgere in maniera efficace ed efficiente le attività istituzionali• il capitale organizzativo, costituito da tutte quelle strutture, quei meccanismi, quelle procedure, quei processi formalizzati ma anche non codificati che creano valore per l’organizzazione (fra i componenti del capitale organizzativo si trovano ad esempio brevetti e marchi, elementi della così detta proprietà intellettuale alla quale il diritto internazionale riserva, anche se non in forma omogena, una specifica tutela)

    • il capitale relazionale comprende tutte le relazioni che un’organizzazione instaura con i suoi stakeholder (clienti/utenti, fornitori, finanziatori, comunità locale ecc.)

  2. L. Schiavina, G. Butti, Intelligenza artificiale e Soft Computing: applicazioni pratiche per aziende e professionisti, FrancoAngeli, Milano 2017
  3. FuzzyWorld.
  4. DI-RO (Data In – Role out)
WEBINAR
Intelligenza Artificiale, Data Analysis e Image Recognition: i vantaggi concreti per l’azienda
Big Data
Intelligenza Artificiale

@RIPRODUZIONE RISERVATA

Articolo 1 di 5