L’aspetto della liceità della raccolta dei dati per lo sviluppo dei sistemi di AI è una questione di particolare rilevanza pratica, come espresso già nel corso dell’azione coordinata della task force dell’EDPB e, in seguito, all’interno del parere 28/2024.
Determinare le regole di liceità da adottare nel training dei modelli di AI comporta un impatto significativo tanto nei confronti degli interessati che del mercato, in quella delicata opera di bilanciamento svolta dal GDPR fra protezione dei diritti e libertà fondamentali delle persone e garanzia della libera circolazione dei dati personali.
Limitarsi all’impiego di dataset dei soli interessati che hanno espresso un consenso per sviluppare un LLM comporterebbe costi molto elevati, rallentando inevitabilmente lo sviluppo e l’avanzamento di questi modelli e, di conseguenza, la competitività del settore tecnologico europeo. Inoltre, renderebbe ogni attività di web scraping ontologicamente illecita. Anzi: ogni attività di web scraping dichiarata. Con tutte le conseguenze del caso.
Il legittimo interesse come base giuridica
Il legittimo interesse diventa così la possibile base giuridica per l’AI che può ben contemperare innovazione ed un’elevata protezione dei dati personali, come confermato dalle recenti raccomandazioni espresse dall’autorità di controllo francese CNIL.
A condizione, però, che vengano adottate garanzie concrete, la cui selezione e valutazione è comunque rimessa al titolare del trattamento secondo il principio di accountability.
Prima fra tutte, la trasparenza che assume un ruolo pivotale.