Google, tramite la sua portavoce Chetna Bindra, quale Product Manager User Trust and Privacy, ha recentemente fornito alcuni dettagli in più rispetto all’imminente framework Google Privacy Sandbox, nuova frontiera – dichiarata più privacy-friendly – per consentire soprattutto agli attuali inserzionisti di Google, che attualmente sfruttano cookie di terze parti, di ottenere risultati accettabili e simili quanto alla penetrazione di mercato, insight ecc., utilizzando dati perlopiù pseudonimizzati/anonimizzati e comunque senza identificativi diretti degli utenti.

Di Google Privacy Sandbox faranno parte ad es. FLoC (Federated Learning of Cohorts), Turtledove, Fledge, Aggregate Reporting, User Agent Client Hints, Gnatcatcher e altri strumenti che abbandoneranno l’attuale utilizzo di identificatori di vario tipo. Concentrando la “regia” pubblicitaria non più sul web aperto bensì filtrando tutto attraverso il browser.

Ciò quando gli attuali strumenti, ovvero i cookie di terze parti, verranno “banditi” da Chrome, cioè bloccandoli come impostazione di default, rendendo molto difficile se non impossibili le attuali forme di tracciamento e relativa profilazione (Safari e altri browser sono già stati reimpostati in tal senso).

Si noti che Google ha spostato il termine proposto in precedenza per l’abbandono, su Chrome, di tali cookie, dalla fine 2022 per arrivare a fine 2023, onde approfondire maggiormente le nuove proposte.

Ovviamente, Google e altri operatori intermediari non vogliono affatto perdere il ruolo chiave avuto finora proprio nel settore, per cui si stanno battendo strade alternative a uso e consumo del mercato attuale quanto a risultati (promessi) che siano ben accetti ed efficaci dal punto di vista degli operatori.

Google stessa ammette la difficoltà degli operatori attuali nell’immaginare un nuovo ecosistema, un marketing digitale privo di tali strumenti come i cookie, con il rischio di privarli di un feedback sulle campagne marketing e di annunci mirati i piani di promozione aziendale.

Ecco perché Google sta sviluppando Sandbox, un nuovo ecosistema digitale che mira agli stessi risultati precedenti nel digital advertising ma senza utilizzare i dati personali, almeno non in maniera così invasiva e massiva, soprattutto celando l’identità degli utenti pur facendo loro arrivare annunci targetizzati e ricevendo feedback comportamentali.

Il “come” è ciò che Google sta rivelando a tratti, anche per il work in progress dell’insieme, rassicurando ripetutamente sul fatto che le nuove tecniche bilanceranno rispetto della protezione dei dati (soprattutto lato privacy by design e relativa minimizzazione) ed efficacia commerciale.

Il punto è che “spezzare” il nesso tra dati e persone fisiche identificate potrebbe non essere così irrinunciabile per il settore come è parso finora, utilizzando tecniche innovative che arrivino tuttavia, come promette Google, a una sufficiente precisione metrica.

Gli obiettivi di Google Sandbox

Nel comunicato Google arriva a precisare le differenze con le attuali prassi e tecniche, suddivise in tre macro-gruppi di funzioni (ancor meglio: tre tipologie di API, cioè Application Programming Interface) tuttora ricoperte dall’uso di cookie di terze parti:

Mostrare annunci basati sugli interessi specifici: oggi avviene il tracciamento delle persone sul web per scoprire a cosa ogni persona potrebbe essere interessata – con Sandbox le persone saranno incluse in gruppi di persone, cluster omogenei per interessi simili (detti “coorti”);

Coinvolgere i visitatori passati del sito web: oggi si misura il modo in cui le persone rispondono agli annunci in un modo che potrebbe rivelare la loro identità – con Sandbox potranno essere mantenute “anonime” limitando la quantità di dati che possono essere condivisi su di esse;

Misurare le conversioni dagli annunci: oggi si raccolgono le informazioni sulle persone nel corso della visualizzazione degli annunci – con Sandbox tali informazioni potranno essere conservate sul dispositivo di ogni persona, in modo che rimangano riservate, quale forma di edge computing.

Oltre a ciò, si dichiarano anche utilizzi secondari per prevenire frodi pubblicitarie (tramite una forma di verifica utente attendibile non basata sull’identità, bensì su un token) e per il rilevamento delle impronte digitali utente tramite dispositivo (ove vengano raccolti i dati su un dispositivo per identificare il proprietario, un chiaro dato biometrico ai sensi del GDPR).

Chrome e l’iter di Google Sandbox

Chrome – ovvero uno dei browser più diffusi al mondo e sul relativo, opaco sfruttamento dei dati personali abbiamo già scritto – rappresentano lo strumento principe battezzato da Google per implementare quanto descritto.

Ciò a fronte di un iter – dichiara sempre Google – ove le proposte subiscono un periodo iniziale di valutazione e sperimentazione pubblica, onde raccogliere il feedback delle aziende che possono discutere, testare e fornire report a Google.

Le proposte sopra menzionate sono ancora nella prima fase di test, con l’obiettivo di lanciare ogni singola proposta in seguito come funzionalità specifica di Chrome, oltre che in tutti i browser terzi che decidano di sposare tali nuove tecnologie.

A marzo 2021 Google ha anche pubblicato un’anteprima delle opzioni Privacy Sandbox nelle nuove versioni di Chrome. La funzione apposita pare si chiamerà “web crowd and ad measurement” e permetterà – sempre se attivata dall’utente, non certo di default come sarebbe invece opportuno in ottica GDPR – di non subire più tracciamenti identificativi lato marketing, per quanto dichiarato da Google.

Cosa Google consiglia di fare fin d’ora agli operatori

Sebbene Google non si dilunghi sul perché, prende atto che attualmente l’atteggiamento e le aspettative degli utenti interessati (chiamati “consumatori” nel comunicato, a sottolineare come negli USA le tutele di data protection si appoggino proprio su di una visione consumeristica piuttosto che specifica dei dati personali quali fonti di diritti e libertà generali non legati all’atto di consumo) sia verso un maggior rispetto dei loro dati personali e dunque di una minor invasività delle prassi commerciali, soprattutto quanto al debordante e ormai onnipresente tracciamento, persino cross device.

Sandbox di Google vuole introdurre questo cambiamento – che possiamo dire “epocale” considerato il passato e anche il presente di Google quanto allo sfruttamento dei dati personali a fini commerciali -, onde non perdere il proprio ruolo chiave per gli inserzionisti così che anch’essi – suo tramite – possano garantire finalmente una minimizzazione effettiva nel trattamento dei dati personali pur facendo marketing.

Premesso ciò, nel comunicato Google – per chi non l’avesse ancora colto – precisa che chi opera nel settore marketing è opportuno sia consapevole della rivoluzione in atto e che fin d’ora cominci ad adattare – al netto di quanto preconizzato dagli strumenti di Sandbox – la propria strategia promozionale e di cura dei clienti. In passato ne abbiamo già accennato, infatti i consigli di Google ricordano strategie già in corso presso grossi brand:

cercare maggiori opportunità per costruire relazioni dirette con i propri clienti, supportate da strumenti di prima parte (ad es. come i cookies di prima parte) per i propri siti Web, a fronte di infrastrutture di web tagging (anche per la misurazione delle conversioni) e consensi appropriati;

(ad es. come i cookies di prima parte) per i propri siti Web, a fronte di infrastrutture di (anche per la misurazione delle conversioni) e appropriati; sfruttare soluzioni che utilizzano l’automazione, l’IA e il machine learning per identificare trend e modelli nelle conversioni, nel caso di lacune nei dati disponibili; questo aspetto merita una maggiore esposizione: quando si misurano le conversioni tra più dispositivi (oltre che rispetto allo iato online-offline), potrebbero non esserci cookie disponibili per collegare questi dispositivi tra loro rispetto al medesimo utente, dunque l’inserzionista non sarà in grado di attribuire alcune delle conversioni agli utenti che hanno interagito con un annuncio – senza tecniche di modellazione, questo problema di attribuzione lascerà tali lacune nella customer journey e impedirà di comprendere appieno i percorsi di conversione; mentre i dati osservabili possono alimentare algoritmi che utilizzano altresì i trend storici per convalidare le misurazioni, sfruttando al contempo solo dati aggregati.

Su questi temi Google ha messo a disposizione due brevi manuali per introdurre maggiormente gli operatori alle novità a venire, specie quanto alla misurazione dei dati delle campagne.

I dubbi sul rispetto dei diritti data protection e normativa antitrust

Il primo grosso dubbio su quanto annunciato da Google sorge anzitutto dal fatto che verrà tutto centralizzato in Google stessa, nelle proprie tecnologie (Chrome e browser aderenti alle nuove proposte). Ci si dovrà sostanzialmente fidare di quanto dichiarato e dei dati processati tramite i nuovi strumenti: sarà Google stessa ad attuare le predette strategie di raggruppamento degli interessati in coorti e via dicendo.

La strategia di Google dichiara sostanzialmente l’uso di dati “anonimizzati” (non soggetti al GDPR) che forse sono più correttamente dati “pseudonimizzati” (definiti all’art. 4 n. 5 GDPR e da considerare dati personali), concetti facili da confondere e che comportano delicate differenze di disciplina. Oltretutto lo stesso concetto di “anonimato” è relativo e dinamico, dovendo trovare debita analisi privacy by design nell’implementazione tecnologica e operativa.

Basti menzionare che più d’uno, negli USA, ha già sollevato un sopracciglio circa l’effettivo rispetto della privacy utente: per tutti menzioniamo Eric Rescorla, CTO di Firefox, che nel giugno scorso ha pubblicamente ravvisato criticità quanto a FLoC, a fronte di un’analisi svolta in proprio.

In particolare, FLoC utilizzerebbe sì delle coorti ma la loro dimensione sarebbe rilevante lato privacy: secondo Rescorla pare che Google voglia limitarle a poche migliaia di soggetti, un numero che consentirebbe facilmente a Google e a terzi una rapida re-identificazione (ad es. abusando del browser fingerprinting, tecnologia da sempre poco compliant con consensi, revoche, controllo dei dati, trasparenza ecc.).

Inoltre, FLoC non rinuncerebbe affatto agli identificatori, bensì userebbe ID seppure temporanei che – debitamente combinati e magari arricchiti di dati esterni – possono ricondurre, nuovamente, alla re-identificazione utente.

Si tratta di dubbi giustificati: Google stessa li ha riconosciuti e persino già proposto alcune contromisure (ad es. sopprimendo le coorti legate a determinati contenuti “sensibili” (cioè i dati particolari ex art. 9 GDPR, come ad es. lo stato di salute), abbinando l’uso di FLoC a un consenso specifico) – ritenute insufficienti dai critici.

A sua volta Mozilla ha fatto controproposte, da vedere se verranno accettate da Google. I critici comunque comprendono altri noti browser come Brave, Vivaldi e Opera, tutti piuttosto negativi in merito al progetto.

Google è piuttosto riservata sull’esatto funzionamento e sulla sinergia delle varie proposte nella versione finale di Chrome, ed è noto come la predetta fase di testing di FLoC si stia svolgendo con soli operatori USA (i quali di fatto si limitano a riportare dei risultati dall’uso delle API e misurarli, non certo apprendendo il funzionamento tecnico degli strumenti di Google), evitando accuratamente operatori che possano dover applicare il GDPR.

Il che alimenta i dubbi appena esposti, sebbene Google abbia fatto riferimento al possibile uso di Trusted Third Parties per garantire anche il rispetto della normativa comunitaria, oltre al fatto che – almeno per le API principali – il progetto Sandbox sia gestito in open source e ambisca a definire nuovi standard.

Che l’uso di dati pseudonimizzati e anonimizzati sia comunque una delle strade maestre nel trattamento dei dati dei prossimi anni è chiaro, nonostante le attuali incertezze applicative e normative.

Il tempo ci dirà se e come Google potrà effettivamente garantire le aspettative di data protection che sta annunciando, man mano che le varie proposte supereranno le fasi di test e arriveranno all’ufficiale lancio sul mercato. Riusciranno davvero a fare a meno di identificatori? I dati saranno sufficientemente anonimi?

Nonostante quanto promesso agli operatori, Google stessa eviterà di accedere in chiaro ai dati raccolti dal browser Chrome (come ad es. la cronologia)?

Sarà un caso ma proprio a luglio è stato pubblicato un importante report commissionato dal Parlamento Europeo intitolato “Regulating targeted and behavioural advertising in digital services” incentrato proprio sull’analisi della situazione attuale del trattamento dei dati, sul consenso per fini di marketing e sulle prospettive di riforma normativa settoriale in via sempre più stringente per big player come Google.

Infine, è da tempo che Google risulta sulle braci delle autorità Antitrust, sia unioniste che USA, che potrebbero sancire lo “spezzatino” del colosso di Mountain View (almeno della parte aziendale dedicata al marketing).

L’autorità antitrust britannica CMA (di concerto con l’ICO di tutela dei dati personali) ha persino indetto una consultazione pubblica sulle proposte qui esaminate, alla luce dei possibili risvolti di abuso di posizione dominante e distorsione del mercato che incombono su soluzioni accentrate nel browser Chrome (ad es. quanto alla trasparenza e imparzialità verso gli operatori che utilizzeranno Sandbox).

Mentre autorità antitrust americane come quella del Texas, nella figura dell’Attorney General, hanno presentato recentemente segnalazioni per bloccare il progetto Sandbox, a loro avviso una minaccia all’accesso ai dati degli utenti (vietato agli operatori, possibile per Google) e relativa asimmetria informativa e commerciale, così come l’annunciato bando ai cookies di terze parti.

Un rischio evidente è la maggiore opacità di Google verso gli operatori e gli utenti, quanto all’effettivo utilizzo di dati in chiaro o meno. Inoltre potrebbe avvantaggiarsi dei dati di prima parte raccolti dagli operatori, magari di nicchia e particolarmente validi lato marketing, per costruire le predette coorti e cluster vari ma anche per proprie profilazioni.

I cambiamenti proposti da Google in Sandbox possono essere letti anche come tattiche per poter riconquistare maggiore fiducia, sia della politica che del mercato, per evitare rappresaglie e sottrarsi almeno parzialmente alle normative di protezione dei dati. Insomma, non si dovrà perdere nemmeno una puntata della movimentata vita di Google per capire quale futuro attende il web marketing.

