TECNOLOGIA

Quando l’informatica è dappertutto

L’ubiquità dei sistemi informatici si confronta con la questione della privacy

0 / 1

Quando l’informatica è dappertutto

21 febbraio 2022

di Marc Langheinrich, Decano della Facoltà di scienze informatiche all'USI

Sono passati due anni dallo scoppio della pandemia di Covid-19 e molte cose sono cambiate nelle nostre vite: i nostri comportamenti, i modi di lavorare, l’insegnamento e l’apprendimento a scuola, i processi produttivi, i trasporti, i viaggi, e altro ancora. Ma pensiamo anche a quanto le tecnologie digitali siano state indispensabili per consentire tali repentini cambiamenti imposti dalla crisi. Come molti analisti hanno evocato durante questi lunghi mesi, forse andremo incontro a una nuova normalità, con una società post-pandemica nella quale tecnologia e informatica saranno ancora più presenti di prima. Non che queste siano state poco presenti finora, anzi. Da almeno due decenni i sistemi informatici sono praticamente ovunque, sono pervasivi. Come professore e ricercatore all’Usi mi occupo proprio di "ubiquitous computing", un termine che descrive la prossima generazione di piattaforme informatiche integrate, che ci consentiranno di dotare i nostri dispositivi quotidiani con capacità di rilevamento, calcolo e comunicazione, modificando così significativamente il nostro modo d’interagire con questi sistemi – e con la società in generale. Dato che questa ‘informatica pervasiva’ sarà presente in quasi ogni aspetto della nostra vita, avremo bisogno non solo di sistemi e interfacce utente validi e adeguati, ma dovremo curare attentamente anche aspetti sociali come la fiducia e soprattutto la tutela della persona (dati personali).

Privacy, diritto individuale e collettivo

La tutela della sfera privata è forse una delle sfide più ovvie alla crescente digitalizzazione della nostra vita quotidiana. A partire dagli anni 70, quando gli Stati nazionali iniziarono a usare la nascente tecnologia informatica delle banche dati per immagazzinare e successivamente analizzare i dati dei censimenti nazionali, furono emanate le prime leggi sulla privacy con lo scopo di evitare che i governi spiassero nelle vite dei cittadini. Da allora, in Europa le leggi sulla privacy si sono evolute per includere anche aziende private, con l’obiettivo di consentire alle persone di avere un "controllo" su chi sa che cosa su di loro. Inoltre, oggi il diritto alla privacy va considerato non solo come un diritto individuale, ma la sua tutela rafforza collettivamente la democrazia.

Affamati di dati

Gli smartphone di oggi sono dei veri e propri gioielli tecnologici che permettono meraviglie, come ritoccare una foto con il semplice tocco di un dito o tradurre una frase mentre viene pronunciata – meraviglie rese possibili grazie all’uso dell’intelligenza artificiale, o sistemi di algoritmi che analizzano enormi quantità di dati da cui "imparano". Per esempio, quando usiamo il correttore automatico sui nostri smartphone, la tastiera inizia con un modello iniziale fornito da Apple o Google, ma più usiamo la tastiera e modifichiamo le correzioni che il sistema propone, a sua volta il modello si aggiusta per prevedere meglio il nostro stile personale di scrittura, o le parole e i dialetti locali. La maggior parte di queste app per tastiere rimanda le parole sconosciute a un server centrale, che è quindi in grado di rilevare nuove parole e frasi (per es. nomi di artisti, eventi, nuove espressioni ecc.) e a sua volta aggiorna il modello in tutte le app per tastiere installate in una certa regione geografica in modo che gli altri utenti possano trarre vantaggio senza soluzione di continuità dal fatto che l’app sia in grado di auto-correggere queste nuove parole.

Cui prodest?

Per comprendere meglio il potere dei dati personali (e della sfida per la privacy) guardiamo a Internet. Sempre più spesso ci colleghiamo alla Rete e usiamo servizi online per, ad esempio, fare acquisti, leggere notizie o guardare film. Molti di questi servizi ci vengono offerti gratuitamente, poiché sono finanziati con la pubblicità. I fornitori di servizi forniscono infatti agli inserzionisti uno ‘spazio’ sulle loro pagine web e in cambio vengono pagati ogni volta che un utente clicca su uno di questi annunci. Ovviamente, l’obiettivo di un inserzionista è quello di aumentare le possibilità che si clicchi sul suo annuncio. Se, da una parte, questo dipenderà dall’interesse per il prodotto o servizio che viene pubblicizzato, dall’altra parte è importante che l’annuncio sia rilevante e visibile all’utente che guarda la pagina web in questione. Non sorprende quindi che, dietro le quinte, i siti web facciano di tutto per scoprire che cosa interessi alle persone che li consultano.

Biscottiamo

Una tecnologia chiave per il meccanismo della pubblicità online è il cosiddetto "Web Cookie", una breve stringa di testo o di numeri che un sito web invia al browser dell’utente che lo consulta. Ogni volta che l’utente visita di nuovo il sito web, il browser invia questa breve stringa di testo o numeri al sito (che, a sua volta, può inviare una stringa diversa, mantenere quella vecchia, o anche chiedere al browser di cancellarla del tutto). Questo semplice meccanismo semplifica l’interazione sul web. Per esempio, i cookie permettono a siti come Amazon o Facebook di "ricordare" un visitatore, in modo da non dover chiedere ripetutamente nome utente e password. Le reti pubblicitarie che inseriscono annunci sui siti web hanno presto imparato che potevano usare i cookie in modo simile per "ricordare" i visitatori. Si pensi ad esempio quando si legge una notizia su un portale online dove, accanto al testo, appaiono degli annunci: questi sembrano essere sulla stessa pagina web dell’articolo che l’utente sta leggendo, ma in realtà sono trasmessi "al volo" direttamente dal sito web dell’inserzionista e poi perfettamente integrati nel portale online. Così, in realtà, un utente non sta visitando un solo sito (quello delle notizie) ma ben due. Questo secondo sito (quello della rete pubblicitaria) è chiamato un sito "di terzi", e tutti i cookie che potrebbe chiedere al browser di conservare sono chiamati "cookie di terzi" (third party cookie). Questi cookie di terzi sono ciò che oggi fa funzionare gran parte della pubblicità online mirata. Il vero potere di questi cookie entra in gioco quando l’utente visita in seguito un altro sito web, per esempio un blog di cucina, che utilizza la stessa rete pubblicitaria del sito del giornale. La rete pubblicitaria sarà di nuovo contattata per trasmettere un annuncio al volo, ma grazie al cookie che il browser dell’utente ha ricevuto sul sito del giornale e ora lo rimanda indietro, sa anche che questo utente ha visitato sia il giornale che il blog di cucina.

Dal tracciamento individuale a quello di gruppo

Google è di gran lunga la più grande rete pubblicitaria del mondo, che con il suo servizio AdSense copre oltre il 20% del mercato. Non sorprende quindi che Google faccia molto affidamento sui third party cookie: ogni volta che un utente visita un sito web che utilizza AdSense, Google "imparerà" le sue abitudini di navigazione in maniera sempre più dettagliata. Ma, a grande sorpresa, Google ha annunciato nel marzo 2021 che avrebbe eliminato questi cookie e messo fine a tutti i tracciamenti di terzi. Questa mossa sembra contro intuitiva. Eppure, Google pensa di aver trovato un modo per continuare a vendere annunci altamente efficienti (cioè, mirati) senza la necessità di tali profili di tracciamento. La soluzione è chiamata "Federated Learning of Cohorts" (FLoC), una funzione del browser che ‘impara’ (learning) il comportamento di navigazione di un utente e poi classifica questo comportamento in una serie ragionevolmente grande di ‘categorie’ di utenti (cohort). Questo apprendimento si effettua in modo distribuito (federated), senza la necessità di un server centrale che potrebbe contenere i dati personali di un utente. I siti possono, a loro volta, dichiarare il loro interesse a conoscere questa classificazione dei loro visitatori, che il browser invierà con ogni richiesta (invece del solito set di cookie di tracciamento).

Non più categorie ma ‘argomenti’

Agli utenti e alle associazioni di difesa dei consumatori il nuovo metodo di tracciamento di Google non è per nulla piaciuto, al punto tale che a gennaio di quest’anno FLoC è stato abbandonato. Al suo posto, Google ha annunciato il lancio di una nuova iniziativa chiamata "Topics". La più grande differenza rispetto a FLoC è duplice: in primo luogo, Topics presenta solo poche centinaia di categorie, tutte in formato leggibile dall’uomo (ad esempio, "Sport-Boxe"), tra le quali il browser Chrome ne selezionerà solo cinque a settimana sull’arco delle ultime 3 settimane di navigazione. Gli utenti saranno in grado di ispezionare facilmente questi argomenti e rimuovere quelli a cui non vogliono essere associati. In secondo luogo, una volta che un sito web richiede al browser l’argomento di interesse di un utente, il browser non avrà un singolo "cohort-ID" (identificativo di gruppo) da condividere ma invece selezionerà tre argomenti da condividere a caso, uno ciascuno dai top-5 di ogni settimana. Mentre Topics sembra risolvere molte cose ritenute sbagliate di FLoC, rimane poco chiaro l’impatto che avrà sulla privacy del web. In particolare, gli altri browser adotteranno il nuovo sistema, o continueranno a supportare i cookie di terzi (e quindi il tracciamento)? Inoltre, come reagiranno gli inserzionisti? Chiaramente, un sistema di annunci personalizzati che presenta "solo" alcune centinaia di categorie di interessi degli utenti è un grande passo indietro rispetto al modello di tracciamento di terze parti altamente personalizzato di oggi. Se in futuro il sistema AdSense di Google adotterà solo Topics, gli inserzionisti potrebbero essere portati a stringere accordi con i proprietari di siti web, che possono continuare a usare i loro cookie e quindi mantenere la capacità di costruire profili utente personalizzati – il tutto a scapito del miglioramento della privacy.

Si inaugura con questo contributo del professor Marc Langheinrich la rubrica mensile curata dall’Università della Svizzera italiana e dedicata a temi fra informatica e società. Nei prossimi mesi docenti e ricercatori dell’Usi parleranno di tecnologia e digitalizzazione attraverso le loro rispettive aree di competenza, che all’Usi spaziano dai sistemi informatici e computazionali ai linguaggi di programmazione e all’ingegneria del software, passando dall’intelligenza artificiale e dalle tecnologie di apprendimento automatico.