La nuova èra della disinformazione di massa è appena cominciata

Sono passati cinque anni dall’avvento dei primi deepfake, ma per fortuna l’apocalittico scenario informativo già allora previsto non si è verificato
Le cose potrebbero però a breve cambiare con l’avvento delle intelligenze artificiali generative, in grado di creare una marea di testi, immagini e video assolutamente verosimili
Nel caos che rischia di generarsi, sta alla politica, alle società che gestiscono gli algoritmi di intelligenza artificiale e anche alla stampa trovare nuove soluzioni

In futuro potremmo ricordare la finta fotografia del Papa con addosso un gigantesco piumino bianco come un momento di svolta. È infatti forse la prima volta che un’immagine generata da un’intelligenza artificiale è stata ampiamente ritenuta vera, anche da non pochi mezzi d’informazione. È un salto di qualità rispetto alle fake news e ai deepfake del passato, la cui circolazione era limitata ad alcuni ambienti cospirazionisti (com’è stato il caso del video modificato per far apparire Nancy Pelosi come se fosse ubriaca) oppure erano immediatamente riconoscibili come falsi (come avvenuto con il finto video di Zelenky che dichiara la resa dell’Ucraina).

Quel momento è stato superato: la foto fasulla di Bergoglio potrebbe rappresentare l’antipasto di ciò che ci aspetta per il futuro. Un futuro in cui distinguere ciò che è vero da ciò che è falso sarà sempre più difficile e in cui la fiducia collettiva sarà ulteriormente erosa. Si tratta di timori eccessivi o siamo davvero di fronte a un cruciale salto di qualità?

Deepfake e deeplearning

Facciamo un passo indietro. Era il 2018 quando per la prima volta emergevano i pericoli informativi legati alla diffusione dei deepfake: la tecnologia basata su deep learning (gli algoritmi ormai sinonimo di intelligenza artificiale) che permette di ricreare digitalmente le sembianze e la voce di qualunque persona, sincronizzando anche il labiale e riuscendo così a far dire a chiunque tutto ciò che si vuole.

L’esempio più noto, organizzato da BuzzFeed e dal regista Jordan Peele, aveva come protagonista un finto, ma assolutamente credibile, Barack Obama che in un video insultava pesantemente Donald Trump. Anche in quel caso, sembrava di essere di fronte a un momento spartiacque, superato il quale saremmo stati inondati da deepfake indistinguibili dalla realtà, attraverso i quali sarebbe stato potenzialmente possibile far dire qualunque cosa a ogni personalità collocandola in qualunque luogo.

Da allora, sono passati cinque anni e questo scenario apocalittico non si è per fortuna verificato. Ma quali sono le ragioni? Prima di tutto, all’epoca i video finti erano creati tramite un complicato sistema chiamato in gergo tecnico GAN (generative adversarial network): è un metodo che richiede la presenza di due differenti algoritmi che – in una sorta di riproduzione informatica della relazione tra il falsario e l’esperto d’arte – si “sfidano” finché il primo (il generatore) non riesce a creare un video o un’immagine che il secondo (il controllore) scambia per materiale genuino.

È un metodo che, a meno che non si vogliano ottenere risultati molto approssimativi (e che quindi non ingannano nessuno), richiede competenze notevoli, risorse informatiche importanti e un lungo lavoro. Con il tempo, ovviamente, la creazione dei deepfake si è semplificata, ma ancora non abbastanza da renderli alla portata di tutti e quindi limitando enormemente la loro diffusione a scopi di disinformazione.

Ciò vale a maggior ragione visto che, nel frattempo, i vecchi e molto più semplici strumenti di disinformazione e propaganda hanno dimostrato di saper ancora svolgere egregiamente la loro funzione: dalle classiche fake news circolate nel corso della pandemia alle teorie del complotto come QAnon, che hanno trovato nuova linfa grazie ai social network, fino ai video e alle immagini di guerra appartenenti a conflitti del passato rimessi in circolazione per far credere che riguardassero l’attuale conflitto in Ucraina. Chi ha bisogno di complessi e costosi deepfake quando basta così poco per generare ondate di disinformazione?

Questo scenario – già complesso e difficile da affrontare anche da piattaforme social dalle risorse pressoché illimitate – rischia però di essere a breve relegato al passato. L’avvento delle cosiddette “intelligenze artificiali generative” cambia infatti ancora una volta le carte in tavola: chiunque può utilizzare MidJourney, Dall-E 2 e altri sistemi analoghi per creare delle credibilissime immagini finte – come visto proprio nel caso del Papa – solo digitando un apposito testo che descrive ciò che si vuole venga raffigurato.

Se una GAN doveva essere addestrata specificamente per creare una singola immagine o un singolo video, i nuovi sistemi generativi (tecnicamente noti come “diffusion model”) possono sfornare in pochi istanti e a prezzi bassissimi una serie infinita di immagini e, a breve, anche di video di qualità sempre migliore. Uno studio pubblicato dal Global Network on Extremism and Technology sottolinea proprio come “l’avvento dell’intelligenza artificiale generativa possa consentire a una varietà di attori non statali di produrre un’enorme quantità di contenuti di propaganda sempre più sofisticati e con sempre meno sforzo”. Ovviamente, lo stesso vale anche per la propaganda di stato o di partito.

Qualche esempio c’è già: le immagini finte (e non ancora di sufficiente qualità) dell’arresto di Donald Trump e del baciamano di Putin a Xi Jinping sono state un campanello d’allarme sufficiente per far decidere alla società che gestisce MidJourney di interromperne l’utilizzo gratuito (la versione base a pagamento, comunque, costa solo 8 dollari al mese). L’impressione, questa volta, è di essere di fronte a un cambio di passo. E lo stesso vale per il potenziale utilizzo di ChatGPT come generatore infinito di false notizie, ricostruzioni, dichiarazioni e quant’altro.

È allora questo lo scenario che abbiamo avanti? Un costante rumore di fondo, in cui notizie, immagini, video veri e falsi si mescolano senza soluzione di continuità, aggravando ulteriormente la già enorme sfiducia nei confronti dell’informazione – secondo l’ultimo Eurobarometro, solo il 39% dei cittadini dell’Unione Europea si fida della stampa – e aumentando ulteriormente la fruizione delle notizie in “modalità intrattenimento” (come l’ha definita lo European Journalism Observatory), ovvero senza nemmeno fare più caso a quanto possano essere vere o false?

Anche a causa dei primi e più noti esempi, è facile tra l’altro pensare che le guerre informative a colpi di immagini tanto fasulle quanto realistiche saranno combattute soprattutto tra Stati Uniti e Cina, Unione Europea e Russia. In realtà, a essere ancora più esposte a questi rischi sono le nazioni economicamente meno sviluppate e soprattutto quelle soggette a grandi tensioni interne, dove quindi basta – come avvenuto in India, Myanmar, Vietnam e altrove con le tradizionali fake news – la scintilla generata da una finta immagine a scatenare gravi violenze.

Quali sono le contromisure attuabili? La cattiva notizia è che, almeno per il momento, le immagini create con le intelligenze artificiali generative hanno dimostrato di essere in grado di aggirare i (già imperfetti) metodi di rilevamento dei tradizionali deepfake. La buona notizia è invece che alcune soluzioni tecnologiche e politiche sono già in fase di definizione. Per quanto riguarda le prime, la Coalition for Content Provenance and Authenticity – guidata da Microsoft, Intel, Adobe, BBC e altri – sta lavorando alla creazione di una robusta infrastruttura di autenticazione: una sorta di sigillo digitale allegato a ogni contenuto mediatico che ne certifichi la provenienza e segnali ogni possibile modifica.

Dal punto di vista politico, l’Unione Europea ha invece varato nel giugno del 2022 delle norme che obbligano le piattaforme ad agire contro deepfake e dintorni. Le stesse società che gestiscono i sistemi di intelligenza artificiale generativa potrebbero inoltre decidere di intervenire in maniera netta, per esempio impedendo ai loro algoritmi di rispondere a comandi che riportano i nomi di personalità politiche o di creare scene di violenza, arresti o altro. Una soluzione, anche in questo caso, parziale, visto che già si stanno diffondendo le cosiddette tecniche DAN (do anything now, “adesso puoi fare tutto”) che consentono di aggirare i blocchi imposti, per esempio, a ChatGPT. Eliminare invece dal database tutti i contenuti relativi a personalità politiche o simili è invece non solo particolarmente complicato da fare, ma rischia anche di compromettere l’efficacia del sistema (che ha ovviamente anche applicazioni professionali e legittime).

Allo stesso tempo, è di cruciale importanza proseguire nell’alfabetizzazione digitale della popolazione, cercare di restaurare almeno in parte la fiducia nei confronti di esperti e istituzioni e restituire nuovo valore al giornalismo. A essere penalizzato da questo potenziale scenario potrebbe infatti essere soprattutto il citizen journalism condotto via social; mentre è a quello tradizionale che le persone potrebbero tornare a rivolgersi in cerca di qualche certezza. Starà allora al giornalismo mostrarsi all’altezza della sfida posta dai deepfake, evitando che per allora la fiducia dei cittadini sia completamente azzerata.

Andrea Daniele Signorelli
Milanese, classe 1982, giornalista. Scrive di nuove tecnologie, politica e società. Nel 2021 ha pubblicato *Technosapiens, come l’essere umano si trasforma in macchina* per D Editore.