‘Intelligenza Artificiale’: un’espressione da qualche tempo sulla bocca di tutti. Se ne parla troppo spesso in senso generale e forse anche superficiale. In verità le IA sono da tempo tra di noi in modi più o meno riconoscibili.
Il cambio di paradigma, che fa volare il termine di bocca in bocca, è avvenuto circa due anni fa quando OpenAi (Microsoft) ha lanciato in Internet la prima versione di ChatGPT (Generative Pretrained Transformer) ora siamo alla quarta. ‘GENERATIVA’ è la parola chiave, ovvero le macchine sono in grado di produrre contenuti, di qualsiasi tipo. Per capire come ciò impatta sul Diritto d’Autore dobbiamo fare un passo indietro, a come vengono preaddestrati i sistemi. Le macchine divorano dati e consumano quantità mostruose di energia. L’organismo si alimenta di dati e energia. La fonte dell’informazione è Internet. Da Wikipedia a Google books uno e due, books tre, le biblioteche ombra, alla base dati di Common Crawl (organizzazione senza fini di lucro che dal 2008 esegue puntualmente la scansione del Web, raccoglie dati e fornisce gratuitamente i propri archivi e set di dati al pubblico). Resta da chiedersi se qualcosa è sfuggito a questa enorme rete a strascico dispiegata da OpenAI. La società stessa ha reso noto gli archivi usati per l’addestramento dei primi modelli (Large language model) che consentono la generazione del linguaggio naturale, per i successivi non lo ha più fatto! Questa massiccia raccolta di dati protetti da copyright e non solo è stata fatta senza consenso e senza riconoscimento di alcun compenso agli autori; senza considerare inoltre la riproduzione automatica dei dati personali di centinaia di milioni di persone.
Le leggi sul diritto d’autore non vengono messe in discussione, ma il nocciolo della questione é: prendo un contenuto protetto, lo uso per addestrare i modelli e poi uso i modelli per produrre altri contenuti!
Già da luglio dello scorso anno, negli Stati Uniti, sono fioccate le Class Action degli autori verso OpenAi, ne cito uno per tutti: Paul Tremblay. Tali azioni legali sono sfociate a fine 2023 nella causa delle cause, quella del New York Times. L’impatto sul giornalismo si fa ancora più pesante per le molte altre implicazioni che vanno oltre il Diritto d’Autore. Le tecnologie sono più veloci delle norme e ora i giudici statunitensi dovranno decidere usando le leggi attuali, mentre certamente ne servirebbero altre data la complessità della materia.
Ad oggi solo l’Unione Europea ha aperto un ombrello a tutela del diritto e a garanzia della sicurezza. Il 13 marzo scorso, il Parlamento europeo ha approvato con larghissima maggioranza il Regolamento europeo sull’intelligenza artificiale, (AI-ACT) proposto dalla Commissione nel 2021, con l’obiettivo di garantire il rispetto dei diritti fondamentali e della dignità delle persone nello sviluppo e nell’uso delle tecnologie AI. Si tratta di un unicum nel panorama mondiale e che potrà costituire un punto di riferimento internazionale. In Europa non si potrà, d’ora in poi, praticare la pesca a strascico dei dati, ma si dovrà osservare il regolamento.
Ricordate la notifica di Meta (Facebook) di circa un mese fa? “Abbiamo in serbo nuove funzioni IA per te. Scopri come utilizziamo le tue informazioni” Meta non ci ha chiesto il permesso di usare i nostri dati, ci ha solo informato come li avrebbe usati. Questo messaggio segnava l’inizio della raccolta dati da parte di Meta per istruire la sua IA generativa, alla quale abbiamo potuto opporci grazie al fatto di risiedere in un paese dell’UE, il resto del mondo non ha potuto farlo. Ora Meta ha messo in standby il suo progetto. Il garante irlandese (Meta Europa ha sede in Irlanda) ha potuto fare la voce grossa proprio grazie all’AI-ACT.
Non dimentichiamo che gli interessi economici intorno a questo mondo sono giganteschi.
Marziana Monfardini