Zuckerberg ha personalmente autorizzato il furto, dicono cinque editori che citano in giudizio Meta
Il numero su cui vale la pena soffermarsi è 267 terabyte. Questa è la quantità di materiale piratato — libri, riviste accademiche, manoscritti — che cinque grandi editori sostengono che Meta abbia scaricato e utilizzato per addestrare i suoi sistemi di intelligenza artificiale, con la benedizione esplicita di Mark Zuckerberg in persona. Per confronto: 267 terabyte supera di gran lunga l'intera collezione a stampa della Library of Congress americana.
Hachette, Macmillan, McGraw Hill, Elsevier e Cengage hanno presentato la loro denuncia il 5 maggio, diventando i primi editori a coordinarsi in un'azione legale contro un'azienda di IA per la costruzione di grandi modelli linguistici. Lo scrittore Scott Turow compare come co-demandante. L'allegazione centrale è precisa e piuttosto grave: Meta ha brevemente considerato di pagare per i contenuti desiderati, ha calcolato che le licenze erano costose, ha scalato la questione direttamente a Zuckerberg nell'aprile 2023 e ha ricevuto istruzioni verbali di smettere di negoziare licenze. Poi, secondo la denuncia, è iniziato il download massiccio di materiale piratato: 267 terabyte equivalenti a centinaia di milioni di pubblicazioni.
La risposta di Meta: addestrare l'IA su materiale protetto da copyright rientra nel "fair use". Questa è la posizione standard dell'industria tecnologica — l'equivalente intellettuale di un adolescente che afferma che copiare i compiti di qualcun altro è una forma di apprendimento collaborativo. I tribunali non hanno definitivamente risolto la questione; i casi continuano ad accumularsi.
Ciò che distingue questa denuncia è la direttezza del suo argomento sulla responsabilità personale. La maggior parte delle cause contro le aziende tecnologiche punta alla società e lascia che il dirigente si nasconda dietro di essa. Questa nomina Zuckerberg esplicitamente e sostiene che non ha semplicemente mancato di prevenire la violazione, ma l'ha attivamente incoraggiata — che la domanda gli è stata posta, lui ha risposto, e la risposta era: procedete. Se questa allegazione sopravvive fino alla fase di discovery, prometterebbe una deposizione straordinariamente scomoda.
L'ombra che incombe su tutto questo è il risarcimento per diritti d'autore da 1,5 miliardi di dollari che Anthropic ha raggiunto lo scorso settembre — il più grande nella storia legale americana — con un gruppo di autori demandanti. Gli editori dietro questa nuova azione conoscono il precedente e l'aritmetica. Anthropic ha pagato circa 2.900 dollari per opera. Meta ne avrebbe usate molte di più.
C'è un dettaglio nella denuncia che continua a tornarmi in mente. Meta ha considerato il licenziamento. Ha soppesato l'alternativa. Ha scelto diversamente. Non è la storia di un'azienda che non sapeva di fare qualcosa di giuridicamente discutibile — è la storia di un'azienda che lo capiva perfettamente e ha scelto di procedere comunque, presumibilmente calcolando che il costo del contenzioso eventuale sarebbe stato inferiore a quello dell'accesso legittimo.
Questo processo non risolverà immediatamente il problema che le opere degli autori scompaiono nei set di dati di addestramento e ne emergono, trasformate, dai sistemi di IA. Ma ha fatto qualcosa di utile: ha sollevato l'argomento che la persona in cima alla catena decisionale non è isolata da ciò che accade in fondo. Quello che i tribunali decideranno ci dirà molto su che tipo di internet ci aspetta nel prossimo decennio.