Prima di trasformarsi in sequenze digitali, un volume cartaceo rimane materia tangibile. Possiede una rilegatura, fogli stampati, adesivo, consistenza fisica e tracce del tempo. Nella vicenda che coinvolge Anthropic, l’azienda creatrice di Claude, questa dimensione concreta è stata inserita in un processo di tipo industriale: volumi acquistati dal mercato dell’usato, smembrati, digitalizzati attraverso scanner e convertiti in formato testuale. Ciò che rimaneva delle opere veniva successivamente destinato al recupero della carta.
L’iniziativa portava il nome in codice di Project Panama. Dalla documentazione emersa nel contenzioso legale sui diritti d’autore emerge la finalità dell’operazione: ottenere un vasto corpus di pubblicazioni cartacee da utilizzare per l’addestramento dei sistemi di intelligenza artificiale. Le opere stampate rappresentavano una risorsa linguistica superiore rispetto al materiale raccolto dalla rete. Meno contenuti estratti casualmente dal web, più testi curati, revisionati e pubblicati professionalmente.
Dal formato cartaceo all’informazione digitale
L’aspetto più rilevante riguarda la metodologia adottata. I volumi provenivano da commercianti di seconda mano, venivano predisposti per una digitalizzazione invasiva, separati lungo la rilegatura e inseriti in apparecchiature di scansione industriale ad elevata velocità. Una volta completata la conversione digitale, non tornavano più nella loro forma originaria. Da un lato rimanevano informazioni digitalizzate, dall’altro materiale cartaceo destinato al riciclo.
I numeri esatti restano parzialmente indefiniti, ma le stime parlano di diverse centinaia di migliaia, potenzialmente milioni di esemplari, con un programma progettato per digitalizzare tra mezzo milione e due milioni di pubblicazioni nell’arco di circa sei mesi. Non si trattava di una semplice iniziativa archivistica. Era una vera catena di produzione, con fornitori, depositi, strumenti per il taglio, dispositivi di scansione, spese e organizzazione logistica.
È proprio questo aspetto che rende il caso significativo anche al di là della questione giuridica. L’intelligenza artificiale viene frequentemente presentata come qualcosa di etereo, distante, quasi privo di sostanza fisica: server remoti, calcoli algoritmici, interfaccia elegante. In questa situazione, invece, il sistema digitale produce il suono della carta. Ha imballaggi, strumenti da taglio industriali, fogli separati, volumi acquistati e smantellati.
La questione dei diritti d’autore
Nel procedimento giudiziario americano, il magistrato William Alsup ha separato due aspetti differenti. L’utilizzo di pubblicazioni acquistate regolarmente e poi scansionate per addestrare Claude è stato ritenuto conforme al fair use, il principio statunitense che in determinate circostanze permette l’impiego di opere tutelate senza preventiva autorizzazione. Differente la situazione relativa ai volumi piratati: dalla documentazione processuale è risultato che Anthropic aveva prelevato e archiviato milioni di testi da repository illegali, e questa parte è stata valutata come infrazione separata.
Il ricorso alle copie fisiche usate sembra quindi anche una strategia di cautela giuridica. Acquistare un esemplare cartaceo forniva all’impresa una base più sicura rispetto al prelievo da archivi pirata. Negli Stati Uniti chi acquisisce un prodotto fisico può cederlo, concederlo in prestito o eliminarlo. La criticità nasce quando tale prodotto viene convertito in replica digitale e integrato in piattaforme capaci di produrre nuovi contenuti testuali.
Anthropic ha successivamente raggiunto un’intesa da 1,5 miliardi di dollari per concludere la class action promossa dagli scrittori, senza riconoscere colpevolezza. L’accordo riguarda le opere piratate e stabilisce circa 3.000 dollari per ciascun libro interessato. A maggio 2026, tuttavia, la ratifica definitiva risultava ancora in fase di valutazione: la magistrata Araceli Martinez-Olguin ha richiesto ulteriori chiarimenti su compensi legali e pagamenti ai ricorrenti principali.
L’intelligenza artificiale richiede fondamenta concrete
La vicenda Anthropic riguarda Claude, ma interpella l’intero comparto. I grandi sistemi generativi necessitano di testi, contenuti visivi, codice sorgente, articoli, manuali tecnici, narrativa, saggistica. Necessitano di produzione intellettuale già realizzata. Talvolta tale produzione viene autorizzata e remunerata. Altre volte viene raccolta massivamente, inserita in dataset poco trasparenti e discussa solamente quando emerge un’azione legale.
Project Panama rende evidente questa dipendenza. Per migliorare le capacità di scrittura di una macchina, sono stati necessari volumi redatti da esseri umani. Per rendere più fluido un assistente conversazionale, sono state impiegate opere create da autori, redattori, traduttori, revisori, editori, biblioteche, lettori. La promessa tecnologica si fonda ancora su una base molto tangibile.
Il tema coinvolge anche l’Europa, dove il rapporto tra tutela del diritto d’autore, estrazione di dati e intelligenza artificiale rimane in discussione. Le società parlano di innovazione, trasformazione, avanzamento. Chi produce contenuti richiede autorizzazioni, compensi, trasparenza. Nel mezzo ci sono tribunali, normative ancora recenti e un interrogativo molto concreto: quale valore ha il lavoro creativo umano quando diventa combustibile per l’intelligenza artificiale?
