Home » New York Times contro Open AI, la madre di tutte le cause

Condividi su:

Libri collegati

New York Times contro Open AI, la madre di tutte le cause

Il New York Times ha citato in giudizio OpenAI nel dicembre 2023. La vicenda giudiziaria è piena di mosse e contromosse. L’ultima risale alle ultime settimane del 2025. I legali del quotidiano hanno chiesto al tribunale di costringere Open AI a consegnare 20 milioni di conversazioni degli utenti. Sostengono che potrebbero trovare esempi dell’uso di ChatGPT per cercare di aggirare il loro paywall.

La richiesta originale del Times in questa causa era molto più ampia. Inizialmente avevano chiesto 1,4 miliardi di conversazioni private su ChatGPT. Dopo il no a questa richiesta, La giudice Ona Wang ha ordinato a OpenAI di fornire 20 milioni di conversazioni, dopo aver eliminato ogni dato che potrebbe consentire l’identificazione degli utenti. Open AI ha chiesto di riconsiderare la decisione.

Dane Stuckey, Chief Information Security Officer di Open AI ha dichiarato: “Crediamo fermamente che questo sia eccessivo. Mette a rischio la privacy degli utenti senza effettivamente aiutare a risolvere la causa legale. Ecco perché ci stiamo opponendo”.

Ma questa mossa dei legali di NYT non è la sola richiesta eclatante che appare in questo processo. Anche da parte di Open AI era stata avanzata l’istanza di presentare tutti i taccuini dei giornalisti del New York Times per documentare l’esclusività delle notizie. Ne ho scritto nel libro “Il potere delle macchine sapienti – Intelligenza artificiale, informazione, democrazia” (Primamedia).

***

““Fuori i taccuini”! È un attacco in grande stile quello che i legali di OpenAI hanno sferrato contro il New York Times. Il più grande quotidiano al mondo, nel dicembre 2023, insoddisfatto della contropartita economica proposta, ha denunciato l’azienda madre di ChatGPT per aver addestrato la propria “creatura” basata sull’Intelligenza artificiale Generativa con milioni di contenuti degli archivi digitali del giornale, senza rispetto del copyright e dei diritti d’autore. Dopo una fase di stallo del procedimento, già nell’inverno del 2024 OpenAI ha impostato la propria linea difensiva, in primo luogo reclamando l’attestato di originalità dei contenuti del New York Times. Da qui la richiesta di presentare alla Corte i taccuini dei cronisti con gli appunti originali poi tradotti in articoli. Chi ci dice, pare essere il ragionamento dei legali, che quell’articolo sia un frutto esclusivo del lavoro di un cronista? E se anche lui, invece, avesse pescato a piene mani in fonti già note?

I legali del New York Times, dopo essersi fatti una sonora risata rispetto ad una richiesta quantomeno singolare perché andrebbe a ledere anche le tutele etiche della professione di giornalista, hanno cominciato a ragionare sulle motivazioni di quella pretesa, concludendo che potrebbe semplicemente trattarsi di un escamotage tattico per far lievitare le spese legali e prendere tempo.

Nella lettera inviata al giudice, OpenAI tenta di delimitare gli ambiti di ogni articolo protetti dal copyright, limitandoli “solo a quei componenti di un’opera che sono originali dell’autore”, sottolineando che il quotidiano “non può avanzare una richiesta di risarcimento per violazione” anche su quelle parti dell’articolo caratterizzate da citazioni di terzi o da comunicati stampa. Da qui la richiesta dei taccuini con gli appunti originali.

L’opposizione del New York Times si basa su un concetto di fondo: “I processi di raccolta delle notizie sono irrilevanti ai fini delle tutela che deriva dal copyright”.

Anche se un articolo fosse frutto al 90% di contenuti di terzi, secondo i legali del NYT sarebbe comunque protetto dal diritto d’autore. Causa dunque più che motivata, secondo i legali del quotidiano, vista la mole enorme di materiale depositato che si configura come un vero e proprio copia e incolla di articoli del giornale.

Ma i legali di OpenAI seguono anche un’altra pista: con un documento di 35 pagine presentato da mesi alla Corte Distrettuale, sostengono che quei testi di Chat GPT “copiati e incollati” appaiono come clonati dal New York Times perché il risultato di quesiti creati ad arte per ingannare il prodotto di OpenAI. In modo molto aggressivo, alla pagina 11 del documento sottoposto alla Corte, i legali del colosso di AI affermano addirittura: “La verità, che emergerà nel corso di questa causa, è che il Times ha pagato qualcuno per hackerare i prodotti di OpenAI. Ci sono volute decine di migliaia di tentativi per generare i risultati altamente anomali che costituiscono l’Allegato J della denuncia. Sono stati in grado di farlo solo sfruttando un bug (che OpenAI si è impegnata a correggere) utilizzando ingannevoli che violano palesemente le condizioni d’uso di OpenAI. E anche in questo caso, hanno dovuto dare in pasto allo strumento porzioni degli stessi articoli di cui volevano ricavare i passaggi testuali, praticamente tutti già presenti su più siti web pubblici. Le persone normali non usano i prodotti di OpenAI in questo modo”.

I legali del Times hanno reagito con veemenza respingendo l’accusa di hacking: “L’affermazione di OpenAI, che attira l’attenzione, secondo la quale il Times avrebbe “hackerato” i suoi prodotti – si legge nel documento prodotto davanti alla Corte – è tanto irrilevante quanto falsa. Come chiarisce l’Allegato J alla denuncia, il Times ha esempi di memorizzazione chiedendo al GPT-4 le prime parole o frasi degli articoli del Times. Questo lavoro è stato necessario solo perché OpenAI non divulga i contenuti che utilizza per addestrare i suoi modelli e alimentare i suoi prodotti rivolti all’utente”. Il braccio di ferro tra il New York Times e OpenAI è destinato a produrre effetti a livello planetario, anche se la tematica non è così univoca. Tutto era cominciato poco prima del Natale 2023. Se i governi concludono l’anno mettendo regole di fronte all’avanzata dell’Intelligenza artificiale, sui software Gen AI incombe una colossale spada di Damocle che proviene dal cuore del mondo del giornalismo. Un settore dove gli umani esercitano un mestiere in base al proprio talento, alla propria professionalità, mettendoci una faccia e una firma. A tutela di questi elementi peculiari ed esclusivi, uno dei più prestigiosi giornali al mondo, il New York Times, intenta la causa contro OpenAI, la società che ha creato Chat GPT, la più famosa delle “macchine” cosiddette generative, perché in grado di generare qualsiasi testo.

Ma, ed è questo il nodo del contendere, dopo essere state “allenate” con milioni di contenuti già esistenti. La denuncia, che è estesa anche a Microsoft per Copilot, si basa sull’accusa di aver violato il copyright del giornale, rastrellando contenuti dal sito del giornale senza permesso. Secondo i legali del prestigioso quotidiano fondato nel 1851, decenni e decenni di articoli redatti dai giornalisti del quotidiano newyorchese sono stati utilizzati per addestrare ChatGPT. I legali chiedono un risarcimento non quantificato, ma comunque per “miliardi di dollari”. Inoltre, chiedono la cancellazione dei dati utilizzati per addestrare le macchine, ma soprattutto reclamano la fine dei modelli di Chatbot generativi. Il braccio di ferro legale è di portata epocale.

La denuncia, depositata presso il Tribunale Distrettuale Federale di Manhattan il 27 dicembre 2023, si articola in 69 pagine, che si aprono con l’elencazione dei nove punti su cui la causa è fondata. Si legge nei primi due:

  1. Il giornalismo indipendente è vitale per la nostra democrazia. È anche sempre più raro e prezioso. Da oltre 170 anni, il Times offre al mondo un giornalismo esperto e approfondito, giornalismo indipendente. I giornalisti del Times vanno dove c’è la storia, spesso con grandi rischi e costi, per informare il pubblico su questioni importanti e urgenti. Sono testimoni di conflitti e disastri, forniscono responsabilità per l’uso del potere e illuminano verità che altrimenti resterebbero invisibili. Il loro lavoro essenziale è reso possibile dall’impegno di una grande e costosa organizzazione che fornisce supporto legale, di sicurezza e operativo, nonché di redattori che garantiscono che il loro giornalismo soddisfi i più alti standard di accuratezza e correttezza. Questo lavoro è sempre stato importante. Ma in un ecosistema informativo danneggiato e inondato di contenuti inaffidabili, il giornalismo del Times fornisce un servizio che è cresciuto ancora di più ed è diventato ancora più prezioso per il pubblico fornendo informazioni.
  2. L’uso illegale del lavoro del Times da parte di OpenAI e Microsoft per creare prodotti di intelligenza artificiale che gli fanno concorrenza, minaccia il Times e la capacità del Times di fornire tale servizio. Strumenti di intelligenza artificiale generativa (“Gen AI”) si basano su modelli linguistici di grandi dimensioni (“LLM”) che sono stati costruiti copiando e utilizzando milioni di articoli di notizie, approfondimenti, opinioni, recensioni del Times, protetti da copyright”. Attraverso la Bing Chat di Microsoft (recentemente ribattezzato “Copilot”) e ChatGPT di OpenAI, gli imputati cercano di sfruttare i massicci investimenti del Times nel suo giornalismo, usandolo per costruire prodotti sostitutivi senza autorizzazione o pagamento”.

ISCRIVITI AL CANALE WHATSAPP DI TOSCANALIBRI

Per continuare a rimanere aggiornato sui principali avvenimenti, presentazioni, anteprime librarie iscriviti al nostro canale e invita anche i tuoi amici a farlo!