In una recente sentenza, un giudice californiano ha respinto quasi tutte le richieste di risarcimento avanzate da un gruppo di sviluppatori nei confronti di GitHub, Microsoft e OpenAI in una causa sul copyright presentata nel 2022. L’ordinanza, resa pubblica la scorsa settimana, ha lasciato in piedi solo due delle 22 richieste di risarcimento originali, riguardanti la violazione della licenza open-source e la violazione del contratto.
OpenAI, GitHub e Microsoft accusate di violazione del copyright da
La causa originale accusava le aziende di aver violato le leggi sul copyright permettendo all’assistente di codifica GitHub Copilot, dotato di AI, di allenarsi sul lavoro degli sviluppatori. Microsoft, proprietaria di GitHub, utilizza la tecnologia di OpenAI per alimentare lo strumento. Nonostante le big tech avessero chiesto al tribunale di annullare la causa a gennaio, il giudice Jon Tigar aveva respinto la richiesta.
Inizialmente gli sviluppatori avevano accusato GitHub Copilot di violare il Digital Millennium Copyright Act (DMCA), in quanto il codice suggerito da Copilot sarebbe stato troppo simile a codice open source preesistente, senza però citarne adeguatamente la fonte. Tuttavia, con quest’ultima sentenza, il giudice ha respinto in gran parte tale accusa. Ha stabilito infatti che il codice generato da Copilot non è abbastanza vicino o simile al codice originale da cui è tratto, per configurare una violazione del copyright.
Inoltre, la sentenza mette in discussione anche le argomentazioni degli sviluppatori relative al sistema di rilevamento duplicazioni implementato da GitHub. Secondo il giudice, neanche attivando questo filtro, che serve per individuare e sopprimere suggerimenti di Copilot corrispondenti a codice pubblico su GitHub, si può sostenere che Copilot violi il DMCA.
Un duro colpo per gli sviluppatori
La causa modificata sosteneva che GitHub offrisse agli utenti la possibilità di “ricevere codice identico” quando il filtro è disattivato, citando uno studio che mostra come i modelli di AI possano “memorizzare” e rigurgitare parti dei loro dati di addestramento, potenzialmente includendo codice protetto da copyright.
Tuttavia, il giudice Tigar ha stabilito che il codice che GitHub avrebbe copiato dagli sviluppatori non era abbastanza simile al loro lavoro originale, citando anche una parte dello studio che afferma che GitHub Copilot “raramente emette codice memorizzato in situazioni benigne“. Questa accusa è stata respinta con pregiudizio, il che significa che gli sviluppatori non possono ripresentare la richiesta.
Il tribunale ha inoltre respinto le richieste di danni punitivi e di risarcimento monetario sotto forma di arricchimento senza causa. Tuttavia, questo non significa che la causa sia finita. Il contenzioso continuerà probabilmente con le richieste di risarcimento degli sviluppatori per violazione del contratto e della licenza open-source.