
di Roberta Mollica,
partner, LawaL Legal & Tax Advisory
L’11 novembre 2025, il Tribunale di Monaco di Baviera ha emesso una sentenza destinata a incidere profondamente sull’uso di opere protette nei processi di addestramento dell’intelligenza artificiale. Il caso ha visto contrapposte la principale società tedesca di gestione collettiva dei diritti musicali, ossia GEMA, e OpenAI.
Secondo GEMA, alcuni testi del proprio repertorio sarebbero stati impiegati senza autorizzazione nel training dei sistemi di IA sviluppati da OpenAI, non in maniera occasionale o marginale ma tramite memorizzazione stabile. La società di gestione collettiva dei diritti ha sostenuto che tale incorporazione costituisce una vera e propria riproduzione, con conseguente necessità di licenze e compensi.
OpenAI ha, invece, invocato le eccezioni sul text and data mining ritenendo l’uso dei dati funzionale allo sviluppo tecnologico.
Le analisi tecniche hanno confermato che i modelli erano in grado di generare, su richiesta, porzioni estese e riconoscibili dei testi musicali originali. Questo fenomeno, noto come “memorizzazione”, va oltre la semplice estrazione di informazioni generali dai dati di addestramento in quanto costituisce un’incorporazione sostanziale e permanente dei testi nei parametri del modello. In altre parole, durante l’addestramento, i modelli non si limitano ad apprendere schemi linguistici, ma conservano porzioni complete delle opere originarie in modo tale che siano poi riconoscibili e riproducibili negli output generati dagli utenti.
Il Tribunale ha sottolineato che, viste la complessità e la lunghezza dei testi, tale fissazione non può essere considerata casuale: il modello diventa un supporto capace di contenere e riprodurre opere protette, e la mera presenza dei dati nei parametri costituisce una riproduzione tutelata dal diritto d’autore, non coperta dalle eccezioni previste per operazioni preparatorie di text and data mining.
Il Tribunale ha dunque chiarito che la responsabilità grava sulle società che addestrano e gestiscono i modelli e non sugli utenti che ne generano gli output. Sono infatti i gestori a determinare i dati di addestramento e l’architettura dei sistemi che rendono possibile la riproduzione delle opere.
Sulla base di questi elementi, il Tribunale ha accolto le richieste di inibitoria, divulgazione e risarcimento avanzate da GEMA. La decisione potrebbe essere impugnata ma rappresenta comunque un passaggio chiave: per la prima volta in Europa, un Tribunale riconosce che l’addestramento e l’utilizzo di modelli linguistici possono costituire vere e proprie riproduzioni di opere protette dal diritto d’autore.
La sentenza, oltre a ridefinire il confine tra innovazione tecnologica e tutela dei diritti, potrebbe spingere le società di intelligenza artificiale a stipulare accordi di licenza con gli autori ed editori, anche per il tramite di società di gestione collettiva dei diritti, garantendo compensi per l’uso dei contenuti protetti. Un possibile nuovo equilibrio tra tutela della creatività e innovazione tecnologica, in cui la trasparenza dei dati di addestramento diventa un elemento essenziale per lo sviluppo sostenibile dell’IA.














