Erstes KI-Musterverfahren zu unlizensierten Trainingsdaten

Sind Songtexte lizenzfreies Trainingsmaterial für generative KI-Anbieter?

Eine Urheberrechtlerin erklärt die Hintergründe zum Musterverfahren gegen OpenAI.

KI-Anbieter OpenAI hat seinen Chatbot ChatGPT mit Songtexten deutscher Stars trainiert – ohne Lizenz und Entschädigung. Die Verwertungsgesellschaft Gema klagt dagegen. Urheberrechtlerin Silke von Lewinski erklärt, warum dieses erste Musterverfahren in Deutschland gegen den KI-Anbieter nicht nur für Songschreiber wichtig ist.

Sieben Anwälte und zwei Legal Counsels vertraten OpenAI in der Verhandlung vor dem Münchner Landgericht I am 29. September. Geklagt hatte die Gema, Verwertungsgesellschaft mit rund 100000 vertretenen Musikern und Künstlerinnen. Mehr als zweieinhalb Stunden verhandelten die Richterinnen der 42. Zivilkammer im Justizpalast in einem deutschlandweit einmaligen Musterverfahren über die Rechte von Künstlerinnen und Künstlern im Zusammenhang mit LLM-Modellen. Konkret ging es um neun Liedtexte, die der Chatbot ChatGPT auf einfache Prompts (Sucheingaben) in seinem Modell 4 und 4.o auswarf. OpenAI hatte diese Texte als Trainingsmaterial benutzt, allerdings ohne Zustimmung oder Vergütung der Rechteinhaber. Mithilfe einfacher Prompts (Anfragen) zeigte der Bot die Liedtexte komplett oder leicht verändert an. Auf einen Vergleich wollten sich beide Seite gegen Mittag nicht einlassen. Termin für die Urteilsverkündung ist der 11. November 2025.

Silke von Lewinski beschäftigt sich im Rahmen ihrer Forschung mit den Vergütungs- und Lizenzmodellen im Kreativbereich. In einem FAQ erklärt die Rechtwissenschaftlerin die Bedeutung des Verfahrens und des Urheberrechts für die Vergütung von Kunstschaffenden. 

Worum geht es im Verfahren Gema vs. OpenAI?

Es handelt sich um das erste grundlegende Musterverfahren zu mehreren Fragen des Urheberrechts und der KI-Nutzung von Sprachwerken. Im Kern geht es darum, ob OpenAI Werke, in diesem Fall Lied-Texte, für Generative KI nutzen darf, ohne die Urheber – hier die Liedtexter (vertreten durch die Gema) um Erlaubnis zu fragen (wie es bisher de facto geschieht, obwohl die Gema ein Lizenzmodell anbietet), oder ob eine solche Erlaubnis gegen Bezahlung erforderlich ist. Das Verfahren ist so konzipiert, dass auch die wichtigen Einzelaspekte dieser Grundfrage behandelt und entschieden werden sollten.

Warum braucht es ein Musterverfahren?

Diese Frage ist (wie auch weitere, damit zusammenhängende Fragen) bisher noch nicht grundlegend durch Gerichte geklärt; das jetzige Recht kann unterschiedlich ausgelegt werden. Es geht zB darum, in welchen Stadien der Nutzung für GenKI Vervielfältigungen oder andere urheberrechtliche Nutzungen stattfinden und ob die Urheberrechtschranke des Vervielfältigungsrechts für „Text- und Datenmining“ eingreift, was sehr umstritten ist. Auch wenn sie anwendbar ist, muss zB geklärt werden, wie ein möglicher Rechtevorbehalt (der in maschinenlesbarer Form sein muss) gültig ausgeübt werden kann – und all dies sind nur Beispiele für Fragen, die sich im Verfahren stellen. Die Beteiligten am Markt – insbesondere Urheber, Künstler und andere Rechteinhaber auf der einen Seite, und KI-Modellhersteller auf der anderen – brauchen aber Klarheit, um entsprechend agieren zu können. Und die Kreativen, deren Werke bisher regelmäßig kostenlos für KI benutzt werden, und in manchen Bereichen schon Gefahr laufen, durch KI substituiert zu werden, benötigen einen klaren Schutz gegen solche Nutzungen ohne Vergütung, um von ihrer Kreativität leben zu können.

Welche Auswirkungen hätte ein Sieg der Gema für die Kreativen und Gen AI-Anbieter? 

Ein Sieg beim Landgericht München wäre ein starkes Signal, aber das erstinstanzliche Urteil würde mit hoher Wahrscheinlichkeit von einer Partei angefochten, da man ja eine letztinstanzliche Klärung braucht. Am besten wäre, wenn das LG München I Fragen direkt dem EuGH vorlegt. Wenn aber die letzte Instanz der Gema recht gibt, hätte dies eine ganz grundlegende Bedeutung nicht nur für die von der Gema vertretenen Liedtexter, sondern auch für die gesamte Kreativwirtschaft, die von Gen KI-Anbietern aller Art für ihre Massennutzungen Lizenzgebühren verlangen könnte, während Gen KI-Anbieter Werke aller Art nur noch für die Gen-KI vervielfältigen und nutzen dürften, wenn sie zuvor eine Erlaubnis der Urheber und Künstler eingeholt haben – und dafür die vereinbarte Vergütung bezahlen.

Wofür müssten GenAI Anbieter zahlen?

Dies ist eine der Fragen, die im Verfahren zu klären sind. Bei der Vorbereitung (etwa dem Einlesen von Werken in Datensätze) und insbesondere dem Training für Zwecke der GenKI, aber eventuell auch bei der Nutzung der KI-Modelle, und – falls das KI-Produkt quasi eine Kopie eines Werkes ist, wie im Gema-Fall – in Form der KI-Produkte finden verschiedene Vervielfältigungen statt, für die gegebenenfalls zu zahlen wäre. Dann stellt sich auch die weiterreichende Frage, ob zusätzlich für die Nutzungen von solchen KI-Produkten (wie KI-Songs) zu zahlen ist, auch wenn diese Produkte keine 1:1-Kopien bekannter Werke sind, aber doch mit hoher Wahrscheinlichkeit darauf beruhen. Hier geht es etwa um die Aufführung, Sendung, oder auch das Anbieten von KI-Musik bei Streaming-Diensten.

Im Verfahren geht es um Songtexte, was bedeutet das für andere Quellen wie Literatur, Artikel oder Musik, die zum Trainieren von KI-Modellen verwendet wurden?

Ein Urteil in diesem Musterverfahren hätte grundlegende Bedeutung für alle Werke, sei es Literatur, journalistische Texte, Musik, bildende Kunst, Photographie oder jegliche andere Werke, die für GenKI benutzt werden. Auch deshalb ist dieses Verfahren so bedeutsam.

Warum ist das Verfahren auch wichtig für die EU?

as Verfahren ist nicht nur für Deutschland wichtig, sondern auch für die EU und die Staaten des Europäischen Wirtschaftsraums, da die deutsche Regelung auf harmonisiertem EU-Recht basiert, insbesondere der Richtlinie zum Digitalen Binnenmarkt von 2019, die die Text- und Datenmining-Schranke eingeführt hat. Falls die EU-relevanten Fragen des Falls am Ende, wie zu hoffen ist, vom EuGH entschieden werden, hat dies also für die Auslegung der Richtlinie – und damit die Vorgaben für die nationale Umsetzung des EU-Rechts – unmittelbare Bedeutung in der gesamten EU. Falls der EuGH entscheiden würde, dass die Kreativen keine rechtliche Handhabe gegen die unlizenzierte, kostenlose Nutzung durch OpenAI haben, hätte auch ein solches Urteil große Auswirkungen – insbesondere entstünde ein hoher Druck auf den EU-Gesetzgeber, durch neue Vorschriften wieder einen Ausgleich der Interessen zwischen Kreativen und der GenAI-Industrie herzustellen, den Kreativen Gerechtigkeit zuteil werden zu lassen und die Bedrohung der Kreativen durch die schon beginnende Substitution ihrer Werke aufgrund GenKI einzudämmen.

Auch in den USA laufen Verfahren. Was sind die Unterschiede zu US-Recht?

Ja, dort laufen einige Verfahren, zum Teil als Sammelklagen von Autoren, oder auch Klagen von Verlagen. Das US-Recht ist aber ganz anders als das europäische, insbesondere ist dort die sogenannte ‚fair use‘ Schranke maßgeblich, die den Richtern vier sehr generell formulierte Bedingungen an die Hand gibt, und die zu einem umfangreichen Richterrecht geführt hat, während es in Europa sehr präzise formulierte Schranken des Urheberrechts im Gesetz gibt. Aber grundsätzlich findet in der EU nur EU-Recht Anwendung, die US-Entscheidungen gelten nicht für uns. Interessant ist zumindest, dass es kürzlich einen Vergleich zwischen Autoren und Anthropic gegeben hat, das Bücher von illegalen websites heruntergeladen und für das KI-Training benutzt hat. Anthropic muß demnach 1,5 Milliarden Dollar für die Nutzung von 500 000 Büchern zahlen und die illegalen Kopien vernichten. Auch in einem Urteil zugunsten von einem Verlag wurde fair use abgelehnt

Welche Verfahren gibt es noch?

In Deutschland gibt es noch ein Verfahren, das schon in erster Instanz vom LG Hamburg entschieden wurde, aber nur Vorbereitungshandlungen für KI-Training erfasst, und eine speziellere Fallkonstellation betrifft als die weit gefasste Musterklage der Gema. Auch in Frankreich gibt es einen Fall. Ansonsten ist ein – auch spezieller, komplexer – Fall aus Ungarn schon beim EuGH anhängig; es wäre zu hoffen, dass der EuGH mit seiner Entscheidung wartet, bis auch der Gema-Fall dort anhängig wird.

Originalveröffentlichung

Von Lewinski, S. (2022)

L’intelligence artificielle et le droit d’auteur

in: Azzi/Bensamoun/Latreille (eds.), Entre art et technique: les dynamiques du droit. Mélanges en l’honneur de Pierre Sirinelli, Paris 2022, 141-156

Über Redaktion

Impressum Pflichtangaben gemäß § 5 TMG Inhaltlich verantwortlich ist: Ria Hinken Tel. +49 (0) 761 | 2852 7905 Mail: rh(at)konzepte-pr.de Umsatzsteuer-ID DE185565169 Verantwortlich i. S. d. P. Ria Hinken Wintererstr. 7, D-79104 Freiburg Mail: rh(at)konzepte-pr.de
Dieser Beitrag wurde unter Datenschutz, Digitalisierung, KI, Kunst, Pressemitteilungen abgelegt und mit , , , , , , verschlagwortet. Setze ein Lesezeichen auf den Permalink.