Hintergrund des Verfahrens
Die GEMA klagte als Wahrnehmungsgesellschaft für die Rechte u. a. an den Liedern „Atemlos“, „Männer“ und „Über den Wolken“. Diese Texte waren ohne Lizenz in die Trainingsdaten der Modelle GPT-4 und GPT-4o eingeflossen. Nutzer konnten mit simplen Anfragen wie „Wie lautet der Text von [Liedtitel]?“ weitgehend vollständige Liedtexte erhalten. OpenAI räumte ein, dass die Werke im Trainingsmaterial enthalten waren, bestritt aber eine „Speicherung“ der Texte und sprach von rein statistischen Mustern statt konkreter Vervielfältigungen.
Entscheidung des LG München I
Das Gericht gab der Klage im Wesentlichen statt. OpenAI wurde verurteilt, die weitere Nutzung der betreffenden Werke im Rahmen seiner Modelle zu unterlassen, Auskunft über Nutzung und Umfang zu erteilen und Schadensersatz dem Grunde nach zu leisten. Das Gericht geht mindestens von fahrlässigem Verhalten aus.
Begründung des Gerichts: Memorisierung, TDM-Schranke & Outputs
Nach Auffassung des LG München I werden häufig vorkommende Textfolgen im Training nicht nur analysiert, sondern so stark gewichtet, dass ihre exakte Tokenfolge als „memorisiert“ im Modell verbleibt. Diese eingebrannten Inhalte sind technisch reproduzierbar und stellen eine urheberrechtlich relevante Vervielfältigung dar – vergleichbar mit fragmentierten Datei-Formaten, die mit geeigneten Mitteln wieder sichtbar gemacht werden können.
Die Text- und Data-Mining-Schranke greift nur teilweise:
- Die Konvertierung der Werke in ein maschinenlesbares Format und deren Auswertung zu Analysezwecken hält das Gericht grundsätzlich für privilegiert.
- Nicht mehr gedeckt ist die dauerhafte Speicherung memorisierter Inhalte im Modell, die über den Analysezweck hinausgeht und wirtschaftliche Verwertungsinteressen der Rechteinhaber beeinträchtigt.
Zusätzlich sieht das Gericht Urheberrechtsverletzungen in den Outputs:
Die (nahezu) vollständigen Songtexte werden im Arbeitsspeicher der Nutzer und in Chatverläufen gespeichert und damit vervielfältigt. Verantwortlich hierfür ist OpenAI als Betreiber und Hersteller des Modells, nicht der jeweilige Nutzer. Zudem liege eine öffentliche Zugänglichmachung vor, da einem unbestimmten Nutzerkreis Zugriff auf die memorisierten Texte eröffnet wird – ein neues Publikum, selbst wenn die Werke zuvor rechtmäßig online verfügbar waren.
Schadensersatz, Auskunft & Verhältnismäßigkeit
OpenAI muss dem Grunde nach Schadensersatz leisten; die konkrete Höhe ist gesondert zu bestimmen. Daneben sprach das Gericht Auskunftsansprüche und flankierende Unterlassungsansprüche zu. Das Argument der Unverhältnismäßigkeit verwarf das LG München I: OpenAI könne entweder mit lizenzierten Daten neu trainieren oder Modelle entwickeln, die ohne die betreffenden Inhalte auskommen. Eine Aufbrauchfrist lehnte das Gericht ab; seit der Abmahnung im November 2024 habe ausreichend Zeit bestanden, zu reagieren.
Auf den Punkt
Die Entscheidung macht deutlich:
Wer urheberrechtlich geschützte Inhalte für das Training generativer KI nutzt, muss Memorisierungseffekte einkalkulieren und rechtlich absichern – reine Berufung auf Text-und-Data-Mining-Schranken genügt nicht, wenn das Modell geschützte Werke später nahezu vollständig wiedergeben kann.
Aktenzeichen: 42 O 14139/24
Quelle: Justiz Bayern