NEWS

Memorisierung von KI-Trainingsdaten verletzt Urheberrecht

LG München I Urteil vom 11.11.2025, 42 O 14139/24

 Inhalt

Hintergrund des Verfahrens

Die GEMA klagte als Wahrnehmungsgesellschaft für die Rechte u. a. an den Liedern „Atemlos“, „Männer“ und „Über den Wolken“. Diese Texte waren ohne Lizenz in die Trainingsdaten der Modelle GPT-4 und GPT-4o eingeflossen. Nutzer konnten mit simplen Anfragen wie „Wie lautet der Text von [Liedtitel]?“ weitgehend vollständige Liedtexte erhalten. OpenAI räumte ein, dass die Werke im Trainingsmaterial enthalten waren, bestritt aber eine „Speicherung“ der Texte und sprach von rein statistischen Mustern statt konkreter Vervielfältigungen.

Entscheidung des LG München I

Das Gericht gab der Klage im Wesentlichen statt. OpenAI wurde verurteilt, die weitere Nutzung der betreffenden Werke im Rahmen seiner Modelle zu unterlassen, Auskunft über Nutzung und Umfang zu erteilen und Schadensersatz dem Grunde nach zu leisten. Das Gericht geht mindestens von fahrlässigem Verhalten aus.

Begründung des Gerichts: Memorisierung, TDM-Schranke & Outputs

Nach Auffassung des LG München I werden häufig vorkommende Textfolgen im Training nicht nur analysiert, sondern so stark gewichtet, dass ihre exakte Tokenfolge als „memorisiert“ im Modell verbleibt. Diese eingebrannten Inhalte sind technisch reproduzierbar und stellen eine urheberrechtlich relevante Vervielfältigung dar – vergleichbar mit fragmentierten Datei-Formaten, die mit geeigneten Mitteln wieder sichtbar gemacht werden können.

Die Text- und Data-Mining-Schranke greift nur teilweise:

  • Die Konvertierung der Werke in ein maschinenlesbares Format und deren Auswertung zu Analysezwecken hält das Gericht grundsätzlich für privilegiert.
  • Nicht mehr gedeckt ist die dauerhafte Speicherung memorisierter Inhalte im Modell, die über den Analysezweck hinausgeht und wirtschaftliche Verwertungsinteressen der Rechteinhaber beeinträchtigt.


Zusätzlich sieht das Gericht Urheberrechtsverletzungen in den Outputs:
Die (nahezu) vollständigen Songtexte werden im Arbeitsspeicher der Nutzer und in Chatverläufen gespeichert und damit vervielfältigt. Verantwortlich hierfür ist OpenAI als Betreiber und Hersteller des Modells, nicht der jeweilige Nutzer. Zudem liege eine öffentliche Zugänglichmachung vor, da einem unbestimmten Nutzerkreis Zugriff auf die memorisierten Texte eröffnet wird – ein neues Publikum, selbst wenn die Werke zuvor rechtmäßig online verfügbar waren.

Schadensersatz, Auskunft & Verhältnismäßigkeit

OpenAI muss dem Grunde nach Schadensersatz leisten; die konkrete Höhe ist gesondert zu bestimmen. Daneben sprach das Gericht Auskunftsansprüche und flankierende Unterlassungsansprüche zu. Das Argument der Unverhältnismäßigkeit verwarf das LG München I: OpenAI könne entweder mit lizenzierten Daten neu trainieren oder Modelle entwickeln, die ohne die betreffenden Inhalte auskommen. Eine Aufbrauchfrist lehnte das Gericht ab; seit der Abmahnung im November 2024 habe ausreichend Zeit bestanden, zu reagieren.

 

Auf den Punkt

Die Entscheidung macht deutlich:
Wer urheberrechtlich geschützte Inhalte für das Training generativer KI nutzt, muss Memorisierungseffekte einkalkulieren und rechtlich absichern – reine Berufung auf Text-und-Data-Mining-Schranken genügt nicht, wenn das Modell geschützte Werke später nahezu vollständig wiedergeben kann.

Aktenzeichen: 42 O 14139/24

Quelle: Justiz Bayern

WEITERE NEWS
Markenrecht

BGH „Mehmet Efendi“: Keine Erschöpfung durch Inverkehrbringen in der Türkei – Assoziationsabkommen erweitert den EWR nicht

Der BGH bestätigt: Wer Unions-/EU-Markenware in der Türkei in Verkehr bringt, löst damit keine markenrechtliche Erschöpfung im EWR aus. Das Assoziationsabkommen EWG–Türkei führt zu keiner Erweiterung des räumlichen Erschöpfungsbereichs; Parallelimporte in den EWR können ohne Zustimmung untersagt werden.
Markenrecht

BGH „LA BIOSTHETIQUE“: Deutsche Gerichte zuständig bei zielgerichteter Online-Werbung – Auskunft zu Lieferanten kann unverhältnismäßig sein

Der BGH richtet die internationale Zuständigkeit bei markenverletzender Online-Werbung am Zielmarkt aus: Maßgeblich ist, wo die adressierten Verbraucher/Händler sitzen – nicht Serverstandort oder Sitz des Werbenden. Zudem kann Auskunft über Lieferanten/Vorbesitzer ausnahmsweise unverhältnismäßig sein, wenn die Markenverletzung nur in der Präsentation erschöpfter Ware liegt.
Markenrecht

EuGH: „Besitz“ markenverletzender Ware umfasst auch Lagerung im Ausland – und auch mittelbaren Besitz

Der EuGH stellt klar: Markeninhaber können „Besitz“ (Art. 10 Abs. 3 lit. b RL 2015/2436) auch dann untersagen, wenn Ware in einem anderen Mitgliedstaat gelagert wird – sofern sie für Angebote/Vertrieb im Schutzstaat bestimmt ist. „Besitz“ erfasst zudem mittelbare Kontrolle (Aufsichts-/Leitungsbefugnis).
Markenrecht

EuG: „Eco“ kann trotz beschreibender Bedeutung beim Zeichenvergleich mitprägen

Das EuG stellt klar: Auch beschreibende Bestandteile können im Zeichenvergleich zu berücksichtigen sein – etwa wenn sie am Wortanfang stehen und durch Länge/Position die Aufmerksamkeit prägen.
KI / Persönlichkeitsrecht

LG Hamburg: KI-generierter X-Beitrag bleibt dem Account-Betreiber zurechenbar

Das LG Hamburg hält eine fortdauernde, ehrbeeinträchtigende Falschbehauptung auf X auch dann für äußerungsrechtlich unzulässig, wenn der Beitrag KI-generiert ist. Der Account-Betreiber muss sich den veröffentlichten Inhalt zurechnen lassen.
KI

OLG Köln: Meta darf öffentliche Facebook- und Instagram-Daten für KI-Training vorerst nutzen

Das OLG Köln hat einen Eilantrag gegen die angekündigte Nutzung öffentlich geteilter Facebook- und Instagram-Daten für das KI-Training von Meta zurückgewiesen. Nach summarischer Prüfung hielt das Gericht die Verarbeitung insbesondere auf Basis von Art. 6 Abs. 1 lit. f DSGVO für voraussichtlich zulässig.

Karin Simon
Rechtsanwältin
Fachanwältin für gewerblichen Rechtsschutz

Susanne Graeser
Rechtsanwältin
Fachanwältin für gewerblichen Rechtsschutz

Uhlandstr. 2
D-80336 München