Urheberrecht beim KI-Training (TDM)

KI-Training und Urheberrecht: Rechtslage, Schutzmaßnahmen und Handlungsoptionen

 

Generative KI-Systeme werden mit riesigen Datenmengen trainiert – darunter auch urheberrechtlich geschützte Inhalte. Wir erläutern die aktuelle Rechtslage, zeigen, wie Sie Ihre Inhalte vor ungewolltem KI-Training schützen können, und beraten Sie bei der Durchsetzung Ihrer Rechte.

 


 

Auf einen Blick: Worum es geht

 

Die Entwicklung generativer KI-Modelle wie GPT, LLaMA, Stable Diffusion oder Gemini erfordert das Training mit enormen Datenmengen. In der Praxis werden dazu systematisch Webinhalte gecrawlt und als Trainingsdaten verwendet – häufig ohne Kenntnis oder Einwilligung der Rechteinhaber. Für Verlage, Fotografen, Autoren, Agenturen und Unternehmen mit wertvollem Online-Content stellt sich damit eine doppelte Frage: Ist die Nutzung ihrer Inhalte zum KI-Training überhaupt zulässig? Und welche konkreten Maßnahmen können sie ergreifen, um ihre Werke zu schützen?

 

Die Antworten sind komplex, denn das Recht befindet sich in einer Phase intensiver Entwicklung. Mit den §§ 44b und 60d UrhG existieren gesetzliche Schranken, die Text und Data Mining unter bestimmten Voraussetzungen erlauben – aber zugleich ein Opt-out-Recht der Rechteinhaber vorsehen. Parallel dazu stellt der EU AI Act ab August 2025 neue Pflichten für KI-Anbieter auf. Die Gerichte haben begonnen, erste Leitlinien zu formulieren.

 


 

I. Der rechtliche Rahmen: Text und Data Mining im Urheberrecht

 

1. Die TDM-Schranken der §§ 44b und 60d UrhG

 

Die urheberrechtliche Zulässigkeit der Nutzung geschützter Werke für KI-Training wird in Deutschland maßgeblich durch zwei Schrankenregelungen bestimmt, die auf die europäische DSM-Richtlinie (Richtlinie (EU) 2019/790, Art. 3 und 4) zurückgehen.

§ 44b UrhG – Kommerzielles Text und Data Mining. Diese Norm erlaubt grundsätzlich jedermann – also auch kommerziellen Unternehmen – die Vervielfältigung rechtmäßig zugänglicher Werke zum Zwecke des Text und Data Mining (TDM). TDM wird dabei definiert als die „automatisierte Analyse von einzelnen oder mehreren digitalen oder digitalisierten Werken, um daraus Informationen insbesondere über Muster, Trends und Korrelationen zu gewinnen" (§ 44b Abs. 1 UrhG). Die Vervielfältigungen sind zu löschen, wenn sie für das TDM nicht mehr erforderlich sind (§ 44b Abs. 2 Satz 2 UrhG). Entscheidend: Der Rechteinhaber kann sich die Nutzung vorbehalten (Opt-out). Bei online zugänglichen Werken ist dieser Nutzungsvorbehalt nur dann wirksam, wenn er in maschinenlesbarer Form erfolgt (§ 44b Abs. 3 UrhG).

§ 60d UrhG – TDM für wissenschaftliche Forschung. Für nicht-kommerzielle Forschungseinrichtungen gilt eine weitergehende Schranke: Vervielfältigungen zu Forschungszwecken sind zulässig, ohne dass der Rechteinhaber dies durch einen Nutzungsvorbehalt verhindern kann. Ein Opt-out ist hier nicht möglich.

 

2. Ist KI-Training überhaupt „Text und Data Mining"?

 

Ob das Training generativer KI-Modelle unter den TDM-Begriff der §§ 44b, 60d UrhG fällt, ist in Literatur und Rechtsprechung umstritten und höchstrichterlich noch nicht entschieden. Kritische Stimmen weisen darauf hin, dass der Gesetzgeber bei Schaffung der TDM-Schranken im Jahr 2021 die immensen kommerziellen Auswirkungen des generativen KI-Trainings nicht im Blick hatte und dass die Generierung neuer Inhalte über das bloße „Gewinnen von Informationen über Muster, Trends und Korrelationen" hinausgeht. Der EU AI Act hat allerdings durch den Verweis auf Art. 4 DSM-Richtlinie in den Transparenzpflichten für GPAI-Modelle (Art. 53 KI-VO) ein starkes Argument dafür geliefert, dass der europäische Gesetzgeber KI-Training jedenfalls als vom Anwendungsbereich der TDM-Schranken erfasst ansieht.

 

Das LG Hamburg (Urt. v. 27.09.2024 – 310 O 227/23) und das OLG Hamburg (Urt. v. 10.12.2025 – 5 U 104/24) haben in den von unserer Kanzlei auf Seiten von LAION e.V. geführten Verfahren die Anwendbarkeit der §§ 44b, 60d UrhG auf die Erstellung von KI-Trainingsdatensätzen bejaht. Die Revision zum BGH ist zugelassen und eingelegt – eine höchstrichterliche Klärung steht unmittelbar bevor.

 

3. Vervielfältigung beim Training: Input- und Modell-Ebene

 

Beim KI-Training kommen zwei mögliche Anknüpfungspunkte für eine urheberrechtlich relevante Vervielfältigung (§ 16 UrhG) in Betracht. Der erste liegt im Download und in der Aufbereitung der Trainingsdaten: Hier werden geschützte Werke zweifelsfrei kopiert. Der zweite Anknüpfungspunkt betrifft die Einspeisung in das neuronale Netz selbst: Nach derzeit überwiegender Auffassung werden beim Training keine Werke im Netzwerk „gespeichert", sondern lediglich statistische Wahrscheinlichkeiten berechnet. Allerdings zeigt die Praxis – wie im GEMA-Verfahren vor dem LG München I (Urt. v. 11.11.2025 – 42 O 14139/24) eindrucksvoll belegt –, dass Modelle geschützte Werke durchaus „memorisieren" und nahezu wortgleich ausgeben können. Die Abgrenzung ist daher im Fluss und wird durch die weitere Rechtsprechung zu konkretisieren sein.

 


 

II. Der Nutzungsvorbehalt (Opt-out) nach § 44b Abs. 3 UrhG

 

1. Grundprinzip und Anforderungen

 

Das zentrale Schutzinstrument für Rechteinhaber gegen kommerzielles KI-Training ist der Nutzungsvorbehalt nach § 44b Abs. 3 UrhG. Er ermöglicht es, die gesetzliche TDM-Erlaubnis auszuschließen, sodass eine Nutzung nur noch mit Einwilligung oder Lizenz des Rechteinhabers zulässig ist. Der Vorbehalt muss ausdrücklich erklärt werden und bei online zugänglichen Werken in maschinenlesbarer Form erfolgen.

Was genau „maschinenlesbar" bedeutet, definiert das Gesetz nicht. Es existiert kein verbindlicher technischer Standard. Die Gesetzesbegründung (BT-Drs. 19/27426, S. 89) führt aus, dass der Vorbehalt auch im Impressum oder in den AGB enthalten sein kann, „sofern er auch dort maschinenlesbar ist." Das LG Hamburg hat im LAION-Verfahren angedeutet, dass auch ein in natürlicher Sprache formulierter Vorbehalt maschinenlesbar sein könne, da moderne KI-Systeme natürliche Sprache verarbeiten können. Das OLG Hamburg hat diese Frage für den maßgeblichen Zeitpunkt (2021) hingegen verneint und die Frage für die Gegenwart offengelassen.

 

2. Wichtige Einschränkung: Nur Zukunftswirkung

 

Ein Nutzungsvorbehalt wirkt grundsätzlich nur in die Zukunft. Bereits gecrawlte und zum Training verwendete Daten werden durch einen nachträglich erklärten Vorbehalt nicht erfasst. Bereits trainierte Modelle „vergessen" die genutzten Inhalte nicht. Umso wichtiger ist es, den Vorbehalt so früh wie möglich und so umfassend wie möglich zu implementieren.

 

3. Keine Opt-out-Möglichkeit bei wissenschaftlicher Forschung

 

Gegen TDM zu nicht-kommerziellen Forschungszwecken nach § 60d UrhG können Rechteinhaber keinen Vorbehalt erklären. Die Abgrenzung zwischen kommerzieller und nicht-kommerzieller Nutzung ist allerdings im Einzelfall schwierig, wie die LAION-Verfahren zeigen, in denen die Frage, ob eine gemeinnützige Forschungseinrichtung auch dann unter § 60d UrhG fällt, wenn kommerzielle Dritte die erstellten Datensätze nutzen, intensiv diskutiert wurde.

 


 

III. Technische Schutzmaßnahmen: So schützen Sie Ihre Inhalte

 

Angesichts der rechtlichen Unsicherheiten empfiehlt sich eine mehrstufige Schutzstrategie, die verschiedene technische und rechtliche Mechanismen kombiniert. Die wichtigsten Instrumente stellen wir auf dieser Seite vor.

 


 

IV. Der EU AI Act: Neue Pflichten für KI-Anbieter

 

Der AI Act (Verordnung (EU) 2024/1689) ergänzt den urheberrechtlichen Rahmen um spezifische Transparenz- und Compliancepflichten für Anbieter von KI-Modellen mit allgemeinem Verwendungszweck (General Purpose AI, GPAI). Art. 53 Abs. 1 lit. c KI-VO verpflichtet GPAI-Anbieter ab dem 2. August 2025, eine Strategie zur Ermittlung und Einhaltung des TDM-Vorbehalts nach Art. 4 Abs. 3 DSM-Richtlinie umzusetzen – und zwar „auch durch modernste Technologien". Diese Formulierung ist von erheblicher Bedeutung: Sie legt nahe, dass KI-Anbieter aktiv nach Nutzungsvorbehalten suchen müssen und sich nicht darauf berufen können, einen Vorbehalt technisch nicht erkannt zu haben.

 

Zudem müssen GPAI-Anbieter eine „hinreichend detaillierte Zusammenfassung" der für das Training verwendeten Inhalte öffentlich zugänglich machen (Art. 53 Abs. 1 lit. d KI-VO). Dies soll Rechteinhabern ermöglichen, festzustellen, ob ihre Werke für das Training genutzt wurden, und gegebenenfalls ihre Rechte durchzusetzen.

 


 

V. Empfohlene Schutzstrategie: Mehrstufiger Ansatz

 

Angesichts der Tatsache, dass kein einzelnes Instrument für sich allein einen lückenlosen Schutz gewährleistet, empfehlen wir eine mehrstufige Schutzstrategie, die rechtliche und technische Maßnahmen kombiniert:

 

Stufe 1 – Rechtliche Grundlage: Ausdrücklicher Nutzungsvorbehalt im Impressum und/oder den AGB der Website mit klarem Bezug auf § 44b UrhG und KI-Training. Dokumentation des Zeitpunkts der Implementierung (etwa durch Archivierung bei der Wayback Machine oder notarielle Sicherung).

Stufe 2 – Standortbasierter technischer Schutz: Implementierung einer robots.txt mit Disallow-Direktiven für alle bekannten KI-Trainings-Crawler. Ergänzende Einrichtung der TDMRep-Datei (/.well-known/tdmrep.json) nach dem W3C-Protokoll. Integration von „noai"-Meta-Tags in HTML-Seiten.

Stufe 3 – Asset-basierter Schutz: Einbettung von IPTC-Metadaten mit TDM-Opt-out in Bilddateien. Nutzung von Content Credentials (C2PA) für besonders wertvolle visuelle Inhalte. Bei Verlagsinhalten: Kennzeichnung über ONIX-Metadaten und TDMRep in EPUB/PDF.

Stufe 4 – Technische Zugangssteuerung: Monitoring der Server-Logs auf KI-Crawler-Aktivität. IP-basierte Sperren oder Bot-Management-Lösungen bei Bedarf. Nutzung von CDN-Diensten mit integriertem KI-Bot-Schutz (etwa Cloudflare).

Stufe 5 – Vertragliche Absicherung: Aufnahme von TDM-Klauseln in Lizenzverträge und Vertriebsvereinbarungen. Verpflichtung von Vertriebspartnern zur Weiterleitung des Nutzungsvorbehalts.

 


 

VI. Durchsetzung: Wenn Ihre Werke bereits genutzt wurden

 

Wurde Ihr Content ohne Einwilligung und trotz erklärtem Nutzungsvorbehalt für KI-Training verwendet, stehen Ihnen grundsätzlich die urheberrechtlichen Ansprüche auf Unterlassung, Auskunft und Schadensersatz nach §§ 97 ff. UrhG zur Verfügung. Auch ohne vorherigen Opt-out können Ansprüche bestehen, wenn die Voraussetzungen der TDM-Schranken im konkreten Fall nicht erfüllt sind – etwa weil kein rechtmäßiger Zugang zu den Werken bestand (Crawling illegaler Quellen) oder weil die Vervielfältigungen nicht gelöscht wurden. Das GEMA-Urteil des LG München I hat zudem gezeigt, dass auch die Output-Seite – die Memorisierung und Wiedergabe geschützter Werke – eigenständige Verletzungsansprüche begründen kann.

 

Die praktische Herausforderung liegt häufig in der Beweisführung: Rechteinhaber müssen nachweisen, dass ihre konkreten Werke zum Training verwendet wurden. Die ab August 2025 geltenden Transparenzpflichten des AI Act werden hier eine gewisse Erleichterung bringen, da GPAI-Anbieter eine Zusammenfassung ihrer Trainingsdaten veröffentlichen müssen.

 


 

Unsere Beratungsleistungen

 

Heidrich Rechtsanwälte verfügt über besondere Expertise an der Schnittstelle von Urheberrecht und KI-Training. Unsere Kanzlei hat LAION e.V. in den Grundsatzverfahren vor dem LG und OLG Hamburg vertreten – den ersten und bislang einzigen deutschen Gerichtsentscheidungen zur urheberrechtlichen Zulässigkeit der Erstellung von KI-Trainingsdatensätzen. Wir beraten Sie unter anderem zu folgenden Themen:

 

  • Implementierung einer Schutzstrategie gegen ungewolltes KI-Training: von der Impressumsklausel über robots.txt und TDMRep bis zur IPTC-Einbettung

  • Durchsetzung urheberrechtlicher Ansprüche gegen KI-Anbieter, die Ihre Werke ohne Berechtigung zum Training genutzt haben

  • Abwehr urheberrechtlicher Ansprüche im Zusammenhang mit KI-Training, etwa bei der Entwicklung eigener KI-Modelle oder der Erstellung von Trainingsdatensätzen

  • AI-Act-Compliance bei der Entwicklung und dem Betrieb von GPAI-Modellen, insbesondere Umsetzung der Transparenzpflichten nach Art. 53 KI-VO

  • Lizenzgestaltung für die Nutzung urheberrechtlich geschützter Inhalte als KI-Trainingsdaten

  • KI-Richtlinien und Compliance-Konzepte für den Einsatz generativer KI im Unternehmen

 


 

Stand: März 2026. Die Darstellung berücksichtigt die Rechtsprechung und Gesetzeslage zum Zeitpunkt der Veröffentlichung. Angesichts der hohen Dynamik in diesem Rechtsgebiet kann sich die Rechtslage kurzfristig ändern. Diese Seite ersetzt keine individuelle Rechtsberatung.

 

Datenschutz

Ihre Daten werden nur zweckgebunden zur Bearbeitung Ihrer Kontaktanfrage verarbeitet, weitere Informationen zum Datenschutz finden Sie in unserer Datenschutzerklärung.