LAION Verfahren
Dokumentation des Verfahren Kneschke vs LAION e.V.
I. Sachverhalt und Streitgegenstand
Nachfolgend finden Sie eine ausführliche Darstellung des Verfahrens Kneschke ./. LAION e.V.. Heidrich Rechtsanwälte haben in diesem Verfahren LAION vor dem Landgericht und dem Oberlandesgericht Hamburg vertreten und werden den gemeinnützigen Verein auch vor dem Bundesgerichtshof unterstützen.
1. Die Parteien
Der Kläger, Robert Kneschke, ist nach eigenen Angaben "professioneller Bildproduzent". Er vertreibt Fotografien, aber auch KI-generierte Bilder über Stockfoto-Anbeiter, unter anderem auch über die Bildagentur Bigstockphoto. Diese war als Inhaberin einfacher, weiterlizenzierbarer Nutzungsrechte am streitgegenständlichen Foto berechtigt, dieses auf ihrer Internetseite anzubieten und Lizenzen daran zu vergeben.
Der von unserer Kanzlei vertretene Beklagte, LAION e.V. (Large-scale Artificial Intelligence Open Network), ist ein gemeinnütziger eingetragener Verein mit Sitz in Hamburg, der 2021 gegründet wurde. Er stellt unter der Bezeichnung „LAION-5B" einen Datensatz mit Bild-Text-Paaren öffentlich und kostenfrei zur Verfügung. Satzungsmäßiger Zweck des Vereins ist die Förderung der Forschung und Bildung, insbesondere die Demokratisierung der Erzeugung und Nutzung großer KI-Netzwerkmodelle.
2. Der Datensatz LAION-5B
Bei dem Datensatz handelt es sich um ein tabellenartiges Dokument, das Hyperlinks zu im Internet öffentlich abrufbaren Bildern bzw. Bilddateien enthält sowie weitere Informationen zu den jeweiligen Bildern, insbesondere eine Bildbeschreibung (Alternativtext), die den Bildinhalt in Textform wiedergibt. Der Datensatz umfasst ca. 5,85 Milliarden entsprechende Bild-Text-Paare und kann für das Training sogenannter generativer Künstlicher Intelligenz genutzt werden.
3. Erstellung des Datensatzes
Zur Erstellung des Datensatzes griff LAION auf einen bereits vorhandenen Datensatz der Common Crawl Foundation aus den USA zurück, der für einen zufälligen Querschnitt der im Internet auffindbaren Bilder die jeweiligen URLs nebst textlicher Beschreibung des Bildinhalts enthielt. LAION extrahierte die URLs zu den Bildern aus diesem Datensatz und lud die Bilder von ihren jeweiligen Speicherorten herunter. Im Anschluss wurden die Bilder mittels einer Software (CLIP von OpenAI) darauf geprüft, ob die im vorbestehenden Datensatz bereits vorhandene Beschreibung des Bildinhalts tatsächlich mit dem auf dem jeweiligen Bild dargestellten Inhalt übereinstimmte. Bilder, bei denen Text und Bildinhalt nicht hinreichend übereinstimmten, wurden herausgefiltert. Für die verbleibenden Bilder wurden die Metadaten – insbesondere die URL des Speicherorts und die Bildbeschreibung – extrahiert und in den neuen Datensatz LAION-5B aufgenommen. Die für die Erstellung erforderlichen Downloads erfolgten in der zweiten Jahreshälfte 2021.
4. Die streitgegenständliche Fotografie
Im Rahmen dieses Prozesses wurde auch die streitgegenständliche Fotografie des Klägers erfasst, heruntergeladen und analysiert; die zugehörigen Metadaten wurden in den Datensatz aufgenommen. Konkret heruntergeladen wurde dabei eine auf der Webseite der Bildagentur Bigstockphoto eingestellte, mit einem Wasserzeichen der Agentur versehene Bilddatei – also nicht das lizenzpflichtige Originalbild, sondern ein zu Werbezwecken frei zugänglich eingestelltes Vorschaubild.
5. Der Nutzungsvorbehalt auf der Agenturseite
Auf der Webseite der Bildagentur Bigstockphoto befand sich mindestens seit dem 13.01.2021 unter der Rubrik „RESTRICTIONS" folgender Text: Es sei untersagt, automatisierte Programme, Applets, Bots oder dergleichen zu verwenden, um auf die Website oder deren Inhalte zuzugreifen, einschließlich des Herunterladens, Indexierens, Scrapens oder Cachens von Inhalten. Text und Data Mining wurde dabei nicht explizit erwähnt.
6. Streitgegenstand
Kernfrage des Verfahrens: Stellt der Download einer Fotografie zum Zweck der Erstellung eines KI-Trainingsdatensatzes eine urheberrechtswidrige Vervielfältigung (§ 16 UrhG) dar, oder ist die Nutzung durch die Schrankenregelungen der §§ 44a, 44b und/oder 60d UrhG gedeckt?
Der Kläger begehrte Unterlassung der Vervielfältigung seiner Fotografie zur Erstellung von KI-Trainingsdatensätzen. Er machte geltend, die Vervielfältigung verletze seine Rechte aus § 16 UrhG und sei insbesondere nicht durch die Schrankenregelungen der §§ 44a, 44b und 60d UrhG gedeckt. Zentrale Argumente des Klägers waren dabei unter anderem: Die Handlung des Beklagten stelle kein Text und Data Mining im Sinne des Gesetzes dar; das massenhafte Erfassen urheberrechtlich geschützter Werke zu Trainingszwecken beeinträchtige die normale Verwertung dieser Werke (Drei-Stufen-Test); ein wirksamer Nutzungsvorbehalt der Bildagentur stehe der Nutzung entgegen; und der Beklagte könne sich nicht auf die Forschungsschranke des § 60d UrhG berufen, da er keine eigenständige wissenschaftliche Forschung betreibe und enge Verbindungen zu kommerziellen KI-Unternehmen (insbesondere Stability AI) bestünden.
II. Urteil des Landgerichts Hamburg vom 27.09.2024
LG Hamburg, Urt. v. 27.09.2024 – 310 O 227/23 (openJur 2024, 9199)
Ergebnis: Die Klage wurde abgewiesen. Das LG Hamburg bejahte die Anwendbarkeit der Schrankenregelung des § 60d UrhG und ließ die Frage der Anwendbarkeit des § 44b UrhG ausdrücklich offen.
1. Vervielfältigung und Aktivlegitimation
Das Landgericht stellte zunächst fest, dass die streitgegenständliche Fotografie jedenfalls als Lichtbild nach § 72 Abs. 1 UrhG geschützt ist, und bestätigte die Urheberschaft des Klägers nach Inaugenscheinnahme der Rohdaten. Der Download der mit einem Wasserzeichen versehenen Bilddatei durch den Beklagten stelle eine Vervielfältigung im Sinne des § 16 Abs. 1 UrhG dar, die ohne Zustimmung des Klägers erfolgt sei.
2. Keine Rechtfertigung nach § 44a UrhG
Das Landgericht verneinte die Schranke des § 44a UrhG (vorübergehende Vervielfältigungshandlungen). Die Vervielfältigung sei weder flüchtig noch begleitend gewesen. Das gezielte Herunterladen der Bilddateien zum Zwecke der Analyse mittels einer spezifischen Software stelle keinen bloß begleitenden Prozess dar, sondern einen der Analyse vorgelagerten bewussten und aktiv gesteuerten Beschaffungsprozess. Die Löschung sei nicht „nutzerunabhängig", sondern aufgrund bewusster Programmierung erfolgt.
3. Zu § 44b UrhG (obiter dictum)
Das Landgericht ließ die abschließende Entscheidung über § 44b UrhG ausdrücklich offen, äußerte sich aber in einem umfangreichen obiter dictum zu dieser Frage:
a) Text und Data Mining bejaht
Die streitgegenständliche Vervielfältigungshandlung unterfalle grundsätzlich der Schrankenregelung des § 44b Abs. 2 UrhG. Der Download sei zum Zwecke der Gewinnung von Informationen über „Korrelationen" im Sinne des § 44b Abs. 1 UrhG erfolgt, nämlich zum Abgleich des Bildinhalts mit vorbestehenden Bildbeschreibungen. Eine teleologische Reduktion des § 44b UrhG dahingehend, dass vorbereitende Maßnahmen für das KI-Training ausgenommen seien, komme nicht in Betracht. Das Gericht verwies insbesondere auf die Gesetzesbegründung (BT-Drs. 19/27426, S. 60) und auf Art. 53 Abs. 1 lit. c der KI-Verordnung, die die Anwendbarkeit der TDM-Schranken auf KI-Training voraussetze.
b) Nutzungsvorbehalt und Maschinenlesbarkeit
Das Landgericht tendierte dazu, den auf der Webseite von Bigstockphoto in natürlicher Sprache erklärten Nutzungsvorbehalt als maschinenlesbar im Sinne des § 44b Abs. 3 S. 2 UrhG anzusehen. Die Kammer argumentierte, der Begriff der Maschinenlesbarkeit sei im Sinne einer „Maschinenverständlichkeit" auszulegen, und es stelle einen Wertungswiderspruch dar, KI-Anbietern einerseits über § 44b Abs. 2 UrhG die Entwicklung immer leistungsfähigerer textverstehender KI-Modelle zu ermöglichen, ihnen aber andererseits im Rahmen des § 44b Abs. 3 S. 2 UrhG die Anwendung bereits bestehender KI-Modelle zur Erkennung von Nutzungsvorbehalten nicht abzuverlangen. Das Gericht verwies hierbei auch auf Art. 53 Abs. 1 lit. c KI-VO, der die Ermittlung von Rechtsvorbehalten „auch durch modernste Technologien" verlange. Zugleich merkte das Gericht an, dass der Kläger nicht dargelegt habe, dass im Zeitpunkt der streitgegenständlichen Vervielfältigung (2021) die erforderliche Technologie bereits verfügbar war.
4. Rechtfertigung nach § 60d UrhG – tragende Begründung
a) Zweck der wissenschaftlichen Forschung
Das Landgericht bejahte, dass die Vervielfältigung zu Zwecken der wissenschaftlichen Forschung im Sinne des § 60d Abs. 1 UrhG erfolgt sei. Der Begriff der wissenschaftlichen Forschung sei weit auszulegen und erfasse das methodisch-systematische Streben nach neuen Erkenntnissen, wobei bereits das Gerichtetsein auf einen späteren Erkenntnisgewinn ausreiche. Auch die Erstellung eines Datensatzes, der Grundlage für das Trainieren von KI-Systemen sein könne, sei als grundlegender Arbeitsschritt mit dem Ziel späteren Erkenntnisgewinns wissenschaftliche Forschung. Es genüge, dass der Datensatz kostenfrei veröffentlicht und damit Forschenden auf dem Gebiet künstlicher neuronaler Netze zur Verfügung gestellt werde.
b) Nicht kommerzielle Zweckverfolgung
Die nicht-kommerzielle Zweckverfolgung des Beklagten ergebe sich bereits daraus, dass dieser den Datensatz unstreitig kostenfrei öffentlich zur Verfügung stelle. Dass der Datensatz auch von kommerziell tätigen Unternehmen genutzt werden möge, sei für die Einordnung der Tätigkeit des Beklagten ohne Relevanz. Dass einzelne Mitglieder neben ihrer Vereinstätigkeit bei kommerziellen Unternehmen beschäftigt seien, reiche nicht aus, um die Tätigkeit dieser Unternehmen dem Beklagten zuzurechnen.
c) Kein Ausschluss nach § 60d Abs. 2 S. 3 UrhG
Das Landgericht verneinte den Ausschlussgrund des § 60d Abs. 2 S. 3 UrhG (bestimmender Einfluss eines privaten Unternehmens mit bevorzugtem Zugang). Die bloße Tätigkeit zweier Vereinsmitglieder für Stability AI belege keinen bestimmenden Einfluss dieses Unternehmens. Auch der vorgetragene Chat-Verlauf über eine mögliche vorzeitige Zuganggewährung an ein Unternehmen gegen 5.000 US-Dollar erfülle den Ausnahmetatbestand nicht, da jedenfalls kein bestimmender Einfluss dieses Unternehmens auf den Beklagten dargelegt sei.
III. Urteil des OLG Hamburg vom 10.12.2025
Hans. OLG Hamburg, Urt. v. 10.12.2025 – 5 U 104/24
Ergebnis: Die Berufung des Klägers wurde zurückgewiesen. Das OLG bestätigte die Klageabweisung und stützte sich – anders als das Landgericht – kumulativ auf beide Schrankenregelungen: Sowohl § 44b UrhG als auch § 60d UrhG seien einschlägig. Die Revision zum BGH wurde zugelassen.
1. Bestätigung der Vorfragen
Das OLG bestätigte die Feststellungen des Landgerichts zum Lichtbildschutz nach § 72 Abs. 1 UrhG (nicht als Lichtbildwerk nach § 2 Abs. 2 Nr. 5 UrhG, da der Kläger hierzu nicht vorgetragen habe), zur Aktivlegitimation des Klägers sowie zur Vervielfältigung im Sinne des § 16 Abs. 1 UrhG durch den Download. Die Zustimmung des Klägers lag unstreitig nicht vor.
2. Rechtfertigung nach § 44b UrhG
Das OLG ging über das obiter dictum des Landgerichts hinaus und bejahte tragend die Anwendbarkeit des § 44b UrhG.
a) Vorliegen von Text und Data Mining
Der Senat bestätigte, dass der streitgegenständliche Download eine Vervielfältigung für das Text und Data Mining im Sinne des § 44b Abs. 1 UrhG darstelle. Die Analyse, ob die Fotografie mit der vorhandenen Bildbeschreibung zusammenpasse, diene der Gewinnung einer Information über den Zusammenhang zwischen Bild und Bildbeschreibung und stelle eine Korrelation im Sinne der Vorschrift dar. Selbst wenn dies keine Korrelation im engeren statistischen Sinne sei, handele es sich jedenfalls um eine „wechselseitige Beziehung" und damit um eine „Information" nach dem Wortlaut des § 44b Abs. 1 UrhG, der Muster, Trends und Korrelationen lediglich als Regelbeispiele nenne. Bereits der einzelne Bild-Text-Abgleich genüge; auf die Frage, ob das spätere KI-Training selbst TDM darstelle, komme es nicht an.
Eine teleologische Einschränkung lehnte das OLG mit ausführlicher Begründung ab und verwies auf die Gesetzesbegründung zu § 44b UrhG (BT-Drs. 19/27426, S. 60), Art. 53 Abs. 1 lit. c KI-VO, die Erwägungsgründe 99 und 105 der KI-VO sowie Erwägungsgrund 3 und 18 der DSM-RL. Auch die in der Literatur vertretene Differenzierung zwischen „semantischen" und „syntaktischen" Informationen führe zu keinem anderen Ergebnis, da beim Bild-Text-Abgleich nur die im Bild enthaltene „Information" ausgewertet werde, nicht dessen konkrete Ausgestaltung.
b) Rechtmäßige Zugänglichkeit
Das frei im Internet zugänglich eingestellte Vorschaubild mit Wasserzeichen war ein rechtmäßig zugängliches Werk im Sinne des § 44b Abs. 2 S. 1 UrhG. Dies wurde mit der Berufung nicht angegriffen.
c) Kein Parallelarchiv
Der Beklagte habe kein digitales Parallelarchiv geschaffen. In den Datensatz seien nicht die Bilder selbst, sondern nur Hyperlinks und Metadaten aufgenommen worden. Diese Feststellung des Landgerichts sei mit der Berufung nicht angegriffen worden und nach § 529 Abs. 1 Nr. 1 ZPO zugrunde zu legen.
d) Kein wirksamer Nutzungsvorbehalt nach § 44b Abs. 3 UrhG
Dies ist der zentrale Punkt, an dem das OLG vom obiter dictum des Landgerichts abweicht:
Berechtigung des Inhabers einfacher Nutzungsrechte: Das OLG bejahte grundsätzlich, dass der Kläger sich auf einen von der Bildagentur Bigstockphoto als Inhaberin einfacher Nutzungsrechte erklärten Vorbehalt berufen könne. Wer sich als Fotograf zur Verwertung seiner Bilder einer Agentur bediene, erkläre sich regelhaft damit einverstanden, dass der Vertrieb nach den Bedingungen der Agentur erfolge.
Beweislastverteilung: Das OLG arbeitete eine differenzierte Beweislastverteilung heraus: Die Beweislast für das Fehlen eines Nutzungsvorbehalts trifft grundsätzlich den Nutzer (den Beklagten), weil der deutsche Gesetzgeber § 44b Abs. 3 S. 1 UrhG als Voraussetzung der Schranke ausgestaltet hat. Den Rechteinhaber treffe jedoch eine sekundäre Darlegungslast hinsichtlich des Vorhandenseins und der Ausgestaltung eines Vorbehalts. Die Beweislast für die Maschinenlesbarkeit liege hingegen beim Rechteinhaber (abgeleitet aus der Formulierung „nur dann wirksam, wenn" in § 44b Abs. 3 S. 2 UrhG).
Fehlende Maschinenlesbarkeit im Jahr 2021: Der Senat ließ die umstrittene Grundsatzfrage, ob ein in natürlicher Sprache formulierter Vorbehalt grundsätzlich maschinenlesbar sein kann, im Ergebnis offen. Entscheidend sei, dass die gewählte Form zum Zeitpunkt der streitgegenständlichen Nutzungshandlung (zweite Jahreshälfte 2021) maschinenlesbar gewesen sein müsse. Diesen Nachweis habe der Kläger nicht erbracht. Die vom Kläger vorgelegten Belege (ChatGPT-Eingabe aus 2023, das Tool „weboptout") bezögen sich auf Technologien, die nachweislich erst nach 2021 verfügbar gewesen seien. Der vom Landgericht angeführte Umstand, dass der Beklagte selbst Software zum Bild-Text-Abgleich einsetze, rechtfertige nicht die Feststellung, dass auch umfangreiche natürlichsprachliche Nutzungsbedingungen im Jahr 2021 maschinell auslesbar gewesen seien. Weiterer Vortrag des Klägers aus nicht nachgelassenen Schriftsätzen sei nach § 296a ZPO präkludiert.
e) Drei-Stufen-Test bestanden
Der Senat prüfte den Drei-Stufen-Test (Art. 5 Abs. 5 InfoSoc-RL i.V.m. Art. 7 Abs. 2 DSM-RL) ausführlich auf allen drei Stufen:
Erste Stufe: Ein gesetzlich geregelter Sonderfall liege mit § 44b UrhG vor.
Zweite Stufe: Die normale Verwertung des Werkes werde nicht beeinträchtigt. Die streitgegenständliche Vervielfältigung sei ein rein interner Vorgang beim Beklagten; der nach außen gegebene Datensatz enthalte nur Links auf die rechtmäßige Quelle. Auch unter Berücksichtigung der mittelbaren Folgen (KI-generierte Bilder als potenzielle Konkurrenz) sei die Voraussetzung erfüllt, da die Entwicklung generativer KI eine vom europäischen Gesetzgeber gewollte Entwicklung sei und der Rechteinhaber die Möglichkeit habe, durch einen wirksamen Vorbehalt die Nutzung zu unterbinden.
Dritte Stufe: Eine ungebührliche Verletzung der Interessen des Rechtsinhabers sei unter Berücksichtigung des rein internen Charakters der Vervielfältigung, der nichtkommerziellen Tätigkeit des Beklagten und der bestehenden Opt-out-Möglichkeit zu verneinen.
3. Bestätigung des § 60d UrhG
Darüber hinaus bestätigte das OLG auch die tragende Begründung des Landgerichts zu § 60d UrhG, vertiefte und ergänzte diese jedoch erheblich:
a) Wissenschaftliche Forschung – erweiterte Begründung
Das OLG ging über das Landgericht hinaus und stellte fest, dass bereits die Erstellung des Datensatzes selbst – nicht nur ein vorbereitender Schritt – wissenschaftliche Forschung darstelle. LAION habe das 2021 veröffentlichte CLIP-Modell in neuartiger Weise auf den Common-Crawl-Datensatz angewendet, die Tauglichkeit und Qualität des erzeugten Datensatzes durch Validierungsexperimente überprüft und die Ergebnisse in einer Publikation veröffentlicht, die den „NeurIPS 2022 Outstanding Paper Award" erhielt und bis April 2024 über 1.400-mal zitiert wurde. Zudem erhielt der Beklagte den „Falling Walls Science Breakthrough of the Year 2023 Award". In der Gesamtschau stelle die Erstellung des Datensatzes ein methodisches, auf späteren Erkenntnisgewinn gerichtetes und nachprüfbares Vorgehen dar, das der angewandten Forschung zuzurechnen sei.
b) Forschungsorganisation – eigene Forschung
Der Senat stellte klar, dass eine Einrichtung nach § 60d Abs. 2 S. 2 UrhG selbst Forschung betreiben müsse; das bloße Bereitstellen von Material für Dritte genüge nicht. LAION betreibe aber tatsächlich eigene wissenschaftliche Forschung, wie die Publikationen und der Validierungsprozess belegten. Die Satzung, die Vereinsregistereintragung, die wissenschaftlichen Auszeichnungen, der Open-Source-Ansatz sowie die Tätigkeit des Vorstands- und Gründungsmitglieds als Laborleiter am Forschungszentrum Jülich seien Indizien für die primär wissenschaftliche Ausrichtung.
c) Nicht kommerzielle Zwecke
Der Beklagte sei gemeinnützig, stelle seine Ergebnisse kostenlos zur Verfügung, und auch eine einmalige Zahlung von 5.000 US-Dollar durch ein Unternehmen reiche weder nach Art noch Umfang aus, um eine kommerzielle Zweckverfolgung zu begründen. Der Open-Source-Ansatz bringe es naturgemäß mit sich, dass auch kommerzielle Anbieter den Datensatz nutzen könnten, ohne dass dies die nichtkommerzielle Ausrichtung des Vereins in Frage stelle. § 60d UrhG solle eine normale nachgelagerte Nutzung von Forschungsergebnissen durch die Wirtschaft nicht verhindern.
d) Kein Ausschluss nach § 60d Abs. 2 S. 3 UrhG
Das OLG prüfte die Rückausnahme des § 60d Abs. 2 S. 3 UrhG (bestimmender Einfluss eines privaten Unternehmens mit bevorzugtem Zugang) ausführlich und verneinte sie im Ergebnis. Die Voraussetzungen seien kumulativ zu verstehen: Es bedürfe sowohl eines bestimmenden Einflusses als auch eines bevorzugten Zugangs zu den Forschungsergebnissen. Der Senat gestand dem Kläger zwar zu, dass der bevorzugte Zugang eines Unternehmens möglicherweise nicht hinreichend bestritten worden sei. Jedoch fehle es jedenfalls am bestimmenden Einfluss: Weder die Bereitstellung von Rechenressourcen durch Stability AI noch eine etwaige finanzielle Unterstützung noch die Tätigkeit einzelner Vereinsmitglieder bei Stability AI oder Google begründeten einen bestimmenden Einfluss auf die Forschungsarbeit des Vereins.
e) Drei-Stufen-Test auch unter § 60d UrhG bestanden
Auch im Rahmen des § 60d UrhG bejahte der Senat die Vereinbarkeit mit dem Drei-Stufen-Test. Unter Berücksichtigung des wissenschaftlichen Zwecks (Art. 13 GRCh), der nichtkommerziellen Nutzung und des rein internen Charakters der Vervielfältigung sei eine ungebührliche Verletzung der Interessen des Klägers als Rechtsinhaber (Art. 17 Abs. 2 GRCh) zu verneinen – auch wenn die Nutzung nach § 60d UrhG anders als bei § 44b UrhG vergütungsfrei sei und keine Opt-out-Möglichkeit bestehe.
4. Keine Rechtfertigung nach § 44a UrhG
Das OLG bestätigte die Ablehnung des § 44a UrhG: Das gezielte Herunterladen einer Bilddatei zum Zwecke der Analyse stelle weder eine flüchtige noch eine rein begleitende Vervielfältigung dar.
5. Zulassung der Revision
Revision zugelassen: Der Senat ließ die Revision zum BGH zu (§ 543 Abs. 2 ZPO). Die Rechtssache habe grundsätzliche Bedeutung und die Fortbildung des Rechts erfordere eine Entscheidung des Revisionsgerichts. Zur Auslegung der §§ 44b, 60d UrhG im Zusammenhang mit einer Nutzung urheberrechtlich geschützter Werke im Vorfeld des Trainings Künstlicher Intelligenz liege keine höchstrichterliche Rechtsprechung vor.
IV. Bedeutung für die Praxis
Die Entscheidungen des Landgerichts und des Oberlandesgerichts Hamburg stellen die ersten instanzgerichtlichen Urteile in Deutschland dar, die sich eingehend mit der urheberrechtlichen Zulässigkeit der Nutzung geschützter Werke für die Erstellung von KI-Trainingsdatensätzen befassen. Sie klären eine Reihe von Grundsatzfragen, die für die KI-Branche, die Kreativwirtschaft und die Rechtswissenschaft von erheblicher Bedeutung sind:
Erstens bestätigen beide Instanzen, dass das Herunterladen und automatisierte Analysieren von Bildern zum Abgleich mit Bildbeschreibungen – als Schritt bei der Erstellung eines KI-Trainingsdatensatzes – Text und Data Mining im Sinne des § 44b Abs. 1 UrhG darstellt. Dies gilt auch dann, wenn der Datensatz letztlich dem Training generativer KI dienen soll.
Zweitens wird die Forschungsschranke des § 60d UrhG auch auf gemeinnützige Organisationen angewandt, die Trainingsdatensätze erstellen und der Allgemeinheit kostenfrei zur Verfügung stellen – selbst wenn der Datensatz auch von kommerziellen Unternehmen genutzt werden kann.
Drittens adressiert das OLG die praxisrelevante Frage der Maschinenlesbarkeit von Nutzungsvorbehalten nach § 44b Abs. 3 S. 2 UrhG differenziert und zeitpunktbezogen: Es kommt auf die zum Zeitpunkt der konkreten Nutzungshandlung verfügbare Technologie an, und die Beweislast für die Maschinenlesbarkeit liegt beim Rechteinhaber.
Das Verfahren liegt nunmehr dem Bundesgerichtshof zur Revisionsentscheidung vor und wird voraussichtlich zu einer höchstrichterlichen Leitentscheidung zum Verhältnis von Urheberrecht und KI-Training führen.