Kommentar von Dr. Christoph Matras, FPS Data Scraping und Urheberrecht beim Training von KI-Modellen

Von Dr. Christoph Matras 4 min Lesedauer

Anbieter zum Thema

Das Landgericht Hamburg hat als erstes europäisches Gericht zur urheberrechtlichen Zulässigkeit von Data Scraping für das Training von KI-Modellen entschieden (Urteil vom 27.09.2024, Az. 310 O 227/23). Dabei handelt es sich um eine richtungsweisende Entscheidung, die grundlegende Fragen zum Spannungsverhältnis zwischen Künstlicher Intelligenz und Urheberrecht beleuchtet. Besonders im Fokus steht die Anwendung der urheberrechtlichen Schrankenregelungen zum Text- und Data-Mining gemäß §§ 44b und 60d UrhG.

Der Autor: Dr. Christoph Matras ist Rechtsanwalt bei der Kanzlei FPS in Frankfurt(Bild:  ©2020 Michael Keinespel no publication without credit)
Der Autor: Dr. Christoph Matras ist Rechtsanwalt bei der Kanzlei FPS in Frankfurt
(Bild: ©2020 Michael Keinespel no publication without credit)

Künstliche Intelligenz (KI) benötigt immense Datenmengen für das Training. Data Scraping, also das automatisierte Sammeln von Inhalten aus dem Internet, spielt dabei eine zentrale Rolle. In der Praxis werden für das KI-Training oft urheberrechtlich geschützte Werke genutzt, was eine Vielzahl rechtlicher Fragestellungen aufwirft. Besonders relevant ist die Frage, ob diese Nutzung durch bestehende Schranken des Urheberrechts, wie sie im deutschen Urhebergesetz (UrhG) geregelt sind, gedeckt ist.

Der Fall: LAION e. V. und die Nutzung von Bildmaterial

Im vorliegenden Fall klagte ein Produzent und Fotograf von Stockfotos gegen den gemeinnützigen Verein LAION e. V., der große Datensätze für das Training von KI-Modellen bereitstellt. LAION nutzt für die Erstellung dieses Datensatzes, der bisweilen an die sechs Milliarden Bild-Text-Paare umfasst, ebendieses Data Scraping. Hierbei wurde auch ein Werk des Klägers ohne dessen Zustimmung einbezogen. Dieser versuchte nun, die Verwendung seines Fotos durch gerichtliche Entscheidung zu untersagen.

Urheberrechtliche Bewertung: Vervielfältigung und Schrankenregelungen

Das Landgericht Hamburg entschied zugunsten von LAION und wies die Klage ab. Das Gericht erkannte an, dass Data Scraping grundsätzlich eine urheberrechtlich relevante Vervielfältigung gemäß § 16 UrhG darstellt. Allerdings könne sich LAION auf die Schrankenregelung des § 60d UrhG berufen, die Text- und Data-Mining für wissenschaftliche Zwecke erlaubt. Diese Regelung basiert auf der Umsetzung der Digital Single Market Directive (DSM-RL) und ermöglicht das Speichern von Daten zum Zwecke der Forschung, ohne jedoch die Zustimmung des Urhebers einzuholen und ohne ihn hierfür zu vergüten. Das Gericht stellte fest, dass LAION die Daten jedenfalls auch zum Zwecke der Wissenschaft zur Verfügung stellt, was für die Anwendbarkeit der Schrankenregelung genügen solle. Die kommerzielle Nutzung durch Dritte, die ebenfalls auf den Datensatz zugreifen können, ändere laut dem Gericht nichts an dieser Einordnung, da der primäre Zweck hier von wissenschaftlicher Natur sei.

Das Obiter Dictum zur Schranke des § 44b UrhG

Besonders interessant ist die Stellungnahme des Gerichts zur Schranke des § 44b UrhG. Diese Norm regelt das Text- und Data Mining für gerade solche vordergründig kommerziellen Zwecke. Das Landgericht äußerte sich in einem (nicht abschließenden) Obiter Dictum dazu, dass Data Scraping auch unter diese Schranke fallen könne. In Einklang mit weiten Teilen der Literatur geht das Gericht davon aus, dass die Schrankenregelung auch für das Training von generativen KI-Modellen gilt. Auch eine kommerzielle Nutzung sei durch diese Schranke daher gedeckt, solange ein entsprechender Nutzungsvorbehalt vom Urheber nicht geltend gemacht werde. Ein solcher Nutzungsvorbehalt als Gegenausnahme sieht § 44b Abs. 3 S. 2 UrhG zugunsten von Urhebern ausdrücklich vor.

Hier offenbart sich eine gewisse Urheberfreundlichkeit des Landgerichts. Das Gericht entschied, dass ein in natürlicher Sprache verfasster Vorbehalt ausreiche, um das Data Mining zu untersagen. Es sei gerade nicht erforderlich, wie dies weite Teile der Rechtsliteratur vertreten, dass dieser Vorbehalt in einer spezifischen technischen lesbaren Form vorliege. Es genüge also jede jedenfalls „maschinenlesbare“ Form, was in der Praxis derzeit Unsicherheiten zu erzeugen geeignet ist, jedenfalls solange eine klare technische Implementierung solcher Vorbehalte nicht umfassend etabliert ist.

Forschung vs. kommerzielle Nutzung: Der schmale Grat

Ein zentrales Thema des Urteils war die Abgrenzung zwischen wissenschaftlicher und kommerzieller Nutzung. Das Gericht erkannte, dass die Verwendung von Daten durch kommerzielle Akteure nicht zwangsläufig den wissenschaftlichen Charakter des zugrundeliegenden Projekts infrage stellt. Für die Anwendung von § 60d UrhG sei entscheidend, dass die Daten auch Forschenden kostenfrei zugänglich gemacht werden. Die inzident ermöglichte Nutzung durch kommerzielle Akteure ändere nichts an der Qualifikation der Sammlung als „für Zwecke der wissenschaftlichen Forschung“.

Diese weite Auslegung ist kritisch zu sehen, ermöglicht sie, dass kommerzielle Unternehmen durch die breite Auslegung des Forschungsbegriffs die Schranke des § 60d UrhG missbräuchlich nutzen könnten. Um dem entgegenzusteuern, sollte der Fokus vielmehr auch stets auf den Gesamtzusammenhang der Datensammlung und den tatsächlichen Nutzungszweck gelegt werden.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zur IT-Sicherheit

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

Auswirkungen auf die Praxis

Das Urteil des Landgerichts Hamburg stellt einen wichtigen Beitrag in der juristischen Bewertung von Data Scraping für das Training von KI-Modellen in der EU. Es stärkt die Position von Unternehmen und Forschungseinrichtungen, indem es die Anwendbarkeit der Schrankenregelungen für Text- und Data Mining (§ 44b und § 60d UrhG) bestätigt. Dabei ist aber auch weiterhin besonders die Entwicklung zur Auslegung des § 44b UrhG zu beobachten, der kommerzielles Data Mining erlaubt, was in der Praxis große Bedeutung hat.

Das Urteil nimmt Urheber, die die Verwertung ihrer Werke in einer solchen Weise nicht wünschen, in die Pflicht, ihre Werke durch explizite Nutzungsvorbehalte zu schützen, um das Data Scraping durch kommerzielle Unternehmen zu verhindern. Unklar ist dabei – obwohl zu befürworten – ob ein einfacher Nutzungsvorbehalt beispielsweise in den Nutzungsbedingungen ausreicht. Insoweit wirft das Urteil auch Fragen auf, die noch nicht abschließend geklärt sind. Insbesondere die Auslegung des § 44b UrhG sowie die Anforderungen an Nutzungsvorbehalte müssen weiter präzisiert werden.

Für die Praxis bedeutet dies, dass Entwickler von KI-Modellen verstärkt auf die Rechtssicherheit ihrer Datenquellen achten müssen, während Urheber klare Schutzmechanismen etablieren sollten. Das Urteil zeichnet insoweit das bestehende Spannungsfeld zwischen technologischem Fortschritt und dem Schutz kreativer Werke nach, das in der Zukunft weiter an Bedeutung gewinnen wird und noch auszudifferenzieren gilt und damit weiterhin ein zentrales Thema der Rechtsprechung und Rechtspraxis bleiben wird.

Artikelfiles und Artikellinks

(ID:50283855)