ChatGPT – Teil 6: Lizenzierungserfordernisse beim Training generativer KI
Generative KI-Modelle wie ChatGPT, DallE oder Midjourney können nur dann hochwertige Ergebnisse erzielen, wenn sie mit einer Vielzahl von Werken menschlichen Ursprungs trainiert wurden. In diesem sechsten Teil meiner Artikelserie untersuche ich die Erfordernisse an die Lizenzierung, die sich für das Training und die Verwendung von generativer KI ergeben.
KI als eigenständige Nutzungsform
Über die urheberrechtlichen Schranken hinaus kann in einigen Fällen die Notwendigkeit einer Lizenzierung für die urheberrechtliche Nutzung von Werken bestehen. Dies ist der Fall,
wenn tatsächlich urheberrechtlich geschützte Bestandteile übernommen bzw. als Erzeugnis der KI originalgetreu rekonstruiert werden.
wenn ein Nutzungsvorbehalt wirksam erklärt worden ist oder Vervielfältigungen von einem Trainings-Datensammler zur Erstellung einer Datenbank angefertigt werden.
In solchen Konstellationen wird somit eine Lizenzierung erforderlich, um in rechtlich zulässiger Weise eine KI trainieren zu können. Dabei scheint die Anfertigung einer Vervielfältigung zum Training einer KI eine eigenständige und neue Verwertungs- und Nutzungsform darzustellen, die im Urheberrechtsgesetz nicht als solche explizit genannt und bislang wohl auch nur äußerst selten – wenn überhaupt – in Lizenzverträgen geregelt sein wird.
Nutzungsrecht vereinbaren
Das entsprechende Nutzungsrecht kann auch nicht einfach als vereinbart vorausgesetzt werden, da der Vertragszweck nicht darauf ausgelegt sein wird. Häufig werden die Vertragsparteien an eine solche Nutzung überhaupt nicht gedacht haben.
Die Rolle der Verwertungsgesellschaften…
Angesichts der unabsehbaren Fülle potentiell betroffener Werke ist dabei vor allem problematisch, dass eine ordnungsgemäße lückenlose Lizenzierung zum Training von KI-Systemen oder der Nachbildung von Werken mittels generativer KI für denjenigen, der die Lizenzen erwerben muss, faktisch unmöglich ist. Dies wäre lediglich dann umsetzbar, wenn die Nutzungsrechte hinsichtlich sämtlicher Werke gebündelt über Verwertungsgesellschaften eingeräumt werden können.
Soweit ersichtlich hat jedoch bislang keine in Deutschland zugelassene Verwertungsgesellschaft – v.a die diesbezüglich besonders relevanten VG Wort, VG Bild-Kunst und GEMA – sich diese spezifische Nutzungsmöglichkeit im Rahmen der Berechtigungsverträge ausdrücklich einräumen lassen. Die konkludente Einbeziehung scheitert wiederum an § 31 Abs. 5 UrhG.
… und ihre Grenzen
Dabei ist auch zu sehen, dass öffentlich zugängliche Werke in vielen Fällen nicht dem Repertoire einer Verwertungsgesellschaft unterfallen werden: Auch Webseiten, Blogbeiträge nebst den hierbei eingebundenen Melodien, grafischen Elementen oder Videosequenzen können urheberrechtlich geschützt sein. Ebenso kann dies auf user-generated content in sozialen Netzwerken zutreffen, wie etwa schon im Falle eines Tweets. Gerade auch solche Inhalte können für das Training einer KI bedeutsam sein. Sie sind häufig allerdings auf keinem üblichen Vertriebsweg verfügbar und es wird meist auch kein Wahrnehmungs- oder Berechtigungsvertrag mit einer Verwertungsgesellschaft vorliegen.
Kollektive Lizenzen mit erweiterter Wirkung
Die Schwierigkeiten einer umfassenden Lizenzierung würden sich rechtssicher nur dadurch lösen lassen, dass die Berechtigungsverträge entsprechend angepasst werden und von dem Instrument kollektiver Lizenzen mit erweiterter Wirkung Gebrauch gemacht wird. Diese haben den entscheidenden Vorteil, dass auch in Bezug auf Werke von Außenstehenden eine Lizenzierung erfolgen kann.
Lediglich die Anforderungen nach § 51a Abs. 1 VGG müssen eingehalten werden, wozu insbesondere gehört, dass die Verwertungsgesellschaft repräsentativ, die Einholung der Nutzungserlaubnis von allen betroffenen Außenstehenden unzumutbar und die Rechtseinräumung auf Nutzungen im Inland beschränkt ist. Die Repräsentativität gerade der maßgeblichen Verwertungsgesellschaften für Sprach- und Musikwerke sowie solche der bildenden Kunst und Lichtbildwerke dürfte außer Frage stehen, vor allem ist aber die Rechteeinholung hinsichtlich sämtlicher für das Webscraping verwendeter Werke angesichts der schier unüberschaubaren Anzahl derselben als unzumutbar anzusehen.
Publikationserfordernisse einhalten
Wichtig ist allerdings, dass die kollektive Lizenz nur dann richtig funktionieren kann, wenn die Publikationserfordernisse eingehalten sind und kein Widerspruch eines Außenstehenden eingetragen worden ist. An diesen Informationen fehlt es bislang jedoch ebenso wie an den entsprechenden Tarifen. Insofern besteht seitens der Verwertungsgesellschaften dringender Handlungsbedarf.
In Anbetracht der damit ermöglichten Generierung ähnlicher Werke durch KI wird die Klärung dieser Lizenzierungsfragen für intensive Diskussionen mit den Mitgliedern sorgen, deren Werke von dieser neuen Nutzungsform betroffen sind. Schließlich steht zu befürchten, dass den Urhebern hierdurch Einnahmen verloren gehen. Dies gilt insbesondere im Hinblick auf eine potentiell mögliche „Verdrängungswirkung“ generativer KI und der von dieser geschaffenen Erzeugnisse. Die Auswirkungen dieser neuen technischen Möglichkeit auf den Bereich kreativen Tätigwerdens und die Verwertungsmöglichkeiten der Kreativschaffenden ist gegenwärtig noch unabsehbar.
Wir unterstützen Sie dabei, relevante Entwicklungen im IT-Recht im Blick zu behalten beraten bei allen Aspekten rund um die Digitalisierung und den Einsatz von KI und Legal Tech. Dabei helfen wir ihnen, Themen zu identifizieren und vertraglich zu regeln.
Bisher erschienen:
ChatGPT – Teil 1: Welche Auswirkungen hat Generative KI auf den Rechtsbereich?
ChatGPT – Teil 2: Anwendungsfälle bei Strafverfolgung und Gefahrenabwehr
ChatGPT – Teil 3: Generative KI in der richterlichen Urteilsfindung
ChatGPT - Teil 5: Urheberrechtliche Fragen beim Training generativer KI
Dr. Daniel Kögel,
Fachanwalt für Urheber- und Medienrecht
koegel@web-partner.de