Der von dem US-amerikanischen Unternehmen Open AI entwickelte und im November verangenen Jahres veröffentlichte Chatbot ChatGPT (kurz für Chat Generative Pre-trained Transformer) zieht gerade nicht nur in KI-Kenner-Kreisen, sondern auch in der breiten Öffentlichkeit Aufmerksamkeit auf sich. Das Objekt dieser Aufmerksamkeit variiert dabei zwischen skurrilen Bing-Chatbot-Diskussionen (Stichwort: „I’m a good bing, you have been a bad user“) und den immaterialgüterrechtlichen Auswirkungen. In einem anderen Beitrag haben wir schon die rechtliche Situation bei KI-Bildgeneratoren beleuchtet – heute geht es um das geschriebene Wort.
Für diejenigen, die den Bot noch nicht probiert haben: ChatGPT verspricht, nahezu jede Frage mit einem algorithmisch erzeugten, sprachlich (weitgehend) korrekten Text zu beantworten. Der Anwendungsbereich ist theoretisch enorm: take home exams von Studierenden könnten sich von allein schreiben lassen – ebenso der nächste lästige Schriftsatz im Büro.
Bei einem solchen Einsatz generativer KI stellen sich urheberrechtliche Fragen, nämlich …
- Sind die von ChatGPT generierten Texte urheberrechtlich geschützt?
- Können die erstellten Texte Urheberrechte Dritter verletzen? Wie haftet dann?
Erste Station zur Orientierung: die allgemeinen Geschäftsbedingungen von ChatGPTs Anbieter OpenAI. Diese befassen sich mit dem Urheberrecht z.B. in Abschnitt 3 a).
- Hiernach seien die Nutzenden für den Input verantwortlich, aus dem ChatGPT dann neue Texte (den Output) generiert.
- OpenAI räumt dem Nutzenden außerdem alle Rechte ein, die am durch die KI generierten Text-Output entstehen. Allerdings behält man sich vor, In- und Output in dem Maße zu verwenden, der für das Angebot der KI, die rechtliche Compliance und die Übereinstimmung mit OpenAI‘s AGB erforderlich ist.
- Für die Compliance des Contents seien die Nutzenden verantwortlich.
Das ist alles schön und gut, beantwortet aber die Fragen nach der Urheberrechtsfähigkeit KI-generierter Texte ebensowenig wie die Frage, ob die generierten Ergebnisse wiederum Rechte anderer Urheber verletzen können.
Urheberschutz von KI-Erzeugnissen
Das Urheberrechtsgesetz erteilt der Schutzfähigkeit von KI-Texten eine klare Absage. Urheberrechtsfähig ist nach § 2 Abs. 2 UrhG eine persönliche geistige Schöpfung. Urheber im Sinne des § 8 UrhG kann daher nur ein Mensch sein. Das Urheberrecht erfasst nur menschlich-geistiges Schaffen. Selbst wenn Erzeugnisse aus einer KI menschlich geprägte Züge aufweisen, gilt nichts Anderes. Insofern kann an dem Output der KI kein Urheberrecht entstehen, welches gem. den AGB von OpenAI an den Nutzer lizenziert werden könnte.
Ein Urheberrecht durch menschliches Schaffen könnte aber entstehen, wenn der Einsatz der KI für die Entstehung des Ergebnisses nur technisches Hilfsmittel ist, die eigentliche schöpferische Tätigkeit also von einem Mensch – hier: dem Nutzer von ChatGPT – ausgeht. Dagegen spricht, dass die KI anhand der Vorgaben der Nutzer das Ergebnis selbständig erstellt, der Nutzer also nur marginal beeinflussen kann, was am Ende herauskommt. Nicht ausgeschlossen ist aber, dass die Vorgaben eines Nutzers an die KI so detailliert sind, dass ein Plot entsteht, der für sich gesehen Urheberschutz hat und die gedanklichen Züge des Nutzers klar erkennen lässt.
Urheberschutz eines KI-Erzeugnisses kommt im Übrigen dann in Frage, wenn der Nutzer den von der KI ausgeworfenen Text so verändert, dass er eigenschöpferische Züge des Nutzers aufweist.
- Urheberrechtsverletzung durch Nutzung von KI-Erzeugnissen
Wie aber sieht es mit einer Verletzung von bestehenden Urheberrechten durch KI-erzeugte Texte aus? Ein paar Anmerkungen dazu:
- Wortgetreue Wiedergaben von urheberrechtlich geschützten Texten stellen eine Vervielfältigung (§ 16 UrhG) dar und verletzten daher vorbehaltlich des Eingreifens von Schranken nach §§ 44a UrhG das Urheberrecht.
- Dass die Texte von einer KI stammen, spielt dabei keine Rolle. Entspricht also – was aber sehr unwahrscheinlich ist – ein Text einer KI einem bestehenden urheberrechtlich geschützten Text, würden die Urheberrechte infolge der Nutzung des KI-Ergebnisses verletzt. Haften würde in erster Linie der Verwender des Textes, also der Nutzer. Ist die Übereinstimmung zwischen KI-Erzeugnis und vorbestehendem Werk Zufall, wofür einiges spricht, wenn die KI nicht vorher durch den Nutzer explizit mit Blick auf das ältere Werk mit Informationen gefüttert worden ist, könnte auch eine „straflose“ Parallelschöpfung vorliegen. Diese Frage dürfte aber wegen des sehr unwahrscheinlichen Szenarios rein akademisch sein, zumal sich die Folgen durch Einsatz von Plagiatsscannern nach Erzeugung der KI-Texte vermeiden lassen.
- Werden durch den Nutzer im Prompt, also bei Fütterung der KI, umfangreich urheberrechtliche Texte kopiert, würde das an sich eine Urheberrechtsverletzung (durch Vervielfältigung) darstellen, allerdings dürfte das Entdeckungsrisiko gering sein.
- Fordert man den Chatbot auf, bestimmte vorbestehende Texte (zB einen Songtext) zu verändern, liegt hingegen eine menschlich gesteuerte durch die KI ausgeführte Bearbeitung vor (§ 23 Abs. 1 Satz 1 UrhG), die aber dann, insofern keine freie Benutzung nach § 23 Abs. 1 Satz 2 UrhG vorliegt, Urheberrechte verletzt. Bearbeitet der Nutzer den durch KI veränderten Text nochmals in einer Weise, die sich vom zugrunde liegenden Werk ausreichend entfernt kann gem. § 3 UrhG zugunsten des Nutzers ein (vom Urheberrecht des bearbeiteten Materials abhängiges) Bearbeiterurheberrecht entstehen.
Zum Schluss möchten wir dem Chatbot bezüglich seiner Urheberrechtskonformität das letzte Wort gewähren. Wir haben den Chatbot daher gefragt, ob es nach seiner eigenen Ansicht gegen das Urheberrecht verstößt. Die (übersetzte) Antwort sah so aus:
„Als KI-Sprachmodell generiert ChatGPT keine eigenen Inhalte. Stattdessen verwendet es Algorithmen des maschinellen Lernens, um Antworten zu generieren, die auf den Mustern basieren, die es aus der riesigen Menge an Daten gelernt hat, mit denen es trainiert wurde. Diese Daten umfassen ein breites Spektrum öffentlich zugänglicher Texte, wie Bücher, Artikel und Websites.
ChatGPT selbst ist nicht in der Lage, gegen das Urheberrecht zu verstoßen, da es keine eigenen Inhalte erstellt. Wenn Benutzer jedoch ChatGPT urheberrechtlich geschütztes Material zur Bearbeitung oder Verwendung zur Verfügung stellen, sind sie für eventuelle Urheberrechtsverletzungen verantwortlich.
Es ist immer wichtig, das Urheberrecht zu respektieren und die notwendigen Erlaubnisse einzuholen, bevor Sie urheberrechtlich geschütztes Material verwenden oder weitergeben. Wenn Sie irgendwelche spezifischen Bedenken bezüglich des Urheberrechts haben, ist es am besten, einen Rechtsexperten zu Rate zu ziehen.“
Das ist aber nicht die ganze Wahrheit. Wie in unserem Beitrag zur KI-Kunst erklärt, werden Anwendungen wie ChatGPT mithilfe von im Wege des Data Minings zusammengestellten Datensätzen trainiert. Es kann also schon beim Training der KI ein urheberrechtlich geschütztes Sprachwerk im Sinne des § 2 Abs. 1 Nr. 1 UrhG verwendet worden sein.
Urheberrechtsverletzungen durch Zugriff auf Werke zum Zwecke des Trainings einer KI
Wir haben ChatGPT daher gefragt, wie es mit diesen Trainingsdaten aussieht. Die Antwort ist:
„Die Texte, die zum Training von ChatGPT verwendet werden, stammen aus verschiedenen Quellen, darunter Bücher, Artikel, Webseiten und andere öffentlich zugängliche Texte. Bevor die Entwickler von ChatGPT einen Text für das Training verwenden, bemühen sie sich, sich zu vergewissern, dass der Text entweder öffentlich zugänglich ist oder unter einer geeigneten Open-Source-Lizenz verwendet werden darf.
In Fällen, in denen urheberrechtlich geschütztes Material für das Training verwendet wird, holen die Entwickler von ChatGPT normalerweise die Erlaubnis des Urheberrechtsinhabers ein oder verwenden das Material in Übereinstimmung mit den Richtlinien zur fairen Nutzung. Fair Use ist eine rechtliche Doktrin, die eine begrenzte Nutzung von urheberrechtlich geschütztem Material erlaubt, ohne dass eine Erlaubnis des Urheberrechtsinhabers eingeholt werden muss. Die genauen Grenzen der fairen Nutzung werden jedoch oft von Fall zu Fall festgelegt und können von Faktoren wie dem Zweck und dem Charakter der Nutzung, der Art des urheberrechtlich geschützten Werks, dem Umfang und der Wesentlichkeit des verwendeten Teils sowie der Auswirkung auf den potenziellen Markt oder den Wert des urheberrechtlich geschützten Werks abhängen.
Während ChatGPT selbst nicht gegen das Urheberrecht verstößt, achten die Entwickler von ChatGPT darauf, dass die Trainingsdaten, die zur Erstellung des Modells verwendet werden, in Übereinstimmung mit den geltenden Gesetzen und Vorschriften gewonnen und verwendet werden.“
ChatGPT spricht von „bemühen, sich zu vergewissern“ oder „normalerweise wird die Erlaubnis eingeholt“. Das ist alles recht vage. Auch gibt es die aus dem US-amerikanischen Recht stammende fair use-Doktrin im europäischen Urheberrecht nicht. Das durch EU-Richtlinien harmonisierte Urheberrecht beschränkt das Ausschließlichkeitsrecht des Urhebers aber durch die §§ 44a ff. UrhG. Der Zugriff auf urheberrechtlich geschützte Inhalte ist danach für Zwecke des Text und Data Mining gem. § 44b Abs. 1 UrhG erlaubt, solange die benutzten Vorlagen rechtmäßig zugänglich sind. Sie müssen aber, sobald sie nicht mehr erforderlich sind, gelöscht werden. Näheres hierzu auch in dem Beitrag von Constantin Berlage.
Insgesamt steckt wie bei Bildgeneratoren die rechtliche Bewertung von Textgeneratoren noch in den Kinderschuhen. Immerhin beginnt langsam eine Regulierung von künstlicher Intelligenz. So hat die EU-Kommission bereits einen Entwurf einer KI-Verordnung veröffentlicht. Bei diesem spielt geistiges Eigentum allerdings kaum eine Rolle. Im Vordergrund stehen vielmehr Anforderungen an Datenqualität und Cybersicherheit sowie die Transparenz von KI-Einsätzen. Dessen Inkrafttreten ist aber nicht vor 2025 zu erwarten. Zum Überbrücken der Wartezeit bietet sich aber an, die Folge des härting.fm-Podcasts zum Thema KI sowie das Webinar von Martin Schirmbacher und Andreas Lewald nachzuhören.