Urheberrecht | Urteil der GEMA gegen Open AI (LG)
Das Landgericht München I hat den von der GEMA gegen zwei
Unternehmen der Unternehmensgruppe Open AI geltend gemachten Ansprüchen auf
Unterlassungs-, Auskunfts- und Schadensersatz im Wesentlichen stattgegeben.
Soweit die Klägerin darüber hinaus Ansprüche auf Grund einer Verletzung des
allgemeinen Persönlichkeitsrechts wegen fehlerhafter Zuschreibung veränderter
Liedtexte geltend gemacht hat, hat die Kammer die Klage abgewiesen (LG München
I, Urteil v. -42 O 14139/24, nicht
rechtskräftig).
Sachverhalt: Das Urteil betrifft die Liedtexte neun bekannter deutscher Urheberinnen und Urheber (darunter „Atemlos“ von Kristina Bach oder „Wie schön, dass du geboren bist“ von Rolf Zuckowski).
Die Klägerin ist die GEMA und hat die Ansprüche als solche geltend gemacht. Zur Begründung hatte sie vorgetragen, die Liedtexte seien in den Sprachmodellen der Beklagten memorisiert und würden bei Nutzung des Chatbots auf einfache Anfragen der Nutzer als Antworten (Outputs) in weiten Teilen originalgetreu ausgegeben.
Die Beklagten sind Betreiber von Sprachmodellen und darauf basierender Chatbots. Sie hatten gegen die erhobenen Ansprüche eingewandt, ihre Sprachmodelle speicherten oder kopierten keine spezifischen Trainingsdaten, sondern reflektierten in ihren Parametern, was sie basierend auf dem gesamten Trainingsdatensatz erlernt hätten. Da die Outputs nur als Folge von Eingaben von Nutzern (Prompts) generiert werden würden, seien nicht die Beklagten, sondern der jeweilige Nutzer als Hersteller des Outputs für diese verantwortlich. Ohnehin seien eventuelle Rechtseingriffe von den Schranken des Urheberrechts, insbesondere der Schranke für das sogenannten Text- und Data-Mining gedeckt.
Der Klägerin stehen die geltend gemachten Ansprüche sowohl aufgrund der gegebenen Vervielfältigung der Texte in den Sprachmodellen als auch durch ihre Wiedergabe in den Outputs zu:
Sowohl durch die Memorisierung in den Sprachmodellen als auch durch die Wiedergabe der Liedtexte in den Outputs des Chatbot liegen Eingriffe in die urheberrechtlichen Verwertungsrechte vor. Diese sind nicht durch Schrankenbestimmungen, insbesondere die Schranke für das Text und Data Mining gedeckt.
Nach Überzeugung der Kammer sind die streitgegenständlichen Liedtexte reproduzierbar in den Sprachmodellen 4 und 4o der Beklagten enthalten.
Aus der informationstechnischen Forschung ist bekannt, dass Trainingsdaten in Sprachmodellen enthalten sein können und sich als Outputs extrahieren lassen (sog. Memorisierung). Eine Memorisierung liegt vor, wenn die Sprachmodelle beim Training dem Trainingsdatensatz nicht nur Informationen entnehmen, sondern sich in den nach dem Training spezifizierten Parametern eine vollständige Übernahme der Trainingsdaten findet.
Eine solche Memorisierung ist durch einen Abgleich der Liedtexte, die in den Trainingsdaten enthalten waren, mit den Wiedergaben in den Outputs festgestellt. Angesichts der Komplexität und Länge der Liedtexte ist der Zufall als Ursache für die Wiedergabe der Liedtexte ausgeschlossen.
Durch die Memorisierung ist eine Verkörperung als Voraussetzung der urheberrechtlichen Vervielfältigung der streitgegenständlichen Liedtexte durch Daten in den spezifizierten Parametern des Modells gegeben. Die streitgegenständlichen Liedtexte sind reproduzierbar in den Modellen festgelegt.
Gemäß Art. 2 InfoSoc-RL liegt eine Vervielfältigung „auf jede Art und Weise und in jeder Form“ vor. Die Festlegung in bloßen Wahrscheinlichkeitswerten ist hierbei unerheblich.
Neue Technologien wie Sprachmodelle sind vom Vervielfältigungsrecht nach Art. 2 InfoSoc-RL und § 16 UrhG erfasst. Nach der Rechtsprechung des Unionsgerichtshofes ist für die Vervielfältigung ausreichend eine mittelbare Wahrnehmbarkeit, die gegeben ist, wenn das Werk unter Einsatz technischer Hilfsmittel wahrgenommen werden kann.
Diese Vervielfältigung in den Modellen ist weder durch die Schrankenbestimmungen des Text und Data Mining des § 44b UrhG noch durch § 57 UrhG als unwesentliches Beiwerk gedeckt.
Zwar unterfallen Sprachmodelle grundsätzlich dem Anwendungsbereich der Text und Data Mining Schranken. Die Vorschriften decken erforderliche Vervielfältigungen beim Zusammenstellen des Datenkorpus für das Training, wie etwa die Vervielfältigung eines Werks durch seine Überführung in ein anderes (digitales) Format oder Speicherungen im Arbeitsspeicher.
Hintergrund hierfür ist der Gedanke, dass diese Vervielfältigungen lediglich zu nachfolgenden Analysezwecken erstellt werden und damit die Verwertungsinteressen des Urhebers am Werk nicht beeinträchtigen. Da diese für das Text und Data Mining rein vorbereitenden Handlungen kein Verwertungsinteresse berühren, sieht das Gesetz keine Vergütungspflicht gegenüber dem Urheber vor.
Werden beim Training – wie hier - nicht nur Informationen aus Trainingsdaten extrahiert, sondern Werke vervielfältigt, stellt dies nach Auffassung der Kammer kein Text und Data Mining dar. Die Prämisse des Text und Data Mining und der diesbezüglichen Schrankenbestimmungen, dass durch die automatisierte Auswertung von bloßen Informationen selbst keine Verwertungsinteressen berührt sind, greift in dieser Konstellation nicht. Im Gegenteil, durch die gegebenen Vervielfältigungen im Modell wird in das Verwertungsrecht der Rechteinhaber eingegriffen.
Eine andere, mutmaßlich technik- und innovationsfreundliche Auslegung, die ebenfalls Vervielfältigungen im Modell von der Schranke als gedeckt ansehen wollte, verbietet sich angesichts des klaren Wortlauts der Bestimmung.
Auch eine analoge Anwendung kommt nicht in Betracht. Selbst wenn man eine planwidrige Regelungslücke annehmen will, weil dem Gesetzgeber die Memorisierung und eine damit einhergehende dauerhafte urheberrechtlich relevante Vervielfältigung in den Modellen nicht bewusst gewesen sein sollte, mangelt es an einer vergleichbaren Interessenlage. Die Schrankenregelung normiert mit der Zulässigkeit vorbereitender Vervielfältigungshandlungen beim Text und Data Mining einen Sachverhalt, bei dem die Verwertungsinteressen der Urheber nicht gefährdet sind, weil bloße Informationen extrahiert und das Werk als solches gerade nicht vervielfältigt wird.
Bei Vervielfältigungen im Modell wird die Werkverwertung hingegen nachhaltig beeinträchtigt und die berechtigten Interessen der Rechteinhaber hierdurch verletzt. Die Urheber und Rechteinhaber werden durch eine analoge Anwendung der Schrankenbestimmung, die keine Vergütung für die Verwertung vorsieht, somit schutzlos gestellt. Das Risiko der Memorisierung stammt allein aus der Sphäre der Beklagten. Bei einer Analogie der Schranke würde ausschließlich der verletzte Rechteinhaber dieses Risiko tragen.
Mangels Vorliegens eines Hauptwerks stellen die Vervielfältigungen der streitgegenständlichen Liedtexte kein unzulässiges Beiwerk nach § 57 UrhG dar. Entgegen der Ansicht der Beklagten sind die Liedtexte nicht neben dem gesamten Trainingsdatensatz als nebensächlich und verzichtbar anzusehen. Hierfür wäre erforderlich, dass es sich bei dem gesamten Trainigsdatensatz ebenfalls um ein urheberrechtlich geschütztes Werk handelt.
Der Eingriff der Beklagten in die Verwertungsrechte der Klägerin ist auch nicht durch eine Einwilligung der Rechteinhaber gerechtfertigt, da das Training von Modellen nicht als eine übliche und erwartbare Nutzungsart zu werten ist, mit der der Rechteinhaber rechnen muss.
Auch durch Wiedergabe der Liedtexte in den Outputs des Chatbots haben die Beklagten nach der Entscheidung der Kammer unberechtigt die streitgegenständlichen Liedtexte vervielfältigt und öffentlich zugänglich gemacht. In den Outputs waren die originellen Elemente der Liedtexte stets wiedererkennbar.
Hierfür sind die Beklagten und nicht die Nutzer verantwortlich. Die Outputs sind durch einfach gehaltene Prompts generiert worden. Die Beklagten betreiben die Sprachmodelle, für die die Liedtexte als Trainingsdaten ausgewählt und mit denen sie trainiert worden sind. Sie sind für die Architektur der Modelle und die Memorisierung der Trainingsdaten verantwortlich. Damit haben die von den Beklagten betriebenen Sprachmodelle die ausgegebenen Outputs maßgeblich beeinflusst, der konkrete Inhalt der Outputs wird von den Sprachmodellen generiert.
Der Eingriff in die Verwertungsrechte durch die Outputs ist ebenfalls nicht durch eine Schrankenbestimmung gedeckt.
Das Urteil ist nicht rechtskräftig.
Quelle: LG München I, Pressemitteilung v. (il)
Fundstelle(n):
FAAAK-03759