KI und Urheberrecht

KI und Urheberrecht (D/EU) – Transparenz, Lizenzen, DSGVO

Geschrieben am 15. September 2025 von Der Webfuchs

Akualisiert am 15. September 2025
Voraussichtliche Lesezeit 7 min

KI und Urheberrecht – dieser Guide erklärt Transparenz, Lizenzen, TDM-Opt-out und DSGVO für Webmaster in D/EU.

Hinweis: Dieser Beitrag ersetzt keine Rechtsberatung. Er bietet Orientierung für Webmaster/Publisher in D/EU.

Kurzfassung

  • Urheberrecht: Schutz gibt es nur für menschliche Werke. Rein KI-generierte Inhalte sind in der Regel nicht geschützt; Schutz kann entstehen, wenn Deine kreative Leistung prägend ist. (Deutsches Patent- und Markenamt)
  • Training & TDM: In der EU gibt es Text-und-Data-Mining-Ausnahmen (DSM-RL Art. 3/4). Deutschland: § 44b UrhG (allgemeines TDM, mit Opt-out), § 60d UrhG (Forschung, ohne Opt-out). Opt-out muss maschinenlesbar erfolgen. (EUR-Lex)
  • AI-Act (EU): Transparenzpflichten u.a. Kennzeichnung generierter/manipulierter Medien („Deepfakes“), Hinweis bei Chatbots/GenAI, Trainingsdaten-Zusammenfassungen für GPAI-Modelle. Teile gelten bereits; weitere greifen gestaffelt bis 2026. (European Commission)
  • DSGVO: Für personenbezogene Daten benötigst Du eine Rechtsgrundlage (z.B. berechtigte Interessen mit Interessenabwägung), Transparenz, Datenminimierung und ggf. DPIA. Aufsichtsbehörden sehen Modelltraining als Verarbeitung i. S. d. DSGVO. (EDPB)
  • Praxis: Kennzeichne KI-Einsatz transparent, prüfe Lizenzen (insb. Bilder/Datenbanken), setze TDM-Opt-outs falls gewünscht, halte eine Rechte-/Quellenliste pro Post vor und ergänze Datenschutz-/Impressumsangaben konsistent.

KI & Urheberrecht im Überblick: Was geschützt ist, welche Opt-outs gelten und wie Du DSGVO-Pflichten sicher erfüllst.

Was ist (urheber-)rechtlich überhaupt geschützt?

Grundsatz: Urheberrecht schützt „persönliche geistige Schöpfungen“ – also Werke, die von Menschen stammen und eine gewisse Individualität aufweisen. In Deutschland können nur natürliche Personen Urheber sein. (Deutsches Patent- und Markenamt)

Konsequenz für KI-Outputs:

  • Ohne prägenden menschlichen Beitrag (bloße Prompt-Eingabe, rein automatisch generiertes Ergebnis) besteht i. d. R. kein Urheberrechtsschutz am Output.
  • Mit maßgeblicher menschlicher Gestaltung (Auswahl, Arrangement, Bearbeitung, inhaltliche Kuratierung) kann Schutz entstehen – deine schöpferische Leistung zählt.

Praxis-Tipp: Dokumentiere kurz, welche kreativen Entscheidungen du getroffen hast (Briefing, Auswahl, Editing). Das hilft, die menschliche Prägung zu belegen.

Entscheidungsbaum: Rein KI-generiert meist ohne Schutz; mit prägender menschlicher Gestaltung Schutz möglich.
Schutz entsteht durch menschliche, prägende Gestaltung.

Training, Scraping & Text-/Data-Mining (TDM): Was ist erlaubt?

EU-Rahmen (DSM-Richtlinie)

  • Art. 3 (Forschung): Erlaubt TDM für Forschungseinrichtungen/Kulturerbe-Institutionenkein Opt-out.
  • Art. 4 (Allgemein): Erlaubt TDM für alle Zwecke, aber Rechteinhaber können das „in geeigneter Weise“ vorbehalten (Opt-out, maschinenlesbar). (EUR-Lex)

Deutschland (Umsetzung)

  • § 60d UrhG (Forschung): TDM für nicht kommerzielle Forschung. Kein Opt-out. (Gesetze im Internet)
  • § 44b UrhG (allgemeines TDM): Grundsätzlich erlaubt; Opt-out möglich, wenn Rechteinhaber den Vorbehalt maschinenlesbar kennzeichnen. (Gesetze im Internet)

Praktische Opt-out-Signale (branchenüblich)

Rechtlich ist die „geeignete“ Form nicht abschließend normiert. In der Praxis setzen Anbieter und Publisher u. a. auf:

  • robots.txt für spezifische Crawler:
    • OpenAI GPTBot User-agent: GPTBot Disallow: / (offizielle Doku. OpenAI-Plattform/Alternativ chrisleverseo.com)
    • Common Crawl / CCBot User-agent: CCBot Disallow: / (Offizielle Doku/FAQ. commoncrawl.org)
    • Google-Extended (Kontrolle für Nutzung in Gemini/Vertex AI – kein Einfluss auf Indexierung/Ranking) User-agent: Google-Extended Disallow: / (Google-Ankündigung/Docs; Note: Steuert AI-Training, nicht SGE-Darstellung.) (blog.google)
  • Bing-Steuerung: Microsoft hat ergänzende Meta-Steuerungen für die Nutzung in Bing Chat/Archive kommuniziert (z.B. noarchive/nocache). (blogs.bing.com)

Wichtig: robots.txt ist freiwillig zu beachten – seriöse Crawler respektieren sie, andere ggf. nicht. Ein 100 %-Schutz vor Scraping existiert nicht. (Kontext/Branchenberichte.) (WIRED)

Flow-Grafik: TDM-Opt-out über robots.txt für GPTBot, CCBot und Google-Extended.
TDM-Opt-out per robots.txt – so setzt du das Signal.

Darf ich KI-Outputs einfach nutzen – und wem „gehören“ sie?

  • Urheberrechte Dritter: Auch wenn Dein Output selbst evtl. nicht geschützt ist, kann er fremde Rechte verletzen (z. B. stilistische Annäherung + übernommene Elemente, Bild-Trainingsartefakte, Logos, geschützte Figuren).
  • Persönlichkeits-/Kennzeichenrechte: Namen, Marken, Logos, erkennbare Personen/Privaträume können Rechte berühren (Markenrecht, Recht am eigenen Bild/Namen etc.).
  • Menschliche Mit-Schöpfung: Wenn Du substanziell redigierst, kuratierst, kompilierst, Layout und Auswahl prägst, kann Bearbeiter-/Sammelwerksschutz greifen (§§ 3, 4 UrhG). (Urheberrecht)

Praxis-Tipp: Für Bilder nutze verlässliche Quellen/Lizenzen (Stock mit klaren AI-Klauseln), führe Quellenliste je Artikel (Assets, Rechte, Lizenznummern) und speichere Nachweise.

Lizenzen und Datenbanken korrekt nutzen

  • Creative-Commons (CC):
    • CC-BY: Attribution verpflichtend.
    • CC-BY-SA: Share-Alike – abgeleitete Werke gleichermaßen lizenzieren.
    • CC-BY-NC: Nicht kommerziell – für viele Unternehmensseiten unpassend.
    • CC-BY-ND: No Derivatives – keine Bearbeitungen.
  • Datenbankrecht (EU): Auch nicht urheberrechtlich geschützte Inhalte können durch Datenbank-Sui-generis-Rechte geschützt sein (Entnahme/Weiterverwendung wesentlicher Teile vermeiden; lieber aggregierte/abgeleitete Werte).
  • Stock/Tools: AGB prüfen (z.B. „Allowed Use“ für KI-Training/Generierung, kommerzielle Nutzung, Sensitiv-Use-Klauseln).

Praxis-Tipp: Schreibe eine kurze Lizenz-Policy: „Welche Quellen erlaubt sind, wie zu attribuieren ist, wo Nachweise abgelegt werden.“

CC-Lizenzen kompakt: BY, BY-SA, BY-NC, BY-ND mit Erlaubnis/Auflagen
CC-Varianten: Erlaubtes & Auflagen im Kurzformat

Transparenzpflichten nach EU-AI-Act

Der AI Act enthält gestaffelte Pflichten, u.a.:

  • Interaktion mit KI: Nutzer müssen erkennen, dass sie mit KI interagieren (z.B. Chat-Widget). (European Commission)
  • KI-generierte/manipulierte Medien („Deepfakes“): Kennzeichnungspflicht für generierte bzw. veränderte Bild-/Audio-/Video-Inhalte – mit eng begrenzten Ausnahmen (z.B. Kunst/Satire, wenn Kennzeichnung den Zweck vereitelt). (Europäisches Parlament)
  • GPAI/Modell-Transparenz: Für allgemeine KI-Modelle (z.B. Foundation/GPAI) gelten zusätzliche Dokumentations-/Transparenzanforderungen, inkl. „summaries of copyrighted data used for training“ (Modell-Ebene). Erste Teile greifen ab 2. August 2025. (Digitale Strategie der EU)

Nationale Umsetzung: Einige Staaten (z.B. Spanien) planen eigene Sanktionen bei fehlender Kennzeichnung. Rechne mit wachsender Durchsetzung. (Reuters)

ai act kennzeichnung 1
AI-Act: Die drei Transparenzpflichten im Blick.

DSGVO: Wenn KI auf personenbezogene Daten trifft

Die Datenschutzaufsicht (EDPB) betont: Training, Feintuning und Bereitstellung von KI mit personenbezogenen Daten ist Verarbeitung – es gelten sämtliche DSGVO-Pflichten: Rechtsgrundlage, Transparenz, Zweckbindung, Datenminimierung, Betroffenenrechte etc. (EDPB)

Praxis-Checkliste DSGVO für Webmaster:

  1. Rechtsgrundlage definieren: z.B. berechtigte Interessen (Art. 6 (1)(f)) mit dokumentierter Interessenabwägung; bei besonderen Kategorien Daten sehr vorsichtig (Art. 9). (EDPB-Leitlinien beachten.) (EDPB)
  2. DPIA (Datenschutz-Folgenabschätzung): Wenn hohes Risiko (z.B. Profiling, große Datenmengen). (EDPB)
  3. Transparenz: Datenschutzerklärung um KI-Nutzung, Zwecke, Empfänger (z.B. API-Provider), Speicherdauer, Opt-outs erweitern. (EDPB)
  4. Datenminimierung: Keine unnötigen Rohdaten/Prompts speichern; Log-Retention beschränken. (EDPB)
  5. Auftragsverarbeitung: AVV/Standardvertragsklauseln mit Tool-/Cloud-Anbietern prüfen.
  6. Betroffenenrechte: Auskunft, Löschung, Widerspruch (insb. gegen „Training“) prozessual sicherstellen. (EDPB)
DSGVO-Checkliste für KI-Prozesse: Rechtsgrundlage, DPIA, Transparenz, Datenminimierung, AVV
Die sechs DSGVO-Pflichten, die du beim KI-Einsatz prüfen solltest.

Praxis-Bausteine (Mustertexte & Policies)

Hinweis: Muster sind Anregungen ohne Gewähr – bitte auf Deine Prozesse/Länderspezifika anpassen.

Transparenzbox im Artikel

Transparenz-Hinweis: Dieser Beitrag wurde unter Einsatz von KI-Assistenz erstellt (Recherche/Entwurf/Qualitätscheck). Redaktionelle Auswahl, Struktur und finale Fassung stammen von [Autor:in]. Quellen und Belege sind im Text verlinkt. Zuletzt aktualisiert am: [Datum].

Kennzeichnung generierter Medien

Hinweis zu Bild/Video: Dieses Medium wurde mithilfe von KI generiert bzw. nachträglich bearbeitet. Inhaltliche Verantwortung: [Redaktion/Autor:in]. (Weitere Details auf Anfrage.)

Impressum/Datenschutz – Zusatzpassus (DSGVO)

Einsatz von KI-Assistenzsystemen: Wir verwenden KI-gestützte Dienste für Recherche, Text-/Bild-Entwürfe und Qualitätssicherung. Dabei verarbeiten wir nur die hierfür erforderlichen Daten und beachten die Grundsätze der DSGVO (Art. 5). Anbieter-Informationen, Speicherdauer und Widerspruchsmöglichkeiten finden Sie in den Abschnitten [X] dieser Datenschutzerklärung.

Lizenz-/Quellenprotokoll (intern)

  • Quelle/Asset, Lizenztyp (z.B. CC-BY 4.0, Stock-ID), Nutzungsumfang, Attributions-Text, Ablageort des Nachweises, Datum.

TDM-Opt-out (Beispiel robots.txt)

# KI- und TDM-bezogene Crawler (branchenübliche Tokens)
User-agent: GPTBot
Disallow: /

User-agent: CCBot
Disallow: /

User-agent: Google-Extended
Disallow: /

(Detail-Docs siehe oben; steuert nicht Indexierung/Ranking.) (offizielle Doku. OpenAI-Plattform/Alternativ chrisleverseo.com)

Häufige Fehler (und wie Du sie vermeidest)

  • Keine Kennzeichnung von Deepfakes/Gen-Medien → Transparenzpflichten prüfen, Label einführen. (Europäisches Parlament)
  • „Alles erlaubt, weil KI“ → Falsch. Urheber-, Marken-, Persönlichkeits- und Datenbankrechte gelten weiter.
  • TDM-Opt-out vergessen → Wenn Du kein Training willst, maschinenlesbar vorbehalten. (EUR-Lex)
  • DSGVO nur fürs Frontend gedacht → Training/Logs/Prompts sind Verarbeitung; Rechtsgrundlage + DPIA prüfen. (EDPB)
  • Lizenztexte ignoriert → CC-Varianten/Stock-AGB sauber lesen (NC/ND/SA).
  • robots.txt überschätzt → Gute Crawler respektieren sie; ein paar nicht – ergänzende Schutzmaßnahmen erwägen. (WIRED)

Roadmap 2025: Was Du jetzt konkret umsetzt

  1. Transparenz & Labels: KI-Hinweise in Artikel-Templates/Medien-Credits ausrollen. (AI-Act-Konformität vorbereiten.) (Europäisches Parlament)
  2. Lizenz-Policy: Internes Playbook (erlaubte Quellen, Attributions-Pflicht, Nachweisdokumentation).
  3. TDM-Entscheidung: Willst Du Training erlauben? Wenn nein: robots.txt-Opt-outs setzen; Monitoring auf neue Crawler einplanen. (OpenAI-Plattform)
  4. DSGVO-Check: Verzeichnis der Verarbeitungstätigkeiten aktualisieren, DPIA-Screening und AVVs prüfen. (EDPB)
  5. Team-Schulung: Redaktions-/Bild-/SEO-Team zu Labels, Lizenzen, Quellenpflicht und DSGVO sensibilisieren.
  6. Monitoring: Quartalsweise Review (Rechtslage/AI-Act-Meilensteine), Update-Datum im Artikel sichtbar pflegen. (European Commission)

Weiterführende offizielle Quellen

FAQ (kurz & präzise)

Ist KI-Output automatisch urheberrechtlich geschützt?

Nein. Schutz setzt menschliche Schöpfung voraus. Ohne prägenden menschlichen Beitrag i. d. R. kein Schutz. (Deutsches Patent- und Markenamt)

Darf ich öffentlich verfügbare Inhalte fürs KI-Training verwenden?

Nur im Rahmen der TDM-Ausnahmen. Für allgemeines TDM können Rechteinhaber Opt-outs setzen – die musst Du respektieren. Forschung hat eigene Regeln. (EUR-Lex)

Reicht ein robots.txt-Eintrag als TDM-Opt-out?

Er ist branchenüblich und maschinenlesbar – damit erfüllst Du regelmäßig Art. 4 DSM/§ 44b UrhG. 100 % Sicherheit gibt es nicht, weil einige Scraper Regeln ignorieren. (EUR-Lex)

Muss ich Deepfakes/Gen-Bilder kennzeichnen?

Ja, nach AI-Act bestehen Kennzeichnungspflichten für generierte/manipulierte Medien – mit wenigen Ausnahmen. (Europäisches Parlament)

Was verlangt die DSGVO beim Einsatz von KI im Content-Prozess?

Rechtsgrundlage, Transparenz, Datenminimierung, ggf. DPIA und AVV. Modelltraining/Prompts/Logs sind „Verarbeitung“. (EDPB)

Was umfasst KI und Urheberrecht in D/EU konkret?

KI & Urheberrecht umfasst Werk-/Datenbankschutz, TDM-Regeln (Opt-out), Kennzeichnungspflichten (AI-Act) und DSGVO-Vorgaben bei Datenverarbeitung.

Weiterlesen

Schlussgedanke

„KI und Urheberrecht“ ist kein Gegensatz, sondern ein Rahmen: Wer Transparenz, saubere Lizenzen, DSGVO-Basics und klare Opt-outs beherrscht, schafft Vertrauen – und kann KI souverän in den Webmaster-Workflow integrieren.

DerWebfuchs-Logo

„Der Webfuchs“ ist das Pseudonym von Stephan Bloemers. Ich baue seit den späten 90ern Websites und teile hier praxisnahe WordPress-, GeneratePress- und SEO-Tipps – ohne Blabla, dafür mit klaren Schritten und Snippets.

Schreibe einen Kommentar