1 of 72

KI im Journalismus:

Chancen & Risiken

Steffen Kühne

AI + Automation Lab

Bayerischer Rundfunk

2 of 72

Über mich

Lebenslauf

  • 2018: Tech Lead im AI + Automation Lab des BR
  • 2015: Datenjournalist beim BR
  • 2014: Entwicklungsredaktion der SZ
  • 2013: Datenjournalismus-Volo bei der SZ
  • 2012: Medieninformatik an der LMU München
  • 2009: Journalistik an KU Eichstätt

Homepage | LinkedIn | E-Mail

3 of 72

BR Recherche

AI + Automation

Lab

BR Data

4 of 72

Investigativer Journalismus

KI & Automatisierung

Journalismus

Automatisierte Formate & Anwendungen

5 of 72

Was ist�Künstliche Intelligenz?

6 of 72

Künstliche

Intelligenz

Automatisierung

Künstliche

Intelligenz

Medizin

Maschinelles

Lernen

Deep

Learning

Generative

KI

Philosophie

Ethik

Science Fiction

Technologie

ChatGPT

Industrie

Informatik

Linguistik

Statistik

Automatisierung

Roboter

7 of 72

KI-Modell�stellt Funktionalität bereit�wird trainiert������„Motor“ Beispiel: GPT-4

KI-Anwendung�stellt Benutzeroberfläche bereit�wird programmiert������„Auto“��Beispiel: ChatGPT, Copilot, WriteSonic, Jasper, …

8 of 72

Was ist ein�KI-Modell?

9 of 72

Klassische Programmierung

if (hasFur && hasTail && hasPointyEars && hasWhiskers) {� print(“It’s a cat!”)�} else {� print(“It’s NOT a cat!”)�}

Jede Regel muss einzeln festgelegt werden. Für Algorithmen mit sehr vielen Regel ist das irgendwann nicht mehr möglich.

10 of 72

Training von KI-Modellen

Verwendung

Keine Katze!

Katze!

falsch-positives�Ergebnis

Katze!

„Katze“

Training

Trainingsdaten

11 of 72

Wahrscheinlichkeiten statt Wahrheiten

Ein künstliches neuronalen Netzwerk gibt Ergebnisse mit unterschiedlichen Wahrscheinlichkeiten aus. Daraus kann man teilweise ablesen, wie „sicher“ das Ergebnis ist.

Katze ██████████ 99 %�Tier ██████████ 98 %�Haustier ████████ 82 %�Luchs ███████ 73 %�Hund ████ 41 %

12 of 72

Entwicklungsprozess von KI-Modellen

Grundsätzlich läuft die Entwicklung eines KI-Modells folgendermaßen ab:

  1. Datensammlung: Große Mengen relevanter Daten sammeln
  2. Datenaufbereitung: Reinigen, Labeln und Organisieren der Daten
  3. Feature Engineering: Geeigneten Algorithmus, Merkmale und Startparameter für das Training festlegen
  4. Training: Anpassen der Modellparameter durch Lernalgorithmen
  5. Validierung: Überprüfen des Modells mit Testdaten
  6. Optimierung: Feinabstimmung des Modells
  7. Deployment: Modell auf Servern zur Verfügung stellen

13 of 72

Entwicklungsprozess von KI-Modellen

KI-Modelle werden trainiert – und nicht im klassischen Sinne programmiert –�um eine bestimmte Aufgabe zu erfüllen.

vereinfachte Darstellung

14 of 72

Trainingsdaten

Die Erhebung und Zusammenstellung von Trainingsdaten ist jedoch mit einigen Problemen verbunden:

  • Verletzung von Urheberrechts- und Datenschutzbestimmungen
  • Ausbeutung von „Data Workers“ bei der Vorbereitung und Bewertung von Daten
  • Voreingenommenheit, Diskriminierung und mangelnde Diversität in den Trainingsdaten

15 of 72

Arten von KI-Anwendungen

Chatbots: direkte Interaktion über natürlichsprachliche Anweisungen und Fragen (Prompts)

Vorlagenbasierte Systeme: wiederverwendbare Vorlagen für konkrete Aufgaben anlegen und verwenden

Kontextsensitive Assistenten: Vorschläge für Tätigkeiten innerhalb einer Anwendung

Hintergrundprozess: Aufgaben werden im Hintergrund, ohne Zutun der Nutzer:innen, erledigt.

Autonome Agenten: flexible Systeme, die selbstständig entscheiden können wie eine Aufgabe gelöst werden soll

16 of 72

Was ist eine�KI-Anwendung?

17 of 72

18 of 72

19 of 72

20 of 72

21 of 72

22 of 72

KI-Anwendungen optimieren

Fine-Tuning (Feinabstimmung): Anpassung des Modells durch weitere wenige Trainingsschritte, ohne das Modell grundsätzlich zu verändern.

Zero-/Few-Shot-Learning: Einsatz des Modells für Aufgaben, für die es nicht explizit trainiert wurde, basierend auf wenigen oder keinen Beispielen.

RAG (Retrieval-Augmented Generation): Prompt-bezogene Informationen aus einer Datenbank abrufen und diese in die Antwort integriert.

Prompt Engineering: Clever formulierte Fragen oder Anweisungen erstellen, um die Antworten eines KI-Modells zu beeinflussen.

23 of 72

„KI ist Software, die im Idealfall macht, worauf sie trainiert wurde.“

24 of 72

Was kann

generative KI?

25 of 72

Generative KI

„Klassische KI“: Bilderkennung, Spracherkennung und -verarbeitung, Empfehlungssysteme, Vorhersageanalytik

→ klare Probleme, einfache Modelle

Generative KI: Inhalte erzeugen (Texte, Bilder, Audio, Video), Deepfakes, Chat-Assistenten

→ universeller Ansatz, komplexe Modelle

26 of 72

KI-generierte Texte

Große Sprachmodelle können verschiedene Aufgaben erfüllen:

  • Übersetzung
  • Ideengenerierung
  • Artikelgenerierung
  • Überschriftenformulierung
  • Social-Media-Texte
  • Rechercheunterstützung
  • Textredigierung

27 of 72

Tool: Generierte Texte erkennen

Online-Tools können dabei helfen KI-generierte Text zu erkennen. Jedoch geben diese Tools häufig nur einen groben Anhaltspunkt, lassen sich leicht austricksen und können durchaus auch falsch-positive Ergebnisse produzieren.

https://quillbot.com/ai-content-detector

28 of 72

Liste: Texte generieren

29 of 72

Prompting Basics

  • Formuliere deine Frage oder Anweisung klar und detailliert.
  • Überlade den Prompt nicht mit zu vielen Fragen auf einmal.
  • Gib einen bestimmten Kontext oder Stil vor:�„Ich bin Journalist und möchte einen Fachartikel schreiben. Schreibe einen sachlichen, leicht verständlichen Text.“
  • Stelle Folgefragen basierend auf vorherigen Antworten, um tiefer in ein Thema einzutauchen.
  • Gib Feedback, wenn Ergebnisse nicht den Erwartungen entsprechen, um die Antwort zu verbessern.

30 of 72

Vorurteile und Halluzination

  • Menschen neigen dazu, KI-Systemen menschliche Eigenschaften zuzuschreiben.
  • Sprachmodelle können Sprache statistisch imitieren, haben aber kein Verständnis davon.
  • Sprachmodelle haben kein Weltwissen und tendieren dazu, Fakten zu „halluzinieren“.
  • Große Sprachmodelle reproduzieren Vorurteile (Bias) aus den zugrundeliegenden Trainingsdaten.
  • Journalist:innen sollten Antworten von Sprachmodellen gründlich überprüfen.

31 of 72

KI-generierte Bilder

Bildverarbeitende KI-Modelle können folgende Aufgaben erfüllen:

  • Bildsynthese
  • Stiltransfer
  • Bildrestaurierung
  • Farbkorrektur
  • 3D-Modellierung
  • Bild-zu-Text-Übersetzung

32 of 72

Liste: Bilder generieren

33 of 72

Desinformation mit KI

Quelle: GADMO (2024)

FALSCH!

FALSCH!

FALSCH!

34 of 72

KI-generierte Bilder erkennen

  • Weiche, „traumhafte“ oder gezeichnete Optik
  • Auffälligkeiten in Texturen oder Haut
  • Unterschiedliche Augenfarbe (recht, links)
  • Unnatürlicher Haaransatz oder Strähnen
  • Merkwürdige Proportionen, vor allem der Extremitäten (Hände)
  • Ansätze von Schmuck (vor allem Ohrringe)
  • Sinnfreie Texte oder verzerrte Logos
  • Inkonsistenter Hintergrund
  • Wasserzeichen oder Logos

Quelle: GADMO (2023)

35 of 72

Tools: Generierte Bilder erkennen

Der Advanced AI Image Detector ist einer von vielen Onlinediensten, der KI-generierte Bilder erkennen soll. Gut ist, dass nur Wahrscheinlichkeit ausgegeben wird. Leider fehlen weitere Angaben zur verwendeten KI, digitalen Wasserzeichen und weiteren Metadaten.

https://contentatscale.ai/ai-image-detector/

36 of 72

Tools: Umgekehrte Bildersuche

Mit der umgekehrten Bildersuche kann kann Bilder im Internet finden und in welchem Kontext sie ursprünglich verwendet wurden.

37 of 72

Tools: Digitale Wasserzeichen

Manche Hersteller versehen ihre KI-generierten Bilder mit einem unsichtbaren, digitalen Wasserzeichen (C2PA-Metadaten). Verschiedene Werkzeuge können diese Metadaten auslesen. Wasserzeichen können aber vermutlich relativ einfach entfernt werden.�

https://contentcredentials.org/verify

38 of 72

Deep Fakes

Deep Fakes sind mit künstlicher Intelligenz erzeugte Videos oder Audiodateien, die Personen so darstellen, als würden sie Dinge sagen oder tun, die sie nie gesagt oder getan haben.

FALSCH!

FALSCH!

39 of 72

Auswirkungen

  • KI zerstört das Vertrauen in die Echtheit von Medieninhalten.
  • KI macht die Produktion von Desinformation einfacher und günstiger (Effizienz).
  • KI-generierte Inhalte können weiterhin mit klassischen Methoden der Verifikation entlarvt werden.
  • Der Erfolg einer Desinformationskampagne entscheidet sich aber vor allem durch die Verbreitung.

40 of 72

KI-generierte Avatare & Sprache

41 of 72

KI-generierte Videos

Bislang waren KI-Videos noch wenig beeindruckend. Das hat sich mit der Vorstellung von OpenAI Sora geändert.

42 of 72

Was bringt uns

KI im Journalismus?

43 of 72

Was kann KI besser?

Geschwindigkeit: spezifische Aufgaben schnell erledigen, (unkritische) Entscheidungen treffen, teilweise in Millisekunden�

Skalierbarkeit: viele Aufgaben gleichzeitig bearbeiten, gleichbleibende Qualität, geringe Kosten

Konsistenz: hohe Präzision, vergleichbare Ergebnisse, wiederholbare Prozesse, keine Ermüdungseffekte.�

Datenanalyse: große Datenmengen speichern, analysieren, zusammenfassen, Muster und Trends entdecken

44 of 72

Was können Menschen besser?

Komplexe Kommunikation: Zuhören, Verhandeln, Erklären, Interpretieren, soziale und emotionale Intelligenz, Empathie�

Flexibel denken: Kreativität, auf nicht erwartbare Ereignisse reagieren, unstrukturierte Informationen verarbeiten

Kontextualisieren: Informationen und Aussagen einordnen, Folgen abschätzen, Irrelevantes ignorieren, Ironie, Sarkasmus, Humor�

Expertenwissen nutzen: Problemlösung mit Fachwissen, Strategien entwicklen, Priorisieren von neuen Informationen

45 of 72

Anwendungsfelder im Journalismus

Verifikation von (Deep) Fakes und zugespieltem Material

Bild-, Video- und Audioanalyse

Recherche

Verifikation

Produktion

Archivierung

Distribution

Analyse

Datenanalyse

Bild-, Video- und Audioanalyse

Sprachanalyse

Trendanalyse

Übersetzungs-�programme

Transkription

Metadaten-�Anreicherung

Verschlag-�wortung für Text, Bild, Audio

Transkription

Automatisierte Texte, Bilder, Audios & Videos

Textzusammen-�fassungen

Sprachsynthese

Avatare

Korrektur

Transkription

Untertitelung

Analyse von Zielgruppen, Reichweite

Social Media�Monitoring

Tippgeber und Impulsgeber für neue Recherche

Empfehlungs-�systeme

Kommentar-�moderation

Hate Speech

Sprach-�assistenten & Chat Bots

Accessibility:�Einfache Sprache, Vertonung

46 of 72

ARD: Simple Audio Mining

Das Transkribieren von Interviews ist extrem zeitaufwändig und lästig.

ARD SAM wandelt Audiodateien in Text (Speech-to-Text) um und spart Mitarbeitenden in den Redaktionen Nerven�und Zeit.

47 of 72

BR: Regional Update

Bayern 1 liefert regionale Radionachrichten:

  • aus 5 Studios
  • 3 mal täglich
  • jeweils ~ 3 Beiträge

Nachrichten werden segmentiert, verschlagwortet und personalisiert ausgespielt.

Prototyp: Regional Update

48 of 72

BR: Text Summarizer

BR24 liefert ein umfangreichen Nachrichtenangebot.

Nachrichten für den Bayerntext aufzubereiten ist aufwändig, vor allem wegen der fixen Textlänge

Der Text Summarizer liefert passende (extraktive) Textkürzungen.

Studie: JournalismAI Collab

49 of 72

BR: Dein Argument

BR24 bekommt jeden Tag tausende Kommentare von Leser:innen.

Unser Dienst durchsucht Kommentare nach Fragen und Hinweisen an die Redaktion und meldete diese via Teams.

Studie: JournalismAI Collab

50 of 72

OFR: Aiditor

Online-Anwendung, um verschiedene KI-Dienste nutzen zu können:

  • Transkription
  • Übersetzungen
  • Texte, Audio und Bilder generieren
  • Social Media-Beiträge generieren

51 of 72

Es braucht Journalist:innen

Kritisch und differenziert: KI-Systeme sind schlecht darin komplexe Sachverhalte zu kontextualisieren.

Empathisch und nahbar: KI kann keine echte Beziehung zu Menschen aufbauen und hat kein echtes Verständnis von Emotionen.

Vor Ort und mittendrin: Keine KI kann „vor Ort sein“. Menschen wollen aber wissen, was in ihrem Ort oder ihrer Gemeinschaft passiert.

52 of 72

Hybride Workflows

Universalität: KI wird die meisten journalistischen Tätigkeiten unterstützten, Journalist:innen jedoch nicht ersetzen.

Assistenzsysteme: Die KI macht Vorschläge, der Mensch nimmt ab. Idealerweise als Integration in die bestehenden Arbeitsumgebungen.

Automatisierung: Unkritische, zeitraubende und schlecht skalierbare Tätigkeiten (z.B. Labeling) sollten automatisiert werden.

53 of 72

Was macht KI wertvoll?

Internetanbindung: KI-Anwendungen, die im Internet suchen können, sind weniger abhängig von der Aktualität des (Sprach-)Modells.

Datenbanken und Archive: Eine Anbindung der unternehmenseigenen Daten verbessert die Faktizität und Qualität der Antworten.

Systemintegration: KI sollte Teil bestehender Redaktionssysteme und Office-Anwendungen sein (weniger Copy & Paste)

Vorlagen: Einmal geschaffene Prompts und Workflows sollten wiederverwendbar sein.

54 of 72

Beispiel: Datenanbindung

Retrieval-Augmented Generation (RAG)

55 of 72

KI im Unternehmen

Unvermeidbarkeit: Mitarbeitende werden KI dort einsetzen, wo es ihnen hilft, egal ob es erlaubt ist oder nicht.

Verfügbarkeit: Softwarehersteller integrieren KI bereits in ihre Produkte, sichtbar oder unsichtbar.

KI ist Software: KI ist auch nur Software. Die meisten Unternehmen haben bereits Regeln und Prozesse, um Software einzuführen.

56 of 72

KI ist auch nur Software

57 of 72

Probleme von KI

Hype: unreflektierter Einsatz für alle Probleme

Interpretation: schlechte Nachvollziehbarkeit von Ergebnissen

Bias: fehlende, verzerrte oder falsche Trainingsdaten

Infrastruktur: aufwändige Integration in die eigene Infrastruktur, Kosten

Rahmen: ungeklärte ethische und rechtliche Fragen

Souveränität: Abhängigkeit von großen (US-)Unternehmen

Akzeptanz: Vorbehalte von Mitarbeitenden und Nutzer:innen

Talent: Schwierigkeit, KI-Expert:innen zu finden

58 of 72

Chancen von KI

Digitaler Wandel: KI zwingt Unternehmen die Digitalisierung nachzuholen, wovon auch andere Prozesse profitieren können.

Kosteneffizienz: KI ermöglicht es, Kosten zu sparen. Der Fokus sollte dabei aber erstmal auf der Verwaltung liegen.

Richtlinien: Der Einsatz von KI braucht klare Richtlinien. Unternehmen sollten das als Chance nutzen, Mitarbeitende an Bord zu holen.

59 of 72

Wo können wir KI einsetzen?

Was sind unsere größten Probleme? Welche Aufgaben sind besonders zeitaufwendig oder repetitiv?

60 of 72

Welche Regeln braucht es

für KI in Redaktionen?

61 of 72

Grundlagen für KI-Richtlinien

  • Kennzeichnungspflicht und Transparenz
  • Klare Verantwortung der Auftraggeber und Entwickler
  • Überprüfung von Qualität und Zweckmäßigkeit
  • Unerwünschte Effekte minimieren
  • Nachvollziehbarkeit herstellen
  • Menschliche Ansprechpartner bei Problemen

��Komponenten einer KI-Richtlinie: https://algorithmwatch.org/en/project/ai-ethics-guidelines-global-inventory/

Icons: flaticon.com

62 of 72

Beispiel: KI-Richtlinien des BR

Leitwerte

  • Mehrwert
  • Transparenz
  • Vielfalt
  • Regionalität
  • Datenschutz
  • Redaktionelle Kontrolle

Link: KI-Richtlinien im BR

63 of 72

Beispiel: KI-Richtlinien des BR

64 of 72

DJV-Positionspapier

Der Deutsche Journalisten-Verband (DJV) fordert, dass Redaktionen selbst über den Einsatz von Künstlicher Intelligenz (KI) entscheiden und KI lediglich die Arbeit der Redaktionen unterstützen, aber nicht ersetzen darf. ���

Quelle: DJV-Positionen zu KI

65 of 72

Wie können wir

über KI berichten?

66 of 72

Algorithmic Accountability Reporting

Viele wichtige Entscheidungen werden heutzutage von Algorithmen getroffen, auch solche, die uns selbst betreffen.

Algorithmen können fehlerhaft und diskriminierend sein, mit unmittelbaren negativen Folgen für die Betroffenen.

Wie ein Algorithmus entscheidet ist oft intransparent und wird als Geschäftsgeheimnis betrachtet.

�Fachbegriff: Algorithmic Accountability Reporting

67 of 72

Beispiele: AI + Automation Lab

68 of 72

Beispiel: Raciness Detection

KI-Dienste werden genutzt, um zu überprüfen ob ein Bild sexuell anstößig ist. Dabei gelten unterschiedliche Standards für Männer und Frauen.

Diese Problem lässt sich mit einem einfachen Experiment beweisen.

Zu sexy: Wie KI-Algorithmen Frauen benachteiligen können

69 of 72

Wie können wir über KI berichten?

Leitfragen: Wo werden Algorithmen eingesetzt? Wer entscheidet über den Einsatz? Gibt es Richtlinien und eine Qualitätskontrolle? Wie werden diskriminierende Effekte ausgeschlossen? Was sind die Konsequenzen für Betroffene?

Journalistischer Ansatz: Auskunftsrechte nutzen, Betroffene finden, Follow the Money, Crowdsourcing, Selbstversuch

Technischer Ansatz: Reverse Engineering

70 of 72

Handbuch: Black Box Reporting

AI + Automation Lab: Black Box Reporting

71 of 72

Verantwortungsvolle KI-Berichterstattung

Es gibt ein paar Dinge, die man bei der Berichterstattung über KI beachten sollte sollte:

  • Anwendungsfall (Kontext) klar beschreiben
  • Fähigkeiten nicht übertreiben, Limitationen nicht unterschätzen
  • Werbeversprechen nicht ungeprüft übernehmen
  • klischeehafte Bilder (v.a. Roboter) vermeiden
  • Vorsichtig mit vermenschlichender Sprache
  • Menschliche Rolle nicht vergessen

72 of 72

„Am Ende entscheidet immer ein Mensch darüber, ob und wie KI

eingesetzt werden soll.“