Einfach schreiben mit künstlicher Intelligenz (TEIL 3)

Kann ChatGPT die Profis für Einfache Sprache ersetzen?

Erste Schlussfolgerungen aus der Analyse von Testergebnissen

In unserem ersten Beitrag haben wir gezeigt, dass das kostenlose Programm ChatGPT von OpenAI komplexe Texte verständlich machen kann. Seit dem zweiten Beitrag wissen wir, wie man mit ChatGPT sofort einfache Texte erzeugt. Diese Texte reichen in ihrer Qualität an Einfache Sprache heran. Damit eröffnet das Programm basierend auf GPT-3.5 bereits ein breites Anwendungsfeld. Inzwischen ist die höhere Version GPT-4 erschienen. Sie ist über das kostenpflichtige ChatGPT Plus zugänglich. Kann man mit dieser Version noch verständlichere Texte schreiben? Und wohin führen diese Fortschritte der künstlichen Intelligenz (KI)? Kann ChatGPT (Plus) zukünftig die Profis für Einfache Sprache ersetzen?

In diesem dritten Beitrag wollen wir zunächst testen, ob GPT-4 verständlichere Texte als GPT-3.5 erzeugt. Danach analysieren wir die Qualität von Texten mit GPT-4 und beleuchten besondere Leistungen beider Versionen. Abschließend stellen wir den Anspruch von Profis der Einfachen Sprache und die Interessen von Nutzern gegenüber und blicken in die Zukunft von GPT-4.

A. VERGLEICH DER VERSTÄNDLICHKEIT

Das Sprachmodell GPT-4 ist viel leistungsfähiger als sein Vorgänger. Es kann mehr Daten verarbeiten, bessere Ergebnisse liefern und ist weniger fehleranfällig. Was bringt das für die Einfache Sprache?
Wir haben getestet, ob GPT-4 verständlichere Texte als GPT-3.5 erzeugen kann. Wir legten hierfür die Texte aus unseren bisherigen Analysen zugrunde (Kurzwort jeweils fett gedruckt):

Wir wählten zwei Aufforderungen aus, die wir jeweils an GPT-3.5 und GPT-4 richteten:

  1. Schreibe diesen Text in Einfacher Sprache.
  2. Schreibe diesen Text in Einfacher Sprache. Verwende dabei nur kurze Wörter, kurze Sätze und aktive Sprache.

In der zweiten Aufforderung fügten wir die hauptsächlichen Merkmale der Einfachen Sprache hinzu. Wir formulierten diese Merkmale absichtlich einfach, damit sie die KI leicht verstehen konnte. Denn unsere Aufforderungen mit aufgelisteten sprachlichen Regeln (vgl. Beitrag 2) konnte GPT-4 ebenso wenig wie GPT-3.5 umsetzen.

Die erzeugten Texte von beiden Sprachmodellen werteten wir mit der Software TextLab von H&H Communication Lab GmbH aus. Diese Software verwendet den Hohenheimer Verständlichkeitsindex (HIX). Er misst die Verständlichkeit von Texten auf der Skala von 0 bis 20. Je höher der erreichte Wert, desto leichter verständlich ist der Text. Ab HIX-Wert 10 gilt ein Text als verständlich; etwa ab HIX-Wert 16 beginnt die Einfache Sprache.

Übersicht zur Verständlichkeit der getesteten Texte

Die eingetragenen Zahlen geben die HIX-Werte an.

Käufer-
schutz
KlimaRaub-
kunst
RKI
Ausgangstext37102
Aufforderung an GPT-3.5:
(1) Einfache Sprache1112138
(2) Einfache Sprache mit Merkmalen 1114119
Aufforderung an GPT-4:
(1) Einfache Sprache18171920
(2) Einfache Sprache mit Merkmalen 20191920

Aus der Übersicht geht hervor, dass GPT-4 durchweg verständlichere Texte als GPT-3.5 erzeugt. Dabei erreicht GPT-4, und zwar bei jedem getesteten Text, das Niveau Einfacher Sprache, teilweise sogar den höchsten HIX-Wert der Verständlichkeit.

B. QUALITÄT DER TEXTE

Die übersetzten Texte beider Versionen von GPT sehen auf den ersten Blick sehr ähnlich aus: Sie sind übersichtlich aufgebaut und haben kürzere Wörter, einfachere Sätze und aktivere Sprache als die Ausgangstexte. GPT-4 geht dabei aber konsequenter vor und kann daher noch verständlicher schreiben. Folgende Beispiele verdeutlichen, wie das Programm die Texte in Einfache Sprache umsetzt.

(1) lange und abstrakte Wörter ersetzen

Ausgangstext RKI:

„Die Kernaufgaben des RKI sind die Erkennung, Verhütung und Bekämpfung von Krankheiten, insbesondere der Infektionskrankheiten. Zu den Aufgaben gehört der generelle gesetzliche Auftrag, wissenschaftliche Erkenntnisse als Basis für gesundheitspolitische Entscheidungen zu erarbeiten. Vorrangige Aufgaben liegen in der wissenschaftlichen Untersuchung, der epidemiologischen und medizinischen Analyse und Bewertung von Krankheiten mit hoher Gefährlichkeit, hohem Verbreitungsgrad oder hoher öffentlicher oder gesundheitspolitischer Bedeutung.“

Übersetzung:

„Besonders wichtig ist es für das RKI, Krankheiten zu erkennen und zu bekämpfen. Vor allem Krankheiten, die ansteckend sind. Das RKI muss auch Wissen für die Politik sammeln. So können die Politiker Entscheidungen für die Gesundheit treffen. Das RKI untersucht dazu Krankheiten, die sehr gefährlich sind, viele Menschen betreffen oder sehr wichtig sind.“

GPT-4 wählt kurze Wörter, erläuternde Relativsätze und verbale Ausdrücke. Zugleich verzichtet das Programm auf wortreiche Formulierungen. So entstehen schlanke und aktive Sätze, die leicht lesbar sind.

(2) lange und komplexe Sätze aufteilen

Ausgangstext Raubkunst:

„Götz Aly hat ein Buch über dieses „Prachtboot“ geschrieben – an dessen Präsentation im Humboldt Forum kritisierte er unter anderem, dass man über die Kultur der Luf-Insel, über die Vernichtung ihrer Bewohner und über die Frage, wie das Boot nach Berlin kam, nichts erfahre.“

Übersetzung:

„Ein Mann namens Götz Aly hat ein Buch über das Boot geschrieben. Er sagt, man erfährt zu wenig über die Menschen von der Luf-Insel. Auch darüber, wie das Boot nach Berlin kam, sagt das Museum zu wenig.“

GPT-4 macht aus einem unübersichtlichen Satz drei kurze Sätze. Dabei vereinfacht das Programm allerdings die Aussage (‚Kultur‘ und ‚Vernichtung‘ fallen weg).

(3) komplizierte Aussagen auflösen

Ausgangstext Klima:

„Stimmberechtigte, die am Abstimmungstag verhindert sind, können vorab per Brief abstimmen. Hierzu kann ab heute ein Abstimmungsschein beantragt werden. Der Antrag kann online über die Website des Landeswahlleiters gestellt werden. Wer die Zustellung der Abstimmungsbenachrichtigung abwartet, kann die Abstimmungsbenachrichtigung via Scan des dort auf der Rückseite eingedruckten QR-Codes vornehmen. Durch das Scannen des QR-Codes mit einer geeigneten App wird der Abstimmungsscheinantrag im Internet aufgerufen und die verschlüsselten personenbezogenen Daten werden automatisch eingetragen. Der Antrag muss dann nur noch bestätigt werden.“

Übersetzung:

„Wenn du an dem Tag der Abstimmung keine Zeit hast, kannst du auch vorher wählen. Dafür brauchst du einen Schein. Den Schein kannst du ab heute im Internet beantragen. Wenn du deinen Brief bekommst, kannst du den QR-Code auf der Rückseite mit deinem Handy scannen. Dann öffnet sich die Seite im Internet, wo du den Schein beantragen kannst. Deine Daten werden automatisch eingetragen, du musst nur noch bestätigen.“

GPT-4 hat aus einem schwer verständlichen Vorgang eine einfache Anleitung herausgefiltert. Das Programm wandelt Passiv-Sätze in aktive Sätze mit der Anrede ‚du‘ um, wählt einfache Wörter (‚Schein‘ statt ‚Abstimmungsschein‘) und verzichtet auf juristische Details (‚verschlüsselt‘, ‚personenbezogen‘).

C. BESONDERE LEISTUNGEN

Beide GPT-Versionen können nicht nur verständliche Texte erzeugen. Sie können diese Texte zugleich für bestimmte Zwecke formulieren, umfangreiche Texte zusammenfassen oder Texte aus anderen Sprachen übertragen. Diese breit anwendbaren Leistungen könnten besonders für Nutzer des kostenlosen Programms attraktiv sein. Deshalb zeigen wir nachfolgend einige Beispiele mit ChatGPT (GPT-3.5):

(1) leserbezogene Textformate

Man kann ChatGPT auffordern, Texte für bestimmte Zwecke und Zielgruppen zu schreiben. Das können Begrüßungen für Besucher, Einladungen für Bürger oder Anweisungen für Kunden sein. Im folgenden Beispiel soll ChatGPT einen vorgegebenen Text neu formulieren:

Aufforderung: Schreibe diesen Text als leicht verständliche E-Mail für Kundinnen und Kunden von PayPal.

Antwort von ChatGPT:

„Betreff: Wichtige Informationen zum PayPal-Käuferschutz

Sehr geehrte Kundin, sehr geehrter Kunde,
Wir möchten Ihnen gerne den PayPal-Käuferschutz vorstellen, der Ihnen dabei hilft, Ihre Einkäufe abzusichern.
[…]
Für weitere Informationen zu den Bedingungen des PayPal-Käuferschutzes empfehlen wir Ihnen, einen Blick in unsere Nutzungsbedingungen zu werfen. Sollten Sie noch Fragen haben oder Unterstützung benötigen, stehen wir Ihnen gerne zur Verfügung. Sie können uns jederzeit kontaktieren.

Vielen Dank für Ihre Aufmerksamkeit und Ihr Vertrauen in PayPal.
Mit freundlichen Grüßen,
Ihr PayPal-Team“

In unseren Tests hat ChatGPT jeweils Texte geliefert, die unmittelbar dem gewünschten Zweck dienlich waren: mit geeigneter Anrede, leserbezogenem Textteil und passendem Schluss. Dabei verwendete das Programm eine verständliche Sprache. Allerdings erreichte es für die betreffenden Zielgruppen nicht das Niveau der Einfachen Sprache.

(2) informative Kurztexte

Besonders gut kann ChatGPT lange Texte in verständlicher Kurzform wiedergeben. Das Programm ist offensichtlich auf Abstracts von 100 bis 150 Wörtern für Publikationen trainiert. Das ist nützlich für umfangreiche und schwer lesbare Originaltexte, deren Inhalt man möglichst leicht und schnell erfassen möchte. Wir haben als Test drei Texte ausgewählt, die zusätzliche Informationen zum Berliner Volksentscheid klimaneutral 2030 bieten. Dazu gehörten

der Generationenvertrag der Bundesregierung für das Klima (479 Wörter)
ein Artikel über die Bedenken der Grünen zum Volksentscheid (1315 Wörter)
eine Information in Englisch über die Klimapolitik Finnlands (287 Wörter)

Die Kurzfassungen von ChatGPT hatten zwischen 100 und 200 Wörtern – unabhängig von der Länge des Originals. Entscheidend für die Verständlichkeit waren die Aufforderungen. Wie schon bei vollständigen Übersetzungen, brachte die Formulierung „leicht verständlich für ein neunjähriges Kind“ die besten Ergebnisse.

ChatGPT neigt auch dazu, längere Texte unaufgefordert zusammenzufassen statt genau zu übersetzen. Man kann stattdessen das Programm auffordern, eine Übersetzung in bestimmter Länge zu schreiben. Aber auch diese Angabe wird meist unterschritten. Will man also einen langen Text vollständig in Einfache Sprache übersetzen, muss man ihn in kurze Abschnitte teilen. Dieses schrittweise Vorgehen ist auch vorteilhaft, um die Qualität der Übersetzung laufend zu prüfen.

(3) Kurzfassung fremdsprachiger Texte

Besonders möchten wir die Kurzfassung zur Klimapolitik Finnlands hervorheben. Der Ausgangstext war nicht nur in einer anderen Sprache verfasst, sondern auch schwer verständlich. Das zeigte sich in einer direkten Übersetzung ins Deutsche mit DeepL (HIX-Wert 1). ChatGPT konnte aus dem englischen Original in einem Schritt eine verständliche deutschsprachige Fassung erzeugen (HIX-Wert 14). Allerdings passte in den finnischen Kontext der Leserbezug ‚wir‘ nicht hinein. Das zeigte die Kurzfassung für ein neunjähriges Kind – hier als Zitat (‚wir‘ fett gedruckt):

„Die Regierung von Ministerpräsidentin Sanna Marin hat ein Ziel: Finnland soll bis zum Jahr 2035 klimaneutral sein. Das bedeutet, dass wir keine schädlichen Gase mehr in die Luft ausstoßen und die Umwelt nicht mehr belasten. Die Regierung möchte, dass Finnland das erste Land wird, in dem die Menschen gut leben können, ohne der Umwelt zu schaden. […]“

Übrigens erzeugt ChatGPT Kurzfassungen für deutsche Texte zuweilen spontan in Englisch (üblich für deutsche Artikel in internationalen Zeitschriften!). Da genügt es, in die Aufforderung den Hinweis „auf Deutsch“ einzufügen.

D. SICHT VON PROFIS UND NUTZERN

Unsere Tests haben ergeben, dass beide GPT-Versionen Texte in Einfacher Sprache erzeugen können. Die Texte sind zumeist gut geschrieben, müssen aber inhaltlich und sprachlich geprüft werden. Wie brauchbar sind diese Texte aus Sicht von Profis und Nutzern? Wir beziehen in diese Frage auch erste Erfahrungen mit anderen KI-Programmen ein, vor allem mit SUMM (für Leichte Sprache).

(1) Anspruch der Profis

Profis der Einfachen und der Leichten Sprache, wie Bettina Mikhail, betrachten KI vor allem als „virtuelle Assistenz„. Das heißt, die KI kann Ideen liefern und bei komplizierten Passagen helfen, aber sie erfordert immer redaktionelle Nacharbeit (Postediting). Dabei geht es zum Beispiel um die Textsorte, Textstruktur, Regelkonformität, ergänzende Informationen, die visuelle Gestaltung sowie die Textprüfung durch Testlesende.

Was Profis der Einfachen und der Leichten Sprache über die KI hinaus beachten, hat Cornelia Kabus angesprochen: „Viele Verständnisprobleme beruhen nicht auf sprachlichen Hürden, sondern haben mit dem Inhalt zu tun bzw. mit kognitiven Begrenzungen. Dafür müsste das Programm die Lebenswelt der Zielgruppe kennen und wissen, was es voraussetzen kann. Eine bloße Umsetzung der ‚Regeln‘ hilft sowieso nicht. Es braucht eine hohe Sprachaffinität und redaktionelle Erfahrung, dazu Einfühlungsvermögen in die Zielgruppen, um Texte in leicht verständlicher Sprache zu schreiben.“

Auch Profis auf Fachgebieten wie Jura oder Medizin haben hohe Ansprüche, besonders hinsichtlich korrekter Begriffe und Formulierungen. Sie können KI nur mit sorgfältiger Bearbeitung einsetzen.

(2) Interesse der Nutzer

Gegenüber diesen Ansprüchen müssen Nutzer von Texten auch andere Aspekte abwägen. Die KI-Texte entstehen in wenigen Sekunden, mit oder ohne Kosten. Wer die Texte für einfache Zwecke einsetzt, mag die Qualität ausreichend finden. Zum Beispiel können gemeinnützige Vereine mit schmalem Budget leicht verständliche Aufrufe, Programme oder Zusammenfassungen erstellen. Ebenso können viele private Nutzer des Internets dank ChatGPT schwere Texte für sich lesbar machen.

Auch Verlage sehen eine Chance: „Durch die KI ist es möglich, Texte bei gleichem Kontext in unterschiedlichen Sprachstilen (z.B. einfache Sprache) und auch Sprachen zu genieren. Dadurch können Redaktionen und Verlage mit ihren Inhalten ohne großartigen Mehraufwand neue Zielgruppen erreichen.“

Erst recht werden Anbieter von massenweise erzeugten Gebrauchstexten versuchen, die KI und deren Anwendungen zu nutzen.

Aus diesem vielfältigen Einsatz von KI für ‚einfache‘ Sprache wird sich ein großes Niveaugefälle herausbilden. Zugleich wird der Bedarf an verbindlichen Standards (ISO/DIN), professioneller Nachbesserung (Postediting) und Zertifizierung für Einfache Sprache wachsen.

(3) Ausblick

Vor allem mit GPT-4 tut sich ein weites Einsatzfeld für Einfache Sprache auf. Folgende Aspekte sind besonders interessant:

  • GPT-4 kann Texte mit bis zu 25.000 Wörter verarbeiten und generieren (etwa 8-mal so viel wie GPT 3.5). Damit ist es noch besser für große Textformate wie Bücher anwendbar.
  • Das Modell kann mit externen Schnittstellen interagieren, insbesondere auf Webseiten zugreifen und deren Inhalt einbeziehen.
  • Außerdem wird GPT-4 zukünftig neben Text auch Bilder verarbeiten können, beispielsweise Diagramme erklären und Text von Bildschirmfotos zusammenfassen.

Diese Aussicht lässt auch erahnen, welche Fragen auf uns zukommen werden. Wir deuten nur einige an, die sich auf KI und Kreative allgemein beziehen (vgl. Stephan Manning):

– Wie können Nutzer beurteilen, ob Texte von KI oder von Menschen erzeugt wurden?

– Für welchen Bedarf sind Profitexte weiterhin unverzichtbar?

– Werden Firmen, die bisher auf freiberufliche Texter angewiesen waren, eher eigene KI-Teams einsetzen?

– Werden Profis durch Arbeit mit KI-Tools und -Texten selbst KI-Maßstäbe verinnerlichen?

– Können Profis noch hochwertige Texte ohne KI-Tools schreiben?

Angesichts dieser Herausforderungen brauchen wir Ideen und Initiativen, um die KI als Chance für die Einfache Sprache zu nutzen und mitzugestalten!

Sabine Manning

Für Anregungen zu diesem Beitrag danke ich besonders Stephan Manning, Bettina Mikhail und Uwe Roth.

Überblick der Beiträge zu Einfach schreiben mit künstlicher Intelligenz:

Teil 1: Wie kann man ChatGPT für Einfache Sprache nutzen?
Teil 2: Wie kann man mit ChatGPT sofort einfache Texte erzeugen?
Teil 3: Kann ChatGPT die Profis für Einfache Sprache ersetzen? (siehe oben)

Bild von Gordon Johnson auf Pixabay

Hinweis: Dieser Beitrag unterliegt der Creative Commons Lizenz. Das bedeutet, dass ihn Interessierte für nicht kommerzielle Zwecke weiterverwenden dürfen. Sie müssen dazu den Autor und den Blog Multisprech (https://multisprech.org/) nennen und dürfen den Text nicht bearbeiten.

Hinterlasse einen Kommentar