KI-Tools für Einfache Sprache: (5) Wortliga Plain und ChatGPT-Bot im Vergleich

–

Vorwort zur Reihe „KI-Tools für Einfache Sprache“

Was kann künstliche Intelligenz (KI) für die Einfache Sprache leisten? In dieser Reihe testen wir neue KI-Tools, die öffentlich zugänglich sind. Besonders analysieren wir die sprachliche Qualität dieser Tools. Wir wollen mit diesen Tests zur Diskussion anregen: Was sind die Stärken und die Schwächen dieser Tools? Für welche Zielgruppen und Zwecke sind sie geeignet? Wie kann man die Qualität der erzeugten Texte verbessern?
Unsere Reihe begann mit dem KI-Tool vom Fußballclub St. Pauli, gefolgt von zwei Modellen der Textanalyse, die KI zum Vereinfachen der Sprache einsetzen: capito digital und Wortliga. Danach haben wir die Leistungen von Google Chatbot Bard (heißt jetzt Gemini) und GPT-4 gegenübergestellt. Zuletzt haben wir analysiert, wie das KI-Tool SUMM AI Texte in die Einfache Sprache übersetzt. Diesmal wollen wir zwei Tools für spezielle Aufgaben vergleichen: das neue Wortliga Plain und den ChatGPT-Bot „Klar und verständlich“.

–

Vergleich der Leistungen von Wortliga Plain und ChatGPT-Bot „Klar und verständlich“

In diesem Beitrag stellen wir zwei KI-Tools gegenüber: Wortliga Plain (nachfolgend Plain) und den ChatGPT-Bot „Klar und verständlich“ (nachfolgend GPT-Bot). Unsere Analyse soll drei Fragen beantworten (die Links führen zu den jeweiligen Abschnitten):

A. Wofür werden die beiden KI-Tools eingesetzt?
B. Wieweit können die beiden KI-Tools die Anforderungen an Einfache Sprache erfüllen?
C. Wie bewerten wir die Leistungen der beiden KI-Tools für die Einfache Sprache?

–

A. Wofür werden die KI-Tools Plain und GPT-Bot eingesetzt?

Beide Tools basieren auf dem Sprachprogramm GPT-4. Sie sind für Nutzer gedacht, die in ihrem Praxisfeld verständlich kommunizieren wollen, aber keine Sprachprofis sind.

Plain ist von Wortliga entwickelt worden. Das KI-Tool soll vor allem Unternehmen und Mitarbeitern helfen, einfach und effizient zu kommunizieren. Es macht Texte von Behörden, Banken und Versicherungen leichter verständlich. Es behält wichtige Begriffe bei und verbessert die Lesbarkeit. So erzeugt es zum Beispiel klare rechtliche Dokumente, verständliche Wahlprogramme und eine verständliche technische Dokumentation (vgl. Whitepaper).

ChatGPT-Bots sind Anwendungen, die man als Nutzer der Plattform ChatGPT mit einfachen Mitteln selbst bauen kann. Als Beispiel testen wir den GPT-Bot „Klar und verständlich“ von multisprech.org. Der GPT-Bot funktioniert mit einem internen Prompt, der an unsere Tests mit ChatGPT anknüpft (siehe Blog 3). Der GPT-Bot soll verständliche Texte für einen großen Leserkreis erzeugen. Das Tool kann Organisationen helfen, die Mitteilungen oder Aufrufe verbreiten und Menschen mit unterschiedlicher Bildung erreichen wollen.

Für ihre Zielgruppen bieten die beiden KI-Tools besondere Funktionen an.

Plain ist sofort einsatzbereit. Das Tool übersetzt den eingegebenen Text automatisch in Einfache Sprache. Bei beiden Texten wird das erreichte Sprachniveau angezeigt. Zu jeder Übersetzung kann man Alternativen aufrufen. Für den „Feinschliff“ weist das Menü auf die Wortliga Textanalyse hin.

Der GPT-Bot hat eine Oberfläche wie ChatGPT. Er kann also für viele Zwecke genutzt werden, verlangt aber entsprechende Aufforderungen an die KI. Als Einstieg für Laien bietet der GPT-Bot vier Aufforderungen an, die per Klick gestartet werden können (siehe Screenshot unten). Diese Aufforderungen kann der GPT-Bot zusätzlich auf besondere Zielgruppen oder Einsatzzwecke ausrichten. Darüber hinaus kann man im Menü des GPT-Bot eigene Aufforderungen eingeben.

Die folgenden Screenshots zeigen, wie die beiden KI-Tools funktionieren:

Wortliga Plain

Screenshot Multisprech 29.2.2024

ChatGPT-Bot

Screenshot Multisprech 12.3.2024

–

B. Wieweit können die beiden KI-Tools die Anforderungen an Einfache Sprache erfüllen?

Für die Übersetzungen haben wir, wie bei den früheren Tests, fünf Ausgangstexte zu verschiedenen Themen und auf unterschiedlichem Niveau verwendet:

Käuferschutz bei PayPal (Auszug aus den Nutzungsbedingungen)
Koloniale Raubkunst im Humboldt Forum (Auszug aus einem Artikel)
Robert-Koch-Institut (RKI) (Auszug aus der Internetseite des RKI)
Special Olympics 2023 (Rückblick des Organisationskomitees)
Volksentscheid Berlin 2030 klimaneutral (Auszug aus dem Aufruf)

Wie können wir die Qualität der Übersetzungen beider Tools ermitteln? Als Maßstab ziehen wir die neue internationale Norm für Einfache Sprache heran. Die Internationale Organisation für Normung (ISO) hat im Juli 2023 den ersten Standard für Einfache Sprache verabschiedet. Die DIN ISO enthält vier Grundsätze für Texte in Einfacher Sprache:

Die Leserschaft erhält, was sie braucht. (Relevanz)
Die Leserschaft kann leicht finden, was sie braucht. (Auffindbarkeit)
Die Leserschaft kann leicht verstehen, was sie findet. (Verständlichkeit)
Die Leserschaft kann die Informationen einfach verwenden. (Anwendbarkeit)

In diesen Grundsätzen stehen die Leser im Mittelpunkt. Auf sie ist die Einfache Sprache ausgerichtet. Das gilt zwar vor allem für neu verfasste Texte. Doch auch Übersetzungen sollten sich den Lesern so weit zuwenden, wie es der Ausgangstext ermöglicht.

Diese Grundsätze leiten unsere Analyse der beiden KI-Tools. Die Links führen zu den jeweiligen Abschnitten:

Verständliche Texte
Relevante Aussagen
Leserbezogene Informationen

–

1. Verständliche Texte

Können die Leser die KI-Texte leicht verstehen? Das ist am besten zu erreichen, wenn die Texte einfach strukturiert sind, das Sprachniveau der Leser treffen und gebräuchliche Wörter enthalten oder ungebräuchliche erklären. Unter diesen Gesichtspunkten haben wir die Übersetzungen der beiden KI-Tools analysiert. Hier sind die Ergebnisse.

Einfache Textstruktur
Passendes Sprachniveau
Gebräuchliche Wörter

Einfache Textstruktur

Für die vergleichende Analyse der beiden KI-Tools eignet sich die Software TextLab von H&H Communication Lab GmbH. Diese Software verwendet den Hohenheimer Verständlichkeitsindex (HIX). Dieser Index berücksichtigt vor allem die Länge von Wörtern, Sätzen und Satzteilen. Er misst die Verständlichkeit von Texten auf der Skala von 0 bis 20. Je höher der erreichte Wert, desto leichter verständlich ist der Text. Ab HIX-Wert 10 ist ein Text verständlich; etwa ab HIX-Wert 16 beginnt die Einfache Sprache.

Sehen wir uns die Testergebnisse in der folgenden Grafik an. Hier sind die 5 Ausgangstexte und die KI-Übersetzungen jeweils insgesamt erfasst: mit ihren durchschnittlichen HIX-Werten.

–

Die Grafik zeigt, dass die Übersetzungen beider KI-Tools deutlich besser lesbar sind als die Ausgangstexte. Der durchschnittliche HIX-Wert der Ausgangstexte liegt bei 8, d.h. die Texte sind schwer verständlich. Die Plain-Texte erreichen insgesamt den HIX-Wert 15, sind also gut verständlich. Die Texte das GPT-Bot haben insgesamt den HIX-Wert 19 und sind damit leicht verständlich.

Aus dem Vergleich lässt sich auch schlussfolgern, dass die Plain-Texte dichter am Original sind als die Texte des GPT-Bot. Dieser Unterschied entspricht der jeweiligen Funktion des KI-Tools.

Noch genauer können wir die KI-Tools bewerten, wenn wir die HIX-Werte der einzelnen Texte vergleichen.

Die Texte des GPT-Bot unterscheiden sich untereinander nur gering: Die HIX-Werte reichen von 18 bis 20. Die Texte sind alle im oberen Bereich der Einfachen Sprache. Die unterschiedlichen Werte hängen kaum von der Verständlichkeit der jeweiligen Ausgangstexte ab.

Bei Plain hingegen unterscheiden sich die Texte deutlich: Die HIX-Werte reichen von 10 bis 19. Diese Unterschiede hängen unter anderem mit der Verständlichkeit der jeweiligen Ausgangstexte zusammen (HIX-Spanne von 2 bis 15):

Plain erzielt den höchsten HIX-Wert beim Ausgangstext mit höchstem HIX-Wert (Special Olympics).
Dagegen erreicht Plain den niedrigsten HIX-Wert beim Ausgangstext mit niedrigstem HIX-Wert (RKI).

Mit dieser Spanne von HIX-Werten liegen die Plain-Texte etwa im Bereich zwischen verständlichen Fachtexten (ab HIX-Wert 12) und Einfacher Sprache (ab HIX-Wert 16).

Wir haben auch getestet, ob sich die Verständlichkeit von Plain-Texten erhöhen lässt. In dem Tool kann man zu jedem KI-Text eine Alternative anfordern. Damit wird der Ausgangstext erneut übersetzt. Hier ist unser Testergebnis von fünf Texten:

Die Alternativen erzeugen KI-Texte, die einen etwas höheren oder niedrigeren HIX-Wert als die erste Übersetzung haben (Spanne von +1 bis -2 HIX-Punkte). Das heißt, die alternativen Texte können mehr oder weniger verständlich sein. Mit Alternativen kann man also die Verständlichkeit eines KI-Textes nicht gezielt verbessern. Man kann aber Varianten zur Auswahl und Inspiration erzeugen.

Passendes Sprachniveau

Für verständliche Texte braucht man nicht nur eine einfache Textstruktur. Wichtig sind auch klare Aussagen und möglichst bekannte Wörter. Diese Aspekte können wir mit der Textanalyse von Wortliga einbeziehen. Hier wird das Sprachniveau der Texte ermittelt: Maßgeblich sind die Textstruktur, aber auch Stil und Grammatik und der Anteil gebräuchlicher Wörter.
Die Niveauskala basiert auf Kriterien des Gemeinsamen Europäischen Referenzrahmens für Sprachen (GER). Dieser Rahmen betrifft zwar vor allem die Fähigkeiten beim Erlernen von Fremdsprachen. Doch er bezieht auch die Qualität von Texten ein, die den Fähigkeiten der Lernenden angemessen ist.
Aufschlussreich hierfür sind die GER-Niveaustufen des Lese- und Hörverstehens. Auf dieser Grundlage hat Uwe Roth die Schwierigkeitsgrade des Textverständnisses zusammengestellt. Aus seiner Erfahrung fängt die Einfache Sprache bei A2 an: mit ganz einfachen Alltagstexten. Sie hat aber ihren Schwerpunkt bei B1: mit Texten in gebräuchlicher Alltags- und Berufssprache. Je nach Textart und Zielgruppe kann die Einfache Sprache auch bis B2 reichen.
Vor diesem Hintergrund haben wir die KI-Übersetzungen von Plain und GPT-Bot auf ihr Sprachniveau getestet. Hier sind die ermittelten Niveaustufen von Wortliga im Vergleich zu den HIX-Werten von TextLab:

Verständlichkeit und Sprachniveau der Texte
Indexwerte HIX – Niveaustufen Wortliga

–

Auf der Skala von Wortliga haben fast alle Ausgangstexte das Sprachniveau C1, setzen also fachkundige Sprachkenntnisse voraus. Beide KI-Tools heben dieses Niveau um mindestens eine Stufe. Die Plain-Texte erreichen insgesamt die Niveaustufen B2 oder B1. Die Texte des GPT-Bot haben alle die Stufe B1. Sie bleiben allerdings trotz hoher HIX-Werte unter der Stufe A2, die leicht verständliche Alltagstexte kennzeichnet.

Gebräuchliche Wörter

Die Niveaustufen hängen von mehreren sprachlichen Merkmalen ab, die über den HIX hinausgehen. Besonderen Einfluss hat der Anteil gebräuchlicher Wörter im Text. Diesen Anteil wollen wir nachfolgend ermitteln.
Wir nutzen hierfür die Wortliste des Goethe-Instituts für die Zertifikate auf der GER-Stufe B1 (3000 Wörter). Der Wortschatz dieser Stufe entspricht der gebräuchlichen Alltags- und Berufssprache.
In allen Ausgangstexten und Übersetzungen haben wir die Wörter in zwei Gruppen unterteilt:
(1) gebräuchliche Wörter = in der Liste B1 enthalten
(2) nicht gebräuchliche Wörter = nicht in der Liste B1 enthalten
Diese zwei Gruppen sind in der folgenden Grafik in den Balken abgebildet: jeweils durch farbige Abschnitte (1) und schwarze Abschnitte (2).

–

Wie die Grafik zeigt, steigt der Anteil gebräuchlicher Wörter durch die KI-Übersetzungen: von ursprünglich 70% in den Ausgangstexten auf über 80% bei Plain und 90% beim GPT-Bot. Entsprechend verringert sich der Anteil der nicht gebräuchlichen Wörter. Diese sind eine bunte Sammlung von Fremdwörtern, Eigennamen (wie PayPal), Fachwörtern, Anglizismen (außer bereits üblichen und leicht lesbaren), abgehobenen deutschen Wörtern und Wendungen, abstrakten Substantiven (außer üblichen wie Gesundheit) und Sprachbildern.

Am geringsten ist der Anteil nicht gebräuchlicher Wörter im Bot-Text. Das entspricht dem Anliegen dieses Tools, verständliche Übersetzungen für Menschen mit unterschiedlichen Lesefähigkeiten zu bieten. Die KI-Texte von Plain dagegen sollen dichter am Original bleiben, um zuverlässige Informationen auch für Fachkreise zu übermitteln. Daher bleibt ein größerer Anteil nicht gebräuchlicher Wörter erhalten.

Allerdings könnten die nicht gebräuchlichen Wörter verständlicher werden, wenn man sie erklärt. Bei den KI-Übersetzungen von Plain geschieht das nicht. Der GPT-Bot hingegen hilft in mehreren Fällen, den Sinn zu erschließen. Hier sind einige Beispiele, in denen nicht gebräuchliche Wörter erklärt werden (Erklärungen fett gedruckt):

Ausgangstext:
Wenn Sie etwas von einem Verkäufer kaufen, können Sie die Zahlung unter Umständen nach dem PayPal-Käuferschutz zurückerhalten. Die Bedingungen des PayPal-Käuferschutzes sind hier festgelegt. […]
GPT-Bot:
Was ist der PayPal-Käuferschutz? Wenn du etwas kaufst und mit PayPal bezahlst, kannst du dein Geld zurückbekommen, wenn es ein Problem gibt. Das nennt man PayPal-Käuferschutz.

Ausgangstext:
Die PIN AG
GPT-Bot:
Die Firma PIN AG

Ausgangstext:
Über Inklusion wurde in den Tagen in Berlin nicht nur gesprochen, sie wurde tatsächlich gelebt.
GPT-Bot:
Es ging auch darum, dass alle Menschen zusammen sein und voneinander lernen können. Das nennt man Inklusion. Das war in Berlin sehr zu spüren.

Die Originaltexte haben jedoch häufig schwer verständliche Wörter, die nicht bedeutsam und somit entbehrlich sind. Wie gelingt es, diese Wörter zu ersetzen oder zu vermeiden? Das ist oft nur möglich, indem der ganze Satz oder Abschnitt umformuliert wird. Das folgende Beispiel zeigt die unterschiedlichen Lösungen der KI-Tools:

Ausgangstext:
Sie können allerdings dagegen bei PayPal Widerspruch einlegen, wenn Sie über neue oder stichhaltige Informationen verfügen, die zum Zeitpunkt der ursprünglichen Entscheidung noch nicht vorlagen, oder Sie der Meinung sind, dass die Entscheidungsfindung fehlerhaft war.
Plain:
Sie können jedoch Widerspruch einlegen. Das ist möglich, wenn Sie neue Beweise haben, die bisher nicht vorlagen, oder wenn Sie glauben, dass ein Fehler in der Entscheidung liegt.
GPT-Bot:
Wenn du neue Beweise hast oder einen Fehler bei der Entscheidung findest, kannst du Widerspruch einlegen.

In diesem Beispiel verwenden die Tools mehr gebräuchliche Wörter; zugleich vereinfachen sie den verschachtelten Satz. Beide übernehmen jedoch den Ausdruck „Widerspruch einlegen“. Das ist ein Ausdruck, der bereits zum Fachwortschatz gehört.

Fazit:
Beide KI-Tools machen aus schwer verständlichen Originaltexten gut lesbare Übersetzungen. Alle KI-Texte erreichen das Sprachniveau B2 oder B1. Der GPT-Bot übersetzt Texte jedoch leichter verständlich als Plain. Das gilt sowohl für die Satzstruktur als auch die Wortwahl. Die Texte des GPT-Bot befinden sich im oberen Bereich der Einfachen Sprache, während die Plain-Texte von verständlichen Fachtexten bis zur Einfachen Sprache reichen.

–

2. Relevante Aussagen

Was wollen die Leser erfahren? Was sollen sie wissen? Was ist wichtig? Diese Fragen sollten die Übersetzung in Einfache Sprache begleiten. Uns interessiert besonders, wie die beiden KI-Tools mit Fachausdrücken und relevanten Aussagen umgehen. Wir haben drei der Testtexte analysiert, die besonders fachlich ausgerichtet sind: PayPal-Käuferschutz, Volksentscheid Klimaneutral und das Robert Koch-Institut (RKI).

Zuerst ermitteln wir, wie die KI-Tools die Fachausdrücke übersetzen: Werden sie übernommen, verkürzt, ersetzt oder weggelassen? Hier ist die Übersicht:

–

Die Übersicht zeigt, worin sich die beiden KI-Tools unterscheiden: Von den Fachausdrücken des Originals übernimmt Plain fast die Hälfte unverändert. Der GPT-Bot hingegen behält nur ein Viertel bei. Stattdessen ersetzt oder umschreibt der Bot viel mehr Fachausdrücke als Plain.

Die folgenden Beispiele veranschaulichen, wie die KI-Tools mit Fachausdrücken umgehen:

Fachausdrücke, die beide KI-Tools verkürzen oder umformen
Krankheitsüberwachung:
> Plain: Krankheiten überwachen; GPT-Bot: Krankheit beobachten
Sponsoringbericht der Bundesregierung:
> Plain: Regierungsbericht; Bot: Bericht der Regierung

Fachausdrücke, die Plain übernimmt und der GPT-Bot ersetzt oder umschreibt
Infektionskrankheiten:
> GPT-Bot: Krankheiten, die ansteckend sind
Nutzungsbedingungen von PayPal:
> GPT-Bot: Regeln, die du akzeptierst, wenn du PayPal nutzt
Briefabstimmungsstelle:
> GPT-Bot: wo du wählen gehen kannst

Fachausdrücke, die beide KI-Tools weglassen:
spezielle Details:
z.B. epidemiologisch, Antennenfunktion, verschlüsselte Daten, App;
entbehrliche Formulierungen:
z.B. neben der Onlinebeantragung

Nicht nur Fachausdrücke sollten korrekt übersetzt werden. Auch relevante Aussagen sollten sinngemäß erhalten bleiben. Wie zuverlässig sind die KI-Tools in dieser Hinsicht?

# Plain übersetzt die Aussagen des Originals weitgehend korrekt. Nur unwesentliche Details werden weggelassen. Beim GPT-Bot werden die hauptsächlichen Inhalte ebenfalls richtig übersetzt. Allerdings werden manche komplexen Aussagen zwar gut lesbar, aber nicht exakt genug übertragen.

# Beide KI-Tools neigen dazu, Inhalte zusammenzufassen, vor allem bei langen Texten. Dabei werden zwar viele unnötige Details beseitigt, aber es können auch relevante Informationen verloren gehen. Dieser Effekt erklärt sich aus dem zugrundeliegenden Programm GPT-4: Je länger der Originaltext ist, umso mehr wird der Inhalt in der KI-Übersetzung verdichtet. Besonders gilt das für die Texte des GPT-Bot. Sie sind mitunter zu stark verkürzt und vereinfacht.

Beide KI-Tools übersetzen lange Originaltexte genauer, wenn man kürzere Textabschnitte eingibt. Oder man lässt nachträglich Abschnitte verbessern, die unzureichend übersetzt wurden. Beim GPT-Bot kann man die betroffenen Textstellen noch gezielter im Dialog mit der KI verbessern. Hier ist ein Beispiel:

Gezielte Verbesserung einer Übersetzung mit dem GPT-Bot:
Satz im Ausgangstext:
In sechs Monaten sollen auch die Säle im Ost-Flügel fertig sein.
Satz in der ersten Übersetzung des GPT-Bot:
In sechs Monaten wird ein weiterer Teil fertig sein.
Aufforderung an den GPT-Bot:
Übersetze den folgenden Satz exakter: „In sechs Monaten sollen auch die Säle im Ost-Flügel fertig sein.“
Antwort des GPT-Bot:
In einem halben Jahr sollen die Räume im Ost-Teil des Gebäudes fertig sein.

Der verbesserte Satz ist sowohl sprachlich vereinfacht als auch inhaltlich exakt. Das gelingt nicht immer so perfekt. Man kann es aber mehrmals versuchen.

Fazit:
Insgesamt lässt Plain mehr Fachausdrücke und relevante Aussagen unverändert, während der GPT-Bot mehr davon umschreibt. Hier zeigt sich die unterschiedliche Funktion der beiden Tools besonders deutlich: Plain soll möglichst fachlich relevant übersetzen, während die Bot-Texte möglichst für alle verständlich sein sollen.

–

3. Leserbezogene Informationen

Texte in Einfacher Sprache sollen nicht nur verständlich und inhaltlich relevant sein. Sie sollten auch dem Leser helfen, wichtige Informationen aufzufinden und anzuwenden. Wieweit das gelingen kann, hängt vor allem vom Ausgangstext ab. Doch zusätzlich kann man auch die Übersetzung leserbezogen strukturieren und gestalten.

In dieser Hinsicht unterscheiden sich die beiden KI-Tools. Plain erzeugt reine Fließtexte, die den Aussagen des Originals folgen und sich nicht darüber hinaus auf den Leser beziehen. Der GPT-Bot hingegen erzeugt leserbezogene Texte. Damit folgt er einer besonderen Aufforderung in seinem Prompt. Insofern heben sich die Texte des Bot auch von den früheren Tests mit ChatGPT ab. Mit welchen Mitteln der GPT-Bot leserbezogene Texte erzeugt, zeigen die folgenden Testergebnisse.

Auffindbare Informationen
Anwendbare Informationen

Auffindbare Informationen

Die Übersetzungen des GPT-Bot sind sehr unterschiedlich gestaltet. Welche Mittel der Bot einsetzt, ist zufällig, selbst wenn man den gleichen Ausgangstext mehrmals nacheinander eingibt. Bei den fünf Testtexten konnten wir folgende Mittel erkennen, die helfen, wichtige Informationen im Text aufzufinden:

# Jeder Text erhält eine Überschrift, auch wenn das Original keine hat. Diese Überschriften sind klar und eingängig formuliert, z.B. „Ein neues Museum in Berlin“. Sie sollen auch Interesse wecken, z.B. „Was macht das Robert Koch-Institut?“

# Zwischenüberschriften, auch in Frageform, leiten den Leser durch den Text. Beispielsweise hat der Text zu „Special Olympics 2023 in Berlin“ folgende Zwischenüberschriften:

Von Anfang bis Ende spannend
Viele bekannte Gesichter
Inklusion im Mittelpunkt
Was kommt nach den Spielen?
Blick in die Zukunft

# Textabschnitte können auch mit vorangestellten Hauptaussagen beginnen. So werden zum Beispiel im RKI-Text ausführliche Aufzählungen überschaubar:
„Die Hauptaufgaben sind:
– Krankheiten erkennen und bekämpfen: Besonders wichtig sind dabei Krankheiten, die ansteckend sind.
– Wissen für Entscheidungen sammeln: Das RKI sucht wichtige Informationen […]“

# In allen Texten sind Überschriften und Hauptaussagen durch Fettdruck hervorgehoben.

Wie sich die Textgestaltung des GPT-Bot von den Fließtexten bei Plain abhebt, zeigt folgendes Beispiel. Der betreffende Ausgangstext über Raubkunst im Humboldt Forum hatte keine Überschrift.

Übersetzung von Plain

Übersetzung des GPT-Bot

Es sind sechs Monate vergangen, seit der West-Flügel des Berliner Humboldt Forums geöffnet hat. Dort werden die Ethnologischen Sammlungen der „Staatlichen Museen zu Berlin“ gezeigt. In weiteren sechs Monaten wird auch der Ost-Flügel fertiggestellt sein. Dieser wird die umstrittenen Benin-Bronzen beherbergen.

Ein zentrales Diskussionsthema war das „Luv-Boot“. Dieses große Auslegerboot gehört zur Ozeanien-Sammlung des Ethnologischen Museums. […]

Ein neues Museum in Berlin

Vor einem halben Jahr hat ein Teil des Berliner Humboldt Forums eröffnet. Dort kann man viele besondere Dinge aus aller Welt sehen. In sechs Monaten wird noch mehr zu sehen sein, zum Beispiel die Benin-Bronzen, die sehr bekannt sind, aber auch viele Diskussionen auslösen.

Ein besonderes Boot sorgt für Gespräche. Im Museum gibt es ein großes Boot aus der Südsee, das „Luv-Boot“ genannt wird. […]

Diese Mittel der Gestaltung unterstützen den Leser, die Hauptpunkte eines Textes zu erkennen und im Textverlauf zu verfolgen. Wie aber finden Leser, was für sie besonders nützlich oder zu beachten ist? Dazu haben wir in den Testtexten von GPT-Bot die anwendbaren Informationen ermittelt.

Anwendbare Informationen

Einige Originaltexte vermitteln bereits anwendbare Informationen. Hier verstärken die Bot-Texte den Effekt:

# Bei zwei Themen ist schon die Überschrift, die die KI für die Übersetzung wählt, auf das praktische Ergebnis gerichtet:
– „Abstimmung in Berlin: So bekommst du deine Unterlagen“
– „PayPal-Käuferschutz: So bekommst du dein Geld zurück“

# Innerhalb einiger Texte sind Zwischenfragen anwendungsbezogen und die dazugehörigen Aussagen entsprechend angeordnet, zum Beispiel:
– bei PayPal: „Was passiert, wenn ich mit PayPals Entscheidung nicht einverstanden bin?“
– beim Volksentscheid Klimaneutral: „So geht das: 1. Abstimmungsschein anfordern: […] 2. Unterlagen bekommen: […]“

Bei mehreren Texten fasst die KI die Ergebnisse am Schluss zusammen. Das können anwendbare Informationen sein, aber auch Aufforderungen zum Handeln. Sie sind alle leicht verständlich formuliert. Hier sind 3 Beispiele:

PayPal-Käuferschutz:
„Zusammengefasst: Der PayPal-Käuferschutz hilft dir, dein Geld zurückzubekommen, wenn beim Kauf etwas schiefgeht. PayPal prüft jeden Fall genau. Wenn du nicht einverstanden bist, kannst du das sagen.“
Volksentscheid Klimaneutral:
„So kannst du mitmachen und mitentscheiden, ob Berlin bis 2030 klimaneutral wird.“
Raubkunst im Humboldt Forum:
„Was bedeutet das? Im Humboldt Forum gibt es viel zu entdecken. Aber manche Dinge im Museum machen die Leute auch nachdenklich. Es ist wichtig, mehr über die Geschichte zu wissen, um alles gut zu verstehen.“

Diese Zugaben am Schluss gehen über den Original-Text hinaus. Sie können dem Leser helfen, sinnvoll zu handeln (Käuferschutz/ Volksentscheid) oder eine Sache zu beurteilen (Raubkunst). Ob diese Zugaben angemessen sind, muss man je nach Einsatzzweck und Zielgruppe des Textes entscheiden.

Fazit:
Für die Leser ist es hilfreich, wenn Informationen auffindbar und anwendungsbezogen übermittelt werden. Das KI-Tool Plain folgt hierbei den Aussagen des Originals, ohne eigene leserbezogene Akzente zu setzen. Der GPT-Bot hingegen setzt vielfältige Mittel ein, damit die Leser die hauptsächlichen Informationen leicht finden können. Wie ein Text leserbezogen gestaltet wird, hängt jedoch vom Zufall ab. Der Bot hebt auch in mehreren Fällen anwendbare Informationen hervor und bietet zusätzlich Schlussfolgerungen an. Diese Zugaben sollten allerdings besonders geprüft werden.

–

C. Wie bewerten wir die Leistungen der KI-Tools Plain und GPT-Bot für die Einfache Sprache?

In unserer Analyse haben wir bereits die Vor- und Nachteile der beiden KI-Tools ermittelt: jeweils im FAZIT unter den einzelnen Abschnitten. Diese Erkenntnisse führen wir jetzt zusammen, indem wir die Leistungen von Plain und dem GPT-Bot bewerten. Dabei verwenden wir die Grundsätze der DIN ISO als Kriterien für die Einfache Sprache. Die folgende Übersicht stuft die Leistungen der KI-Tools als „stark“, „mittel“ oder „schwach“ ein.

–

Nach dieser Einstufung können wir die Leistungen von Plain und GPT-Bot zusammenfassen.

Die beiden KI-Tools haben unterschiedliche Stärken, die ihren besonderen Funktionen entsprechen. Sie haben zugleich Schwächen, die zumindest teilweise überwunden werden können:

Plain ist besonders gut darin, relevante Aussagen und Begriffe des Originals zuverlässig zu übertragen. Das ist wesentlich für den Einsatz des Tools in Fachkreisen und Unternehmen. Die Texte sind gut verständlich, bleiben aber relativ dicht beim Original und entsprechen nur teilweise der Einfachen Sprache. Die KI-Texte können mit Wortliga noch weiter vereinfacht werden.
Der GPT-Bot hat den Vorteil, leicht verständliche Texte zu erzeugen. Das macht ihn besonders für eine breite Leserschaft mit unterschiedlichen Sprachfähigkeiten geeignet. Dabei werden allerdings relevante Aussagen des Originals teilweise ungenau übersetzt. Diese Ergebnisse können durch wiederholte Eingabe von Abschnitten oder im Dialog mit der KI verbessert werden.
Eine besondere Leistung des GPT-Bot sind die leserbezogenen Informationen. Sie wären auch für die Einsatzzwecke von Plain nützlich. Diesen Leserbezug kann man zumindest manuell mit dem Menü von Wortliga einfügen.

Beide KI-Tools sind erst in der Testphase. Sie werden noch weiterentwickelt und sicher auch verbessert. Doch wie perfekt ein KI-Tool auch sein mag, ein Text lässt sich nicht „mit Knopfdruck“ in Einfache Sprache verwandeln. Er muss immer geprüft, nachgebessert und auf die konkreten Bedürfnisse der Leser ausgerichtet werden.
Die Tools sind für den praktischen Einsatz in Organisationen gedacht. Wichtig wird also das Feedback nicht nur von Sprachprofis, sondern vor allem von Fachkräften und gewöhnlichen Lesern sein.

Sabine Manning

PS. Für Anregungen zu diesem Beitrag danke ich insbesondere Stephan Manning, Bettina Mikhail, Uwe Roth und Gidon Wagner (Wortliga Plain).

Bild von VintageSnipsAndClips auf Pixabay

Hinweis: Dieser Beitrag unterliegt der Creative Commons Lizenz. Das bedeutet, dass ihn Interessierte für nicht kommerzielle Zwecke weiterverwenden dürfen. Sie müssen dazu den Autor und den Blog Multisprech (https://multisprech.org/) nennen und dürfen den Text nicht bearbeiten.

	Plain: Der KI-Überse… bei KI-Tools für Einfache Sprache:…
	Sabine bei KI-Tools für Einfache Sprache:…
	Multisprech bei Einfach schreiben mit künstlic…
	Jonas Pilot bei Einfach schreiben mit künstlic…
	Sabine Manning bei Einfach schreiben mit künstlic…

Multisprech

Lust auf sprachliche Vielfalt : a multispeak challenge

KI-Tools für Einfache Sprache: (5) Wortliga Plain und ChatGPT-Bot im Vergleich

Hinterlasse einen Kommentar Antwort abbrechen

Teilen mit:

Hinterlasse einen Kommentar Antwort abbrechen