KI-Tools für Einfache Sprache: Erste Hilfe bei Amtstexten

Vorwort

Amtstexte sind ein Reizthema: Einerseits finden viele Menschen diese Texte unverständlich; andererseits wehren sich Verantwortliche in den Ämtern gegen vereinfachte Formulierungen. In diese Debatte trifft der Normentwurf für Juristisches Schreiben in Einfacher Sprache*). Er legt dar, wie man unter anderem Verwaltungstexte korrekt und zugleich verständlich schreiben kann. Hierfür gelten die Grundprinzipien der Einfachen Sprache, wobei juristische Fachwörter und Formulierungen besonders berücksichtigt werden sollten. Wir wollen ausprobieren, ob KI-Tools Amtstexte in Einfache Sprache übersetzen und zusammenfassen können. Wenn das gelingt, können die erzeugten Texte eine erste Hilfe sein. Unverzichtbar sind jedoch Fachleute, die diesen Prozess aktiv begleiten und die Texte freigeben.

Können KI-Tools komplexe Amtstexte bürgernah formulieren?

Es gibt schon viele Anleitungen, um Texte der Verwaltung besser lesbar zu machen (siehe Einfach lesen: Amt und Recht). Sie gehören zum Bereich der bürgernahen Verwaltungssprache. Sie sollen den Fachkräften helfen, ihre Kommunikation mit den Bürgerinnen und Bürgern zu verbessern. Das war bisher ein Fachgebiet jenseits von Einfacher Sprache. Denn zu deren Zielgruppe gehörten hauptsächlich Menschen mit Leseschwierigkeiten. Inzwischen haben wir neue Normen für die Einfache Sprache**). Sie sind für einen breiten Leserkreis und zugleich für jegliche Sachtexte konzipiert.

Wir möchten erkunden, wieweit sich Einfache Sprache für bürgernahe Kommunikation eignet. Hierzu beziehen wir KI-Tools für Einfache Sprache ein, denn Verwaltungen agieren digital und nutzen dabei zunehmend KI. Anregungen dafür haben wir aus dem Workshop des Projekts GENIUS der Universität Hildesheim erhalten. Dieses Projekt hat das Ziel, die Integrationsstrukturen in Hessen nutzerfreundlicher zu gestalten. Wir konnten mit den Beteiligten testen, wieweit KI-Tools für die Kommunikation der Verwaltungen tauglich sind.

Folgende Fragen leiten unsere Untersuchung:

(1) Wie praktikabel sind die KI-Tools für bürgernahe Kommunikation?
(2) Wie relevant sind die Inhalte der bürgernahen KI-Texte?
(2a) Fachliche Formulierungen
(2b) Fachausdrücke
(2c) Erklärung von Begriffen
(3) Wie verständlich ist die Sprache der bürgernahen KI-Texte?
(3a) Verständlichkeit der Texte
(3b) Sprachniveau der Texte

Im FAZIT fassen wir die Ergebnisse unserer Untersuchung zusammen.

(1) Wie praktikabel sind die KI-Tools für bürgernahe Kommunikation?

Für die Analyse haben wir drei bereits getestete KI-Tools ausgewählt, die Texte in Einfache Sprache übertragen können: capito.ai (Test), Wortliga (Test) und SUMM AI (Test). Bei Wortliga haben wir den „Umschreiber“ (vormals „PLAIN“- siehe Test) einbezogen, da er frei zugänglich ist. Neu hinzugekommen sind das KI-Tool Fair Text von laizee.ai GmbH und der GPT Bürgernah (Anleitung) von multisprech.org.
Jedes dieser Tools hat unterschiedliche Angebote, die ständig weiterentwickelt werden. In der folgenden Übersicht zeigen wir die gegenwärtigen Leistungen der Tools, die für bürgernahe Kommunikation nützlich sind:

Dieser Überblick lässt bereits erkennen, dass es für bürgernahes Schreiben kein „Spitzentool“, sondern Angebote mit unterschiedlichen Qualitäten gibt. Maßgeblich für die Auswahl sollten zwei Kriterien sein: wie relevant und wie verständlich die erzeugten KI-Texte sind. Unsere nachfolgende Analyse soll darüber Aufschluss geben.

(2) Wie relevant sind die Inhalte der bürgernahen KI-Texte?

Amtstexte sind fachlich geprägt: sowohl durch Formulierungen als auch durch Fachausdrücke. Diese beiden Merkmale haben wir in den KI-Texten untersucht. Dabei dienten uns folgende Veröffentlichungen als Ausgangstexte:

(2a) Fachliche Formulierungen

Zuerst haben wir 10 komplex formulierte Aussagen (Sätze oder kurze Absätze) ausgewählt und geprüft, wie zutreffend die KI-Übersetzungen in Einfache Sprache sind. Dabei geht es um Sätze, die kompliziert aufgebaut und inhaltlich überfrachtet sind. Sie enthalten zudem verwaltungsrechtliche Sachverhalte und Formulierungen.

Die Übersicht zeigt, dass die Aussagen der Ausgangstexte überwiegend korrekt oder nur mit geringfügigen Schwächen übersetzt wurden. Das trifft auf alle getesteten KI-Tools zu. Nur ein kleiner Teil der Übersetzungen ist unklar oder unvollständig.
Die Tools können auch Sachverhalte klarer machen, die im Ausgangstext schwer durchschaubar formuliert sind. Das folgende Beispiel zeigt unterschiedliche Herangehensweisen.

  • verdichtet, auf das Wesentliche konzentriert (Wortliga),
  • fachlich genau erklärt (Bürgernah),
  • beschreibend und erklärend vermittelt (SUMM AI).

Bei den Zusammenfassungen finden wir ähnliche Unterschiede: Einige konzentrieren sich auf die hauptsächliche Aussage, andere nennen die Hauptpunkte. Hier ist ein Beispiel:

(2b) Fachausdrücke

Eine besondere Hürde in Amtstexten sind Fachausdrücke. Viele sind für die Kommunikation so wichtig, dass sie übernommen und erklärt werden sollten. Andere können sinngemäß übertragen oder durch verständlichere Wörter ersetzt werden. Wie gehen die KI-Tools mit Fachausdrücken um? Wir wollten in den Tests herausfinden, welche Arten der Übertragung die Tools nutzen und wie treffend die Übersetzungen sind. Dazu haben wir Fachwörter ausgewählt, die nicht zur Alltagssprache gehören. Als Kriterium für Alltagssprache dient uns der Wortschatz für die Niveaustufe B1 des Gemeinsamen Europäischen Referenzrahmens für Sprachen (GER-Stufe B1). Hier ist die Übersicht:

In der Übersicht fällt auf, dass die Tools häufig die Fachausdrücke unverändert übernehmen. Teilweise sind das Begriffe, die allgemein verstanden werden, z.B. „Grundstück“ oder „Satzung“. Oder sie lassen sich aus dem Zusammenhang des Textes erschließen. Doch in vielen Fällen sind es besondere Ausdrücke, z.B. „Unterhaltsvorschuss“ oder „qualifizierte elektronische Signatur“ (jeweils von 4 Tools übernommen!). Einige spezielle Begriffe werden mitunter ganz weggelassen, z.B. „Repräsentation“ und „vertrauliche elektronische Kommunikation“ (jeweils von 2 Tools). Insofern werden die KI-Tools den Vorgaben der Einfachen Sprache nicht gerecht.

Häufiger sind jedoch die Fälle, in denen die KI-Tools die Fachausdrücke erklären oder sinngemäß übertragen:

  • vorzugsweise durch Synonyme oder Umschreibungen,
    z.B. Innenverdichtung: Immer mehr Gebäude auf engem Raum entstehen;
  • häufig auch mit verkürzten Formen des Originals,
    z.B. Rechtsanspruch: Recht, Anspruch;
  • seltener als Original mit zusätzlicher Erklärung,
    z.B. Sozialwohnung: günstige Wohnung vom Staat (Sozialwohnung).

Eigentlich wäre das Original mit zusätzlicher Erklärung am besten geeignet, um einen Fachausdruck inhaltlich korrekt zu übertragen. Dazu müsste die Erklärung allerdings kurz und treffend sein und sich gut in den Satz einfügen. Sonst könnte die Erklärung den Lesefluss erschweren.

In den Zusammenfassungen sind unveränderte Fachausdrücke stärker vertreten. Das hängt damit zusammen, dass relevante Inhalte auf kleinem Raum verdichtet werden. Dabei spielt die Länge der Texte eine Rolle, wie aus der folgenden Grafik ersichtlich ist:

Bei Fair Text ist der Anteil von Fachausdrücken in der langen Zusammenfassung (1) viel geringer als in der kurzen (2). In der besonders kurzen Zusammenfassung von SUMM AI häufen sich die Fachausdrücke am meisten. Sie sind jedoch in sehr leicht verständliche Formulierungen eingebunden und dadurch teilweise erschließbar.

(2c) Erklärung von Begriffen

Fachausdrücke müssen in vielen KI-Texten nachträglich erklärt werden, entweder im Text oder als Anhang. Hierfür sind die extern verfügbaren Begriffserklärungen der KI-Tools nützlich. Wir haben sie nachfolgend getestet. Drei KI-Tools bieten Erklärungen von Begriffen in eigenständigen Glossaren an:

  • Der GPT Bürgernah listet die Fachausdrücke eines Textes auf und definiert sie in Einfacher Sprache.
  • Im Glossar von Fair Text können Definitionen und Erklärungen von Wörtern in Einfacher Sprache nachgeschlagen werden.
  • SUMM AI hat ein Glossar, das die Bedeutung von Wörtern in Leichter Sprache erklärt bzw. beschreibt.

Außerdem bietet capito.ai Worterklärungen innerhalb der Textanalyse an. Man kann einzelne Ausdrücke des Originaltextes vereinfachen lassen und die generierten Wort-Erklärungen in das individuelle Wörterbuch aufnehmen.

Wir haben die 25 Fachausdrücke aus unserer Textanalyse in den Glossaren der Tools getestet. Für die Erklärungen verwenden die KI-Tools verschiedene Muster: von Begriffsdefinitionen über sinngemäße Erklärungen bis zu Beschreibungen. In der folgenden Übersicht sind Beispiele der drei KI-Tools aufgeführt:

Am meisten vertreten ist die Definition: eine einfach formulierte Erklärung, ausgehend von einem allgemeinen oder übergeordneten Begriff. Dieses Muster trifft auf ein Drittel aller Erklärungen zu und wird von allen Tools genutzt. Die eher beschreibenden Muster sind ebenfalls bei allen Tools anzutreffen.
Inhaltlich sind die Erklärungen zumeist allgemein gehalten, lassen sich jedoch auf die getesteten Texte anwenden. Das Tool Bürgernah liefert eher textbezogene Erklärungen, da es die Begriffe aus den eingegebenen Texten auswählt.

Wie ist die inhaltliche Qualität der Erklärungen zu bewerten? Wir haben sie mit Definitionen aus dem Wiktionary (Wiki-Wörterbuch) verglichen. Davon ausgehend konnten wir feststellen, wie zutreffend die Erklärungen sind. Entscheidend für diesen Vergleich waren nur die inhaltlichen Komponenten, unabhängig vom Muster oder Sprachniveau der Erklärungen. Hier sind die Ergebnisse:

Knapp ein Drittel der Erklärungen ist völlig zutreffend; die meisten anderen Erklärungen haben geringe Schwächen; ein kleiner Teil ist unzureichend. Damit bieten die Glossare der KI-Tools nützliche Begriffserklärungen, die den Mangel an Erläuterungen innerhalb der Texte weitgehend ausgleichen können.

(3) Wie verständlich ist die Sprache der bürgernahen KI-Texte?

Die bisherige Analyse hat gezeigt, wie sehr Amtstexte von fachlichen Ausdrücken und Formulierungen geprägt sind. Wie gelingt es dennoch, die Inhalte verständlich zu übermitteln? Wir analysieren zuerst die Verständlichkeit der übersetzten KI-Texte. Dabei berücksichtigen wir sowohl die vollständigen Übersetzungen als auch die Zusammenfassungen. Anschließend prüfen wir die erzeugten Texte auf ihr sprachliches Niveau.

(3a) Verständlichkeit der Texte

Um die Verständlichkeit der Texte zu vergleichen, nutzen wir das TextLab mit dem Hohenheimer Verständlichkeitsindex (HIX). Dieser Index berücksichtigt die Länge von Wörtern, Sätzen und Satzteilen. Er misst die Verständlichkeit von Texten auf der Skala von 0 bis 20. Je höher der erreichte Wert, desto leichter verständlich ist der Text. Die Skala kennzeichnet den Bereich von 10 bis 20 als verständlich. Maßgeblich für unsere Analyse sind die Werte ab 12 für verständliche Fachtexte und ab 16 für Webtexte. Grenzwerte für Webtexte sind zum Beispiel zwei Teilsätze (also 1 Hauptsatz und 1 Nebensatz), 18 Wörter pro Satz und 16 Buchstaben pro Wort. Diese Werte entsprechen wichtigen Anforderungen der Einfachen Sprache.

In der folgenden Übersicht vergleichen wir die HIX-Werte der Ausgangstexte und der Übersetzungen, die die 5 KI-Tools erzeugt haben. Die mittlere Säule kennzeichnet jeweils die durchschnittliche Verständlichkeit:

Es ist leicht zu erkennen, dass die KI-Übersetzungen weitaus verständlicher als die Ausgangstexte sind. Alle KI-Übersetzungen erreichen durchschnittliche Werte, die der Einfachen Sprache entsprechen oder ihr nahekommen. Das ist ein bemerkenswertes Ergebnis: Es zeigt, dass KI-Tools auch bei fachlich schwierigen Texten leicht lesbare Übersetzungen erzeugen können.

Die Texte mit sehr hohen HIX-Werten sind besonders verständlich, aber nicht unbedingt „besser“ als die anderen. Indexwerte zwischen 18 und 20 können sowohl in Einfacher als auch Leichter Sprache erzielt werden. Was besser passt, hängt also vom angestrebten Sprachtyp und der jeweiligen Zielgruppe ab.

Aus dem HIX-Wert kann man auch nicht direkt ableiten, wie lesefreundlich ein Text ist. Hierfür sind Textfluss, Stil und Leserbezug wichtig. Die getesteten K-Tools können zwar auch diesen Anforderungen entsprechen. Doch es lohnt sich, zusätzlich KI-Übersetzungen auf einem leichteren Level der Einfachen Sprache auszuprobieren. Bei Fair Text kann man dazu den Befehl „stark vereinfachen“ auswählen. Für den GPT Bürgernah gibt es die leichter lesbare Alternative Klar & Verständlich, die sich beim Test von Amtstexten ebenfalls bewährt hat. Das leichtere Level dieser Tools ermöglicht es, schnell den Sinn und Zweck eines Amtsschreibens zu erfassen.

Bei Zusammenfassungen in Einfacher Sprache spielt noch eine Rolle, auf welchem Wege die Texte zusammengefasst werden. Je nach KI-Tool gibt es verschiedene Möglichkeiten:

  • Der GPT Bürgernah fasst Ausgangstexte in einem Schritt leicht verständlich zusammen.
  • Mit capito.ai und Fair Text kann man den Ausgangstext ohne Vereinfachung zusammenfassen und danach in Einfache Sprache übersetzen. Oder man kann zuerst den Ausgangstext in Einfache Sprache übersetzen und anschließend zusammenfassen.
  • SUMM AI kann Übersetzungen in Einfacher oder in Leichter Sprache nachträglich zusammenfassen.

Hier ist die Übersicht der Arbeitsschritte, in denen die KI-Tools Texte zusammenfassen:

Die Modelle beeinflussen, wie verständlich die Zusammenfassungen sind. Das zeigt die folgende Grafik:

Aus dem Vergleich geht hervor, dass alle Übersetzungsmodelle (M1, M2 und M3) den Indexbereich der Einfachen Sprache (ab HIX 16) erreichen können. Bei den Tools capito.ai und Fair Text erzeugt das Modell 2 (erst zusammenfassen, dann übersetzen) bessere Ergebnisse als das Modell 3 (erst übersetzen, dann zusammenfassen).

Die HIX-Werte können helfen, je nach Tool eine möglichst verständliche Zusammenfassung auszuwählen. Man sollte die Qualität der betreffenden Texte genauer prüfen und auch die angestrebte Textlänge berücksichtigen. Es ist für viele Fälle vorteilhaft, über Varianten einer Zusammenfassung zu verfügen.

(3b) Sprachniveau der Texte

Zusätzlich zum HIX haben wir das Sprachniveau der untersuchten Texte ermittelt. Dazu eignet sich das Analyseprogramm von Wortliga. Es stützt sich auf die Kriterien des Gemeinsamen Europäischen Referenzrahmens für Sprachen (GER) und verwendet die folgenden Niveaustufen:
— A1 Einfache Sätze
— A2 Kurze Alltagstexte
— B1 Sprache aus Alltag und Beruf
— B2 Sachtexte und Standpunkte
— C1 Komplexe und literarische Texte
— C2 Anspruchsvolle und abstrakte Texte.

Für die Einstufung berücksichtigt Wortliga die Textstruktur, bezieht aber auch Stil und Grammatik und den Anteil gebräuchlicher Wörter ein. Die Niveaustufen B1 und B2 entsprechen wesentlichen Funktionen der Einfachen Sprache.

In der folgenden Übersicht sind die ermittelten Niveaustufen der Texte festgehalten:

Die Werte zeigen, dass alle analysierten Texte dem Niveau der Einfachen Sprache (B1/B2) entsprechen. Hingegen sind die Ausgangstexte und auch deren direkte Zusammenfassung niedriger im Sprachniveau. Etwas überraschend ist das hohe Niveau (B1) der Zusammenfassungen, da sich besonders in kurzen Texten die Fachausdrücke konzentrieren können.

FAZIT

Inwieweit gelingt es den KI-Tools, Amtstexte bürgernah zu übersetzen?

StarkDie KI-Übersetzungen erfassen den Inhalt der Fachtexte weitgehend korrekt und geben ihn leicht verständlich wieder. Auch komplizierte Formulierungen werden zumeist richtig übersetzt.
MittelFachausdrücke werden oft sinngemäß übertragen: mit Synonymen oder Umschreibungen. Das begünstigt zwar die Lesbarkeit, kann jedoch die fachliche Relevanz beeinträchtigen.
SchwachViele Fachausdrücke werden übernommen, aber nicht erklärt. Damit bleiben Verständnishürden erhalten. Hilfreich sind daher die beigefügten Glossare einiger Tools.

Was leisten die einzelnen KI-Tools für die bürgernahe Kommunikation?

Die fünf getesteten KI-Tools haben unterschiedliche Profile. Teilweise gehören Amtstexte zu ihren Prioritäten: bei Fair Text als Trainingsdaten und bei Bürgernah in den Anweisungen des Tools. Die anderen Tools sind nicht speziell dafür vorgesehen, Amtstexte in Einfache Sprache zu übersetzen. Dennoch zeigen unsere Tests, dass alle fünf Tools für bürgernahe Kommunikation geeignet sind:

  • Die Tools Bürgernah und Fair Text können drei wesentliche Leistungen erbringen: Texte übersetzen, Texte kürzen oder zusammenfassen und Wörter erklären. Dazu nutzen sie Einfache Sprache entsprechend den DIN-Normen für eine große Leserschaft. Die Tools übersetzen die Texte weitgehend korrekt und leicht verständlich. Bürgernah kann Texte direkt in Einfacher Sprache zusammenfassen; Fair Text kann Texte beliebig kürzen und danach übersetzen oder übersetzte Texte anschließend kürzen. Beide Tools erklären Wörter mittels leicht verständlicher Definitionen.
  • Die Programme capito.ai und Wortliga haben den Vorteil, dass ihre KI-Leistungen in eine umfangreiche Sprachanalyse integriert sind. So kann man Texte in Einfache Sprache übersetzen und mithilfe von KI weiterbearbeiten. Die erzeugten Texte sind für einen breiten Leserkreis geeignet; sie sind weitgehend korrekt und leicht verständlich. Wortliga kann auch deutsche Texte in verständliches Englisch (Plain English) oder in verständliche Versionen anderer Sprachen übersetzen. Capito.ai bietet einen Qualitätscheck der Übersetzung mit Hinweisen zur Korrektur an. Mit capito.ai kann man Texte zusammenfassen und anschließend in Einfache Sprache übersetzen oder bereits übersetzte Texte nachträglich zusammenfassen.
  • Das Tool SUMM AI kann Texte übersetzen, zusammenfassen und Wörter erklären. Die übersetzten Texte in Einfacher Sprache sind sehr leicht verständlich und damit besonders für Zielgruppen mit sprachlichen Schwierigkeiten geeignet. SUMM AI kann übersetzte Texte kurz zusammenfassen. Das Glossar bietet Worterklärungen in Leichter Sprache und Synonyme an. Außerdem ermöglicht das Tool, Begriffe zu speichern, die beim Übersetzen oder Zusammenfassen unverändert bleiben sollen.

Wie können die KI-Tools effektiv eingesetzt werden?

Unsere Tests haben das breite Leistungsspektrum der Tools veranschaulicht. Sie sind vielseitig einsetzbar, um Fachtexte aus der Verwaltung für eine breite Leserschaft verständlich zu machen. Anzustreben wäre, dass Verwaltungen ihre Schreiben direkt in Einfacher Sprache herausgeben. Bei juristisch verbindlichen Dokumenten wären beigefügte Zusammenfassungen in Einfacher Sprache hilfreich. Doch die Tools können in jedem Fall nur als Assistenten dienen: Die erzeugten Texte müssen fachlich überprüft und sprachlich bearbeitet werden. Erst so wird sich zeigen, was die Einfache Sprache zu bürgernaher Kommunikation beitragen kann.

Sabine Manning

Für Anregungen zu diesem Beitrag danken wir Bettina Mikhail und Uwe Roth vom Infoportal Einfache Sprache sowie Kai Fedin von Fair Text, Walburga Fröhlich von capito.ai, Hannah Schmidt vom Projekt GENIUS der Universität Hildesheim, Karin Schütt von AnWert, Vanessa Theel von SUMM AI, Gidon Wagner von Wortliga und dem Team von TextLab.

Anmerkungen

*) Norm-Entwurf: Einfache Sprache – Teil 2: Juristisches Schreiben (ISO/DIS 24495-2:2024); Text Deutsch und Englisch [Info/ Bestellung]
**) Normen-Handbuch 2024-10: Einfache Sprache. DIN 8581-1 und DIN ISO 24495-1, Herausgeber DIN e.V. im Oktober 2024 [Info/ Bestellung]


Hinweis: Alle Interessierten können diesen Beitrag kostenlos nutzen und teilen, solange sie ihn nicht kommerziell verwenden und die genaue Quelle nennen (Creative Commons BY Lizenz).

Bild: VintageSnipsAndClips auf Pixabay

ENTWURF: 21.7.2025; aktualisiert 23.7.2025

Hinterlasse einen Kommentar