Lesbarkeits-Bewertung
Fügen Sie Text ein und sehen Sie sofort dessen Lese-Niveau anhand von fünf etablierten Formeln.
Die Ergebnisse aktualisieren sich beim Tippen. Mindestens etwa 100 Wörter werden für genaue Resultate empfohlen.
📚 Wissenschaftliche Grundlagen und Quellen
Für wen dieses Tool gedacht ist
Die Bewertung der Lesbarkeit nützt Inhaltsproduzenten, Lehrkräften, Gesundheitskommunikatoren und allen, die für ein vielfältiges Publikum schreiben. Laut dem National Center for Education Statistics (NCES) liest ein erheblicher Anteil der US-Erwachsenen auf einem grundlegenden oder darunterliegenden Literacy-Niveau, gemessen am Programme for the International Assessment of Adult Competencies (PIAAC). CDC und NIH empfehlen, Gesundheitsmaterialien auf einem Lese-Niveau der 6. Klasse oder darunter zu verfassen, um ein breites Verständnis sicherzustellen. Menschen mit kognitiven oder Lernbeeinträchtigungen, Nicht-Muttersprachler und ältere Erwachsene sind von komplexen Texten überproportional betroffen.
Quellen der Formeln
- Flesch, R. (1948). „A new readability yardstick." Journal of Applied Psychology, 32(3), 221–233. · Die Original-Formel des Flesch Reading Ease; Skala 0–100, wobei höhere Werte einfacheres Lesen anzeigen.
- Kincaid, J.P., Fishburne, R.P., Rogers, R.L. & Chissom, B.S. (1975). „Derivation of new readability formulas for Navy enlisted personnel." Research Branch Report 8-75, Naval Technical Training Command. · Rekalibrierung der Flesch-Formel auf US-amerikanische Klassenstufen.
- Gunning, R. (1952). The Technique of Clear Writing. McGraw-Hill. · Der Fog Index schätzt die Anzahl der Schuljahre, die nötig sind, um einen Text beim ersten Lesen zu verstehen.
- Coleman, M. & Liau, T.L. (1975). „A computer readability formula designed for machine scoring." Journal of Applied Psychology, 60(2), 283–284. · Verwendet Zeichenzählungen statt Silben für eine zuverlässigere automatisierte Bewertung.
- McLaughlin, G.H. (1969). „SMOG grading, a new readability formula." Journal of Reading, 12(8), 639–646. · Wird vom US-amerikanischen Gesundheitsministerium weitgehend als Goldstandard für die Bewertung der Gesundheitskompetenz angesehen.
- Smith, E.A. & Senter, R.J. (1967). „Automated Readability Index." AMRL-TR-66-220. Wright-Patterson Air Force Base. · Auf Zeichen basierende Formel, ursprünglich für die maschinelle Bewertung militärischer Fachhandbücher konzipiert.
Hinweis
Lesbarkeitsformeln liefern statistische Schätzungen anhand oberflächlicher Textmerkmale (Wortlänge, Satzlänge, Silbenzahl). Sie messen weder Verständnis noch Kohärenz oder inhaltliche Korrektheit. Keine Formel kann das Vorwissen, die Motivation oder das Vorhandensein kognitiver bzw. Lernbeeinträchtigungen einer Leserin oder eines Lesers vollständig berücksichtigen. Diese Werte sollten als ein Indikator unter mehreren bei der Bewertung der Textzugänglichkeit dienen. Dieses Tool ersetzt keine medizinische, pädagogische oder rechtliche Beratung.
Eine 75-jährige Geschichte der Lesbarkeitsformeln
Die Lesbarkeitsbewertung begann mit der Doktorarbeit von Rudolf Flesch an der Columbia University im Jahr 1943, formalisiert als Flesch Reading Ease im Jahr 1948: eine 0-100-Bewertung, bei der höher leichter bedeutet. Die US-Marine beauftragte eine Neukalibrierung im Jahr 1975 (Kincaid et al., Naval Technical Training Command Report 8-75), die dieselben oberflächlichen Merkmale (Silben pro Wort, Wörter pro Satz) US-Schulklassenstufen zuordnete, dies ist die Flesch-Kincaid Grade Level, die seit den frühen 1990er Jahren in Microsoft Word integriert ist. Andere Formeln füllten Lücken: Robert Gunnings Fog Index (1952) für Geschäftsschreiben; SMOG von McLaughlin (1969), vom US-Gesundheitsministerium als Goldstandard für Gesundheitskompetenz übernommen; Coleman-Liau (1975) und ARI (Smith & Senter, 1967) verwenden Zeichenzählungen anstelle von Silben und umgehen damit die Notwendigkeit, Silben programmatisch zu zählen. Die Dale-Chall-Formel (Edgar Dale, 1948; überarbeitet 1995) verwendet eine Vokabelliste «vertrauter» Wörter. Das neuere Lexile Framework (MetaMetrics, 1989) und ATOS (Renaissance Learning, 1999) sind korpusbasiert und werden von US-Schulen verwendet. All diese Formeln messen Stellvertreter, kein Verständnis; behandeln Sie Ergebnisse als «Lesbarkeit», nicht als «Verständnis».
Ziel-Klassenstufen für verschiedene Zielgruppen
- Gesundheits- und medizinische Kommunikation. Das CDC und NIH empfehlen, auf oder unter 6. Klassenstufe zu schreiben (Flesch Reading Ease ≥ 70, SMOG ≤ 8). Der Clear Communication Index des CDC und die «Health Literacy»-Richtlinien der AMA kodifizieren dies. Krankenhausentlassungsanweisungen, Impfinformationsblätter und Patientenzustimmungsformulare verfehlen dieses Ziel regelmäßig um 4-6 Klassenstufen.
- Nachrichten und Journalismus. Die Hausstile von Reuters, AP und BBC zielen auf eine 9. Klassenstufe ab (Flesch Reading Ease 60-70). Die New York Times liegt im Durchschnitt um Stufe 9-10, The Economist Stufe 13-14, USA Today Stufe 6-7. Boulevardzeitungen und Reddit-Beiträge liegen oft unter Stufe 8.
- Rechtliche und behördliche Dokumente. Der US Plain Writing Act von 2010 verlangt von Bundesbehörden, öffentliche Dokumente in einfacher Sprache zu schreiben; PlainLanguage.gov schlägt Stufe 8 als Maximum vor. Die britische Plain English Campaign (gegründet 1979) zielt auf Stufe 9 für Verbraucherverträge ab. Die meisten Versicherungspolicen und EULAs liegen bei Stufe 14-18, weit über der Schwelle fast jedes Verbrauchers.
- Marketing- und SEO-Inhalte. Yoast SEO und Surfer empfehlen Flesch Reading Ease über 60 (ca. Stufe 8) für allgemeine Webinhalte. Buffer analysierte seinen Blog und stellte fest, dass Beiträge auf den Stufen 6-9 36% mehr Engagement hatten als Beiträge auf Stufe 13+. Mailchimp empfiehlt Stufe 7 für E-Mail-Betreffzeilen.
- Bildung und Lehrbücher. Schullehrbücher zielen auf eine Klassenstufe unter dem Publikum ab: Ein Biologielehrbuch der 9. Klasse zielt auf Lesbarkeit der Stufe 8 ab, damit kämpfende Schüler nicht durch die Sprache ausgeschlossen werden. Common Core Lexile-Bänder (2010) schlagen spezifische Bewertungsbereiche pro Klassenstufe vor.
- Technische Dokumentation. Tools wie die Entwicklerdokumentation von Microsoft, Google und Apple zielen auf Stufe 8-10 in Tutorial-Inhalten ab und erlauben höhere Stufen für Referenzmaterial. Die «Plain language»-Überarbeitung der MDN Web Docs (2018-2020) senkte die Durchschnittsstufe von 14 auf 9.
- Akademisches Schreiben. Zeitschriftenartikel bewerten routinemäßig Stufe 14-20+, was für das Publikum angemessen ist, sie aber für Nicht-Spezialisten unzugänglich macht. Wissenschaftsjournalismus (Quanta, Aeon, The Conversation) zielt darauf ab, auf Stufe 10-12 zu übersetzen.
Wo Lesbarkeitsbewertung wirklich hilft
- Patientenorientierte Gesundheitsinhalte. NHS Digital, Mayo Clinic, WebMD und Healthline führen alle Lesbarkeitsprüfungen vor der Veröffentlichung durch. Das Verfehlen des Stufe-6-Ziels schließt etwa die Hälfte der US-Erwachsenen mit grundlegender Lese-/Schreibfähigkeit aus (PIAAC 2017). Krankenhauseinweisungsraten korrelieren mit dem Verständnis von Entlassungsanweisungen durch Patienten.
- Entwurf und Überarbeitung. Der Score ist ein Feedback-Signal während des Schreibens, keine veröffentlichbare Metrik. Schreiben Sie den Entwurf, bewerten Sie ihn, finden Sie die Absätze mit der höchsten Klassenstufe (normalerweise lange Sätze oder Fachjargon), vereinfachen Sie diese, bewerten Sie neu. Hemingway Editor (2014) und Grammarly fügten Klassenstufen-Feedback speziell für diese Schleife hinzu.
- Übersetzung und Lokalisierung. Übersetzungsspeicher-Tools (MemoQ, SDL Trados, Phrase) bewerten Quelltext vor der Übersetzung, um komplexe Passagen für leitende Linguisten zu markieren. Internationale Organisationen wie UNESCO und die UN übersetzen auf Zielklassenstufen 6-8, um die Publikumsreichweite über Sprachen hinweg zu maximieren.
- Barrierefreiheit und WCAG. Das WCAG 2.1 Erfolgskriterium 3.1.5 (Leseniveau) ist AAA: «zusätzlicher Inhalt oder eine Version, die keine Lesefähigkeit über dem niedrigeren Sekundarschulniveau erfordert». Tools wie axe DevTools automatisieren dies noch nicht, aber Inhaltsautoren prüfen manuell mit Lesbarkeitstools.
- Regierungs- und Bürgerkommunikation. Der US Plain Writing Act (Oktober 2010), die EU-Initiative Clearer Communication, der UK Government Digital Service (GDS) Style Guide schreiben alle einfache Sprache vor. Steuerformulare, Wählerinformationen, Antragsformulare für Sozialleistungen bewerten regelmäßig über Stufe 14, der Score ist der Lackmustest für die Einhaltung.
- Lehrplanabgleich. Bei der Auswahl von Lesematerialien für eine bestimmte Klassenstufe verweisen Lehrer Lexile- oder Flesch-Kincaid-Scores auf die Common Core-Bereiche. Bibliothekskatalogsysteme (Follett Destiny, Lexile.com) enthalten Scores, sodass Schüler Bücher selbst auf ihrem Leseniveau auswählen.
- SEO und Content-Marketing. Googles Helpful-Content-Updates bevorzugen zunehmend lesbare Inhalte. Yoast, Surfer, Clearscope und SemRush enthalten alle Lesbarkeitsbewertung. Das Content-Team von Buffer stellte fest, dass Flesch Reading Ease 60-80 mit längerer Verweildauer und niedrigeren Absprungraten korreliert.
Fehler, die Lesbarkeitsbewertungen irreführend machen
- Bewertung von weniger als 100 Wörtern. Alle Formeln sind statistisch und benötigen eine angemessene Stichprobe. Die Bewertung eines einzelnen Satzes oder eines Twitter-Beitrags führt zu wilden Schwankungen. Mindestens 200-300 Wörter für zuverlässiges Flesch-Kincaid; mindestens 30 Sätze für SMOG (seine ursprüngliche Spezifikation).
- Einer einzelnen Formel vertrauen. Jede Formel hat blinde Flecken. Flesch-Kincaid bestraft lange Wörter hart; Coleman-Liau ignoriert Wortfrequenz vollständig; SMOG rundet aggressiv. Die Meldung von drei Scores und die Bildung des Medians oder Bereichs gibt ein besseres Signal als eine einzelne Zahl.
- Ignorieren von domänenspezifischem Fachjargon. Ein medizinischer Artikel über «Myokardinfarkt» bewertet Stufe 15, selbst wenn die umgebenden Sätze einfach sind. Formeln sehen nur die Wortlänge, nicht die Vertrautheit mit dem Publikum. Kombinieren Sie Lesbarkeitsscores mit einem Glossar oder Erläuterungen bei der ersten Verwendung.
- Überoptimierung für Klassenstufe. Das Aufteilen jedes Satzes in 8 Wörter und das Ersetzen jedes mehrsilbigen Wortes erzeugt abgehackte, jugendliche Prosa, die für Erwachsene tatsächlich schwerer zu lesen ist. Zielen Sie auf die Klassenstufe des Publikums ab, nicht auf die niedrigstmögliche Zahl.
- Anwendung englischer Formeln auf andere Sprachen. Flesch-Kincaid ist auf englische Silbenmuster kalibriert. Spanisch, Deutsch, Finnisch, Japanisch benötigen alle ihre eigenen Kalibrierungen (Fernández Huerta für Spanisch, Amstad für Deutsch, Andersons RIX für allgemeinen Gebrauch). Die Ausführung englischer Formeln auf übersetztem Text gibt bedeutungslose Scores.
- Den Score als Verständnis behandeln. Lesbarkeitsformeln messen Oberflächenmerkmale. Sie können keine logische Verwirrung, fehlenden Kontext, technische Genauigkeit oder ob die Struktur Sinn ergibt, erkennen. Ein Artikel auf Stufe 6 kann immer noch unverständlich sein, wenn ihm Kohärenz fehlt.
- Einfügen von Text mit HTML oder Markup. Tags, URLs, Codeblöcke und Sonderzeichen verzerren die Satzerkennung und Wortzählungen. Entfernen Sie das Markup zuerst (dieses Tool versucht es, ist aber nicht perfekt für komplexes HTML/Markdown).
Weitere häufig gestellte Fragen
Welcher Formel sollte ich vertrauen, wenn sie nicht übereinstimmen?
Wählen Sie die Formel, die für Ihren Bereich kalibriert ist. Für Gesundheit und Patientenaufklärung ist SMOG die Empfehlung des US-Gesundheitsministeriums (es ist konservativ, neigt dazu, aufzurunden). Für allgemeine Webinhalte und Journalismus entspricht Flesch-Kincaid Grade Level dem, was Word, Google Docs und Yoast verwenden, daher ist Konsistenz mit Bearbeitungstools wichtig. Für automatisierte Bewertung (z. B. ein CI-Lint) sind Coleman-Liau oder ARI zuverlässiger, weil sie keine Silbenzählung benötigen (was in Software ungefähr ist). Wenn Formeln um mehr als 2 Stufen abweichen, schauen Sie sich den Text an: Ausreißer-Scores markieren normalerweise bestimmte Absätze.
Funktioniert das für nicht-englischen Text?
Englisch-kalibrierte Formeln geben in anderen Sprachen bedeutungslose Ergebnisse, weil die Silben-pro-Wort- und Wörter-pro-Satz-Verhältnisse abweichen. Für Spanisch verwenden Sie die Fernández Huerta-Formel. Für Deutsch Amstad oder Wiener Sachtextformel. Für Französisch die Kandel-Moles-Adaption. Für Japanisch, Chinesisch, Koreanisch lässt sich das Konzept «Silbe» nicht abbilden; Sie benötigen stattdessen Zeichendichte- und JLPT-Niveau-Analyse. Spezialisierte Tools wie readability.js haben separate Sprachpakete.
Warum ist die Flesch Reading Ease-Bewertung auf einer 0-100-Skala statt Klassenstufen?
Fleschs Papier von 1948 verwendete eine 0-100-Skala, wobei 90-100 = «sehr leicht» (4. Klasse), 60-70 = «Standard» (8-9. Klasse), 0-30 = «sehr schwierig» (Hochschulabsolvent). Die Kincaid-Neukalibrierung von 1975 übersetzte dieselben Oberflächenmerkmale in US-Klassenstufen für die Marine, die Leser mit Handbüchern abgleichen musste. Beide Formeln verwenden dieselben Eingaben (Silben/Wort, Wörter/Satz), aber unterschiedliche Ausgabeskalen. Die meisten modernen Tools (einschließlich dieses) melden beide, weil Vergleiche einfacher sind, wenn Sie Ihre bevorzugte Einheit wählen können.
Können KI-Schreibassistenten Lesbarkeitstools ersetzen?
LLMs (ChatGPT, Claude, Gemini) können einfachere Formulierungen vorschlagen, aber sie messen Lesbarkeit nicht zuverlässig, sie halluzinieren Scores, geben bei jedem Lauf unterschiedliche Zahlen an und mitteln über Absätze auf eine Weise, die Ausreißer verbirgt. Deterministische Formeln (die in diesem Tool) geben jedes Mal dieselbe Antwort und ermöglichen es, Bearbeitungen mit Score-Änderungen zu korrelieren. Der richtige Workflow: Verwenden Sie das LLM zum Umschreiben, verwenden Sie dann die Formel, um zu überprüfen, ob die Ziel-Klassenstufe tatsächlich erreicht wurde. Hemingway Editor (2014) war ein frühes Beispiel für die Kombination von Vorschlägen mit deterministischer Bewertung.
Wird mein Text an einen Server gesendet, wenn ich ihn bewerte?
Nein. Alle sechs Formeln (Flesch-Kincaid, Flesch Reading Ease, Gunning Fog, Coleman-Liau, SMOG, ARI) laufen in Ihrem Browser. Öffnen Sie den Network-Tab in DevTools während des Tippens oder Einfügens; Sie sehen null ausgehende Anfragen. Sicher für medizinische Entwürfe, interne Unternehmenskommunikation, unveröffentlichten Journalismus, rechtliche Entwürfe und alles, was unter NDA steht.