Analyseur de lisibilité, gratuit
Collez du texte et visualisez instantanément son niveau de lecture selon cinq formules établies.
Les résultats se mettent à jour à mesure que vous tapez. Un minimum d'environ 100 mots est recommandé pour des résultats précis.
📚 Bases scientifiques et sources
Pour qui cet outil est conçu
L'évaluation de la lisibilité profite aux créateurs de contenu, aux enseignants, aux communicants en santé, et à quiconque rédige pour un public diversifié. Selon le National Center for Education Statistics (NCES), une part significative des adultes américains lisent à un niveau de littératie basique ou inférieur, mesuré par le PIAAC. Les CDC et le NIH recommandent que les documents de santé soient rédigés au niveau d'une 6e année (environ CM1/CM2 en France) pour assurer une compréhension large. Les personnes avec des troubles cognitifs, des troubles d'apprentissage, les locuteurs non natifs et les personnes âgées sont touchés de façon disproportionnée par les textes complexes.
Références des formules
- Flesch, R. (1948). « A new readability yardstick. » Journal of Applied Psychology, 32(3), 221–233. · Formule originale de Flesch Reading Ease ; une échelle 0–100 où un score plus élevé indique une lecture plus facile.
- Kincaid, J.P., Fishburne, R.P., Rogers, R.L. & Chissom, B.S. (1975). « Derivation of new readability formulas for Navy enlisted personnel. » Research Branch Report 8-75, Naval Technical Training Command. · A recalibré la formule de Flesch pour produire des niveaux scolaires américains.
- Gunning, R. (1952). The Technique of Clear Writing. McGraw-Hill. · Le Fog Index estime le nombre d'années d'études nécessaires pour comprendre un texte à la première lecture.
- Coleman, M. & Liau, T.L. (1975). « A computer readability formula designed for machine scoring. » Journal of Applied Psychology, 60(2), 283–284. · Utilise des décomptes de caractères plutôt que de syllabes pour un scoring automatisé plus fiable.
- McLaughlin, G.H. (1969). « SMOG grading, a new readability formula. » Journal of Reading, 12(8), 639–646. · Largement considéré comme la référence pour l'évaluation de la littératie en santé par le département américain de la Santé.
- Smith, E.A. & Senter, R.J. (1967). « Automated Readability Index. » AMRL-TR-66-220. Wright-Patterson Air Force Base. · Formule fondée sur les caractères, conçue à l'origine pour le scoring automatique des manuels techniques militaires.
Avertissement
Les formules de lisibilité fournissent des estimations statistiques basées sur des caractéristiques superficielles du texte (longueur des mots, longueur des phrases, nombre de syllabes). Elles ne mesurent ni la compréhension, ni la cohérence, ni l'exactitude du contenu. Aucune formule ne peut pleinement tenir compte des connaissances préalables du lecteur, de sa motivation, ni de la présence de troubles cognitifs ou d'apprentissage. Ces scores sont à utiliser comme un indicateur parmi d'autres lors de l'évaluation de l'accessibilité d'un texte. Cet outil ne fournit pas de conseil médical, éducatif ou juridique.
75 ans d'histoire des formules de lisibilité
Le scoring de lisibilité a commencé avec les travaux de doctorat de Rudolf Flesch à Columbia en 1943, formalisés en tant que Flesch Reading Ease en 1948 : un score 0-100 où plus élevé signifie plus facile. La marine américaine a commandé un recalibrage en 1975 (Kincaid et al., Rapport 8-75 du Naval Technical Training Command) qui a mappé les mêmes caractéristiques de surface (syllabes par mot, mots par phrase) aux niveaux scolaires américains, c'est le Flesch-Kincaid Grade Level intégré à Microsoft Word depuis le début des années 1990. D'autres formules ont comblé les lacunes : l'Index Fog de Robert Gunning (1952) pour l'écriture commerciale ; SMOG par McLaughlin (1969), adopté par le département américain de la Santé et des Services sociaux comme étalon-or pour la littératie en santé ; Coleman-Liau (1975) et ARI (Smith et Senter, 1967) utilisent des comptes de caractères au lieu de syllabes, évitant le besoin de compter les syllabes par programmation. La formule Dale-Chall (Edgar Dale, 1948 ; révisée 1995) utilise une liste de vocabulaire de mots «familiers». Le plus récent Lexile Framework (MetaMetrics, 1989) et ATOS (Renaissance Learning, 1999) sont basés sur corpus et utilisés par les écoles américaines. Toutes ces formules mesurent des proxies, pas de la compréhension ; traitez les résultats comme «lisibilité» et non «compréhension».
Niveaux scolaires cibles pour différents publics
- Communication santé et médicale. Le CDC et le NIH recommandent d'écrire à un niveau de 6e année ou moins (Flesch Reading Ease ≥ 70, SMOG ≤ 8). Le Clear Communication Index du CDC et les lignes directrices «Health Literacy» de l'AMA codifient cela. Les instructions de sortie d'hôpital, les fiches d'information vaccinales et les formulaires de consentement patient manquent régulièrement cette cible de 4-6 niveaux.
- Actualités et journalisme. Les styles maison Reuters, AP et BBC ciblent un niveau de 9e année (Flesch Reading Ease 60-70). Le New York Times est en moyenne autour du niveau 9-10, The Economist au niveau 13-14, USA Today niveau 6-7. Les journaux tabloïd et les publications Reddit notent souvent en dessous du niveau 8.
- Documents juridiques et gouvernementaux. Le Plain Writing Act américain de 2010 exige des agences fédérales qu'elles écrivent les documents publics en langage clair ; PlainLanguage.gov suggère le niveau 8 maximum. La Plain English Campaign britannique (fondée en 1979) cible le niveau 9 pour les contrats de consommation. La plupart des polices d'assurance et CLUF se situent au niveau 14-18, bien au-dessus du seuil de presque tout consommateur.
- Marketing et contenu SEO. Yoast SEO et Surfer recommandent un Flesch Reading Ease au-dessus de 60 (environ niveau 8) pour le contenu web général. Buffer a analysé son blog et trouvé que les articles aux niveaux 6-9 avaient 36 % d'engagement en plus que les articles au niveau 13+. Mailchimp recommande le niveau 7 pour les objets d'email.
- Éducation et manuels scolaires. Les manuels scolaires ciblent un niveau en dessous du public : un manuel de biologie de 9e année vise une lisibilité de niveau 8 pour que les élèves en difficulté ne soient pas exclus par le langage. Les bandes Lexile Common Core (2010) suggèrent des plages de scores spécifiques par niveau.
- Documentation technique. Des outils comme la documentation développeur Microsoft, Google et Apple visent le niveau 8-10 dans le contenu tutoriel, permettant des niveaux plus élevés pour le matériel de référence. La refonte «Plain language» de MDN Web Docs (2018-2020) a fait passer la note moyenne de 14 à 9.
- Écriture académique. Les articles de revues notent régulièrement au niveau 14-20+, ce qui est approprié pour le public mais les rend inaccessibles aux non-spécialistes. Le journalisme scientifique (Quanta, Aeon, The Conversation) vise à traduire vers le niveau 10-12.
Où le scoring de lisibilité aide vraiment
- Contenu santé destiné aux patients. NHS Digital, Mayo Clinic, WebMD et Healthline effectuent tous des vérifications de lisibilité avant publication. Manquer la cible de niveau 6 exclut environ la moitié des adultes américains au niveau d'alphabétisation de base (PIAAC 2017). Les taux de réadmission hospitalière sont corrélés à la compréhension par le patient des instructions de sortie.
- Rédaction et révision. Le score est un signal de rétroaction pendant l'écriture, pas une métrique publiable. Écrivez le brouillon, scorez-le, trouvez les paragraphes aux niveaux les plus élevés (généralement des phrases longues ou du jargon), simplifiez ceux-ci, rescorez. Hemingway Editor (2014) et Grammarly ont ajouté un retour de niveau scolaire spécifiquement pour cette boucle.
- Traduction et localisation. Les outils de mémoire de traduction (MemoQ, SDL Trados, Phrase) scorent le texte source avant la traduction pour signaler les passages complexes aux linguistes seniors. Les organisations internationales comme l'UNESCO et l'ONU traduisent à un niveau cible 6-8 pour maximiser la portée du public à travers les langues.
- Accessibilité et WCAG. Le critère de réussite WCAG 2.1 3.1.5 (Niveau de lecture) est AAA : «contenu supplémentaire ou une version qui ne nécessite pas une capacité de lecture plus avancée que le niveau d'éducation secondaire inférieur». Des outils comme axe DevTools n'automatisent pas encore ceci mais les auteurs de contenu vérifient manuellement à l'aide d'outils de lisibilité.
- Communication gouvernementale et civique. Le Plain Writing Act américain (octobre 2010), l'initiative Clearer Communication de l'UE, le guide de style UK Government Digital Service (GDS) imposent tous le langage clair. Les formulaires d'impôt, les informations électorales, les demandes d'allocations notent régulièrement au-dessus du niveau 14, le score est le test décisif pour la conformité.
- Alignement des programmes. Lors de la sélection de matériel de lecture pour un niveau spécifique, les enseignants croisent les scores Lexile ou Flesch-Kincaid avec les plages Common Core. Les systèmes de catalogues de bibliothèque (Follett Destiny, Lexile.com) incluent les scores afin que les élèves choisissent eux-mêmes les livres à leur niveau de lecture.
- SEO et marketing de contenu. Les mises à jour Helpful Content de Google favorisent de plus en plus le contenu lisible. Yoast, Surfer, Clearscope et SemRush incluent tous le scoring de lisibilité. L'équipe de contenu de Buffer a constaté que Flesch Reading Ease 60-80 est corrélé à un temps passé sur la page plus long et à des taux de rebond plus faibles.
Erreurs qui rendent les scores de lisibilité trompeurs
- Noter moins de 100 mots. Toutes les formules sont statistiques et nécessitent un échantillon raisonnable. Noter une seule phrase ou une publication Twitter donne des variations folles. 200-300 mots minimum pour un Flesch-Kincaid fiable ; 30 phrases minimum pour SMOG (sa spec originale).
- Faire confiance à une seule formule. Chaque formule a des angles morts. Flesch-Kincaid pénalise sévèrement les mots longs ; Coleman-Liau ignore complètement la fréquence des mots ; SMOG arrondit agressivement. Reporter trois scores et prendre la médiane ou la plage donne un meilleur signal qu'un seul nombre.
- Ignorer le jargon spécifique au domaine. Un article médical sur «l'infarctus du myocarde» note niveau 15 même si les phrases environnantes sont simples. Les formules ne voient que la longueur des mots, pas la familiarité avec le public. Associez les scores de lisibilité à un glossaire ou à des explications dès la première utilisation.
- Sur-optimiser pour le niveau scolaire. Diviser chaque phrase en 8 mots et remplacer chaque mot polysyllabique produit une prose saccadée et juvénile qui est en fait plus difficile à lire pour les adultes. Visez le niveau du public, pas le nombre le plus bas possible.
- Appliquer les formules anglaises à d'autres langues. Flesch-Kincaid est calibré pour les motifs syllabiques anglais. L'espagnol, l'allemand, le finnois, le japonais ont tous besoin de leurs propres calibrages (Fernández Huerta pour l'espagnol, Amstad pour l'allemand, RIX d'Anderson pour usage général). Faire tourner des formules anglaises sur du texte traduit donne des scores dénués de sens.
- Traiter le score comme une compréhension. Les formules de lisibilité mesurent les caractéristiques de surface. Elles ne peuvent pas détecter la confusion logique, le contexte manquant, l'exactitude technique, ou si la structure a du sens. Un article de niveau 6 peut toujours être incompréhensible s'il manque de cohérence.
- Coller du texte avec HTML ou balisage. Les balises, URL, blocs de code et caractères spéciaux faussent la détection de phrases et le comptage de mots. Supprimez le balisage d'abord (cet outil essaie mais n'est pas parfait pour le HTML/Markdown complexe).
Autres questions fréquemment posées
À quelle formule devrais-je faire confiance si elles sont en désaccord ?
Choisissez la formule calibrée pour votre domaine. Pour la santé et l'éducation des patients, SMOG est la recommandation du département américain de la Santé et des Services sociaux (elle est conservatrice, elle tend à arrondir vers le haut). Pour le contenu web général et le journalisme, Flesch-Kincaid Grade Level correspond à ce qu'utilisent Word, Google Docs et Yoast, donc la cohérence avec les outils d'édition importe. Pour le scoring automatisé (par exemple un lint CI), Coleman-Liau ou ARI sont plus fiables car ils n'ont pas besoin de compter les syllabes (ce qui est approximatif dans le logiciel). Quand les formules diffèrent de plus de 2 niveaux, regardez le texte : les scores aberrants signalent généralement des paragraphes spécifiques.
Cela fonctionne-t-il pour du texte non anglais ?
Les formules calibrées pour l'anglais donnent des résultats dénués de sens dans d'autres langues car les ratios syllabes-par-mot et mots-par-phrase diffèrent. Pour l'espagnol, utilisez la formule Fernández Huerta. Pour l'allemand, Amstad ou Wiener Sachtextformel. Pour le français, l'adaptation Kandel-Moles. Pour le japonais, chinois, coréen, le concept même de «syllabe» ne se mappe pas ; vous avez besoin à la place d'une analyse de densité de caractères et de niveau JLPT. Des outils spécialisés comme readability.js ont des packs de langues séparés.
Pourquoi le score Flesch Reading Ease est-il sur une échelle 0-100 au lieu de niveaux scolaires ?
Le papier de Flesch de 1948 utilisait une échelle 0-100 où 90-100 = «très facile» (4e année), 60-70 = «standard» (8-9e année), 0-30 = «très difficile» (diplômé universitaire). Le recalibrage Kincaid de 1975 a traduit les mêmes caractéristiques de surface en niveaux scolaires américains pour la marine, qui devait associer les lecteurs aux manuels. Les deux formules utilisent les mêmes entrées (syllabes/mot, mots/phrase) mais des échelles de sortie différentes. La plupart des outils modernes (y compris celui-ci) rapportent les deux car les comparaisons sont plus faciles quand on peut choisir son unité préférée.
Les assistants d'écriture IA peuvent-ils remplacer les outils de lisibilité ?
Les LLM (ChatGPT, Claude, Gemini) peuvent suggérer une formulation plus simple mais ils ne mesurent pas la lisibilité de manière fiable, ils hallucinent les scores, donnent des nombres différents à chaque essai, et font des moyennes sur les paragraphes d'une manière qui cache les valeurs aberrantes. Les formules déterministes (celles de cet outil) donnent la même réponse à chaque fois et permettent de corréler les modifications aux changements de score. Le bon flux : utilisez le LLM pour réécrire, puis utilisez la formule pour vérifier que le niveau cible a réellement été atteint. Hemingway Editor (2014) était un exemple précoce de combinaison de suggestions et de scoring déterministe.
Mon texte est-il envoyé à un serveur lorsque je le note ?
Non. Les six formules (Flesch-Kincaid, Flesch Reading Ease, Gunning Fog, Coleman-Liau, SMOG, ARI) tournent dans votre navigateur. Ouvrez l'onglet Network dans DevTools pendant que vous tapez ou collez ; vous verrez zéro requête sortante. Sûr pour les brouillons médicaux, communications internes d'entreprise, journalisme non publié, brouillons juridiques et tout ce qui est sous NDA.