可读性分析器,免费
粘贴文本,根据五种公认公式立即查看其阅读等级。
结果会在您输入时实时更新。建议至少约 100 个单词以获得准确结果。
📚 学术基础与来源
此工具适用的人群
可读性评分对内容创作者、教师、健康传播人员以及任何面向多样受众写作的人都有益。根据美国国家教育统计中心(NCES)的数据,美国相当一部分成人的识字水平处于基础或更低等级(通过 PIAAC 测量)。CDC 和 NIH 建议健康文件以 6 年级水平撰写,以确保广泛理解。认知障碍者、学习障碍者、非母语者和老年人受复杂文本的影响尤为严重。
公式参考
- Flesch, R. (1948).「A new readability yardstick.」Journal of Applied Psychology, 32(3), 221–233。· 原始的 Flesch Reading Ease 公式;0–100 分制,得分越高表示阅读越容易。
- Kincaid, J.P., Fishburne, R.P., Rogers, R.L. & Chissom, B.S. (1975).「Derivation of new readability formulas for Navy enlisted personnel.」Research Branch Report 8-75, Naval Technical Training Command。· 重新校准了 Flesch 公式,产出美国年级水平。
- Gunning, R. (1952).The Technique of Clear Writing. McGraw-Hill。· Fog 指数估算读者第一遍理解文本所需的受教育年数。
- Coleman, M. & Liau, T.L. (1975).「A computer readability formula designed for machine scoring.」Journal of Applied Psychology, 60(2), 283–284。· 使用字符数而非音节数,以获得更可靠的自动评分。
- McLaughlin, G.H. (1969).「SMOG grading , a new readability formula.」Journal of Reading, 12(8), 639–646。· 被美国卫生部广泛视为评估健康素养的标准。
- Smith, E.A. & Senter, R.J. (1967).「Automated Readability Index.」AMRL-TR-66-220。Wright-Patterson Air Force Base。· 基于字符的公式,最初设计用于军用技术手册的自动评分。
免责声明
可读性公式基于文本的表层特征(词长、句长、音节数)提供统计估算。它们不衡量理解力、连贯性或内容的准确性。没有公式能完全考虑读者的先验知识、动机或认知、学习障碍的存在。这些分数应作为评估文本可访问性的多种指标之一使用。此工具不提供医疗、教育或法律建议。
可读性公式 75 年简史
可读性评分始于 Rudolf Flesch 在哥伦比亚大学 1943 年的博士工作,于 1948 年正式形成Flesch Reading Ease:0-100 分量表,分数越高越容易。美国海军在 1975 年(Kincaid 等,海军技术训练司令部报告 8-75)委托重新校准,将相同的表面特征(每词音节数、每句词数)映射到美国学校年级,这就是自 1990 年代初期以来内置于 Microsoft Word 中的 Flesch-Kincaid Grade Level。其他公式填补了空白:Robert Gunning 的 Fog 指数(1952)用于商业写作;McLaughlin 的 SMOG(1969),被美国卫生与公众服务部采纳为健康素养的黄金标准;Coleman-Liau(1975)和 ARI(Smith 和 Senter,1967)使用字符计数而非音节,避免了以编程方式计算音节的需要。Dale-Chall 公式(Edgar Dale,1948;1995 年修订)使用「熟悉」单词的词汇表。较新的 Lexile 框架(MetaMetrics,1989)和 ATOS(Renaissance Learning,1999)基于语料库,被美国学校使用。所有这些公式衡量的是代理指标,而非理解;将结果视为「可读性」而非「理解度」。
不同受众的目标年级水平
- 健康和医疗沟通。CDC 和 NIH 建议在6 年级或以下水平写作(Flesch Reading Ease ≥ 70, SMOG ≤ 8)。CDC 的 Clear Communication Index 和 AMA 的「Health Literacy」指南将其编纂。医院出院说明、疫苗信息单和患者同意书经常错过这一目标 4-6 个年级。
- 新闻和报道。路透社、AP 和 BBC 的内部风格针对9 年级水平(Flesch Reading Ease 60-70)。《纽约时报》平均约 9-10 年级,《经济学人》13-14 年级,《今日美国》6-7 年级。小报和 Reddit 帖子通常评分低于 8 年级。
- 法律和政府文件。美国 2010 年《Plain Writing Act》要求联邦机构用通俗语言书写公共文件;PlainLanguage.gov 建议最高 8 年级。英国Plain English Campaign(成立于 1979 年)针对消费者合同的目标是 9 年级。大多数保险单和 EULA 在 14-18 年级,远高于几乎任何消费者的阈值。
- 营销和 SEO 内容。Yoast SEO 和 Surfer 建议一般网页内容的 Flesch Reading Ease 高于 60(约 8 年级)。Buffer 分析了他们的博客,发现 6-9 年级的帖子比 13+ 年级的帖子参与度高 36%。Mailchimp 建议电子邮件主题行使用 7 年级水平。
- 教育和教科书。学校教科书针对比受众低一个年级:9 年级生物教科书针对 8 年级可读性,以便有困难的学生不会因语言被排除。Common Core Lexile 等级(2010)建议每个年级的特定分数范围。
- 技术文档。Microsoft、Google 和 Apple 的开发者文档等工具在教程内容中目标为 8-10 年级,允许参考材料使用更高的年级。MDN Web Docs 的「Plain language」重构(2018-2020)将平均年级从 14 降至 9。
- 学术写作。期刊文章通常评分为 14-20+ 年级,这对受众来说是合适的,但使它们无法被非专业人士访问。科学新闻(Quanta、Aeon、The Conversation)的目标是将其翻译到 10-12 年级。
可读性评分真正有帮助的地方
- 面向患者的健康内容。NHS Digital、Mayo Clinic、WebMD 和 Healthline 都在发布前进行可读性检查。错过 6 年级目标会排除大约一半基本读写能力的美国成年人(PIAAC 2017)。医院再入院率与患者对出院说明的理解相关。
- 起草和修订。评分是写作过程中的反馈信号,而非可发布指标。写草稿、评分、找出最高年级水平的段落(通常是长句或行话),简化这些,重新评分。Hemingway Editor(2014)和 Grammarly 专门为这个循环添加了年级水平反馈。
- 翻译和本地化。翻译记忆工具(MemoQ、SDL Trados、Phrase)在翻译之前对源文本进行评分,以标记复杂段落供高级语言学家处理。联合国教科文组织和联合国等国际组织以 6-8 年级为目标翻译,以最大化跨语言的受众覆盖。
- 无障碍性和 WCAG。WCAG 2.1 成功标准 3.1.5(阅读水平)为 AAA:「补充内容或不需要比初中教育水平更高阅读能力的版本」。axe DevTools 等工具尚未自动化,但内容作者使用可读性工具手动检查。
- 政府和公民沟通。美国《Plain Writing Act》(2010 年 10 月)、欧盟Clearer Communication倡议、英国 Government Digital Service(GDS)风格指南都要求通俗语言。税表、选民信息、福利申请经常评分高于 14 年级,评分是合规的试金石。
- 课程对齐。在为特定年级选择阅读材料时,教师将 Lexile 或 Flesch-Kincaid 分数与 Common Core 范围交叉参考。图书馆目录系统(Follett Destiny、Lexile.com)包含分数,让学生自己选择他们阅读水平的书籍。
- SEO 和内容营销。Google 的有用内容更新越来越青睐可读的内容。Yoast、Surfer、Clearscope 和 SemRush 都包含可读性评分。Buffer 的内容团队发现 Flesch Reading Ease 60-80 与更长的页面停留时间和更低的跳出率相关。
使可读性分数具有误导性的错误
- 对少于 100 字的文本评分。所有公式都是统计性的,需要合理的样本。对单句或 Twitter 帖子评分会产生剧烈波动。可靠的 Flesch-Kincaid 最少需要 200-300 字;SMOG 最少需要 30 句(其原始规范)。
- 相信单一公式。每个公式都有盲点。Flesch-Kincaid 严厉惩罚长词;Coleman-Liau 完全忽略词频;SMOG 积极取整。报告三个分数并取中位数或范围比任何单一数字给出更好的信号。
- 忽略领域特定术语。关于「心肌梗死」的医学文章即使周围句子简单,也会评为 15 年级。公式只看词长,不看与受众的熟悉度。将可读性分数与术语表或首次使用解释配对。
- 过度优化年级水平。将每个句子分成 8 个词并替换每个多音节词会产生支离破碎、幼稚的文章,对成年人来说实际上更难阅读。针对受众的年级水平,而不是最低可能的数字。
- 将英语公式应用于其他语言。Flesch-Kincaid 是为英语音节模式校准的。西班牙语、德语、芬兰语、日语都需要自己的校准(西班牙语用 Fernández Huerta,德语用 Amstad,通用用 Anderson 的 RIX)。对翻译文本运行英语公式会给出无意义的分数。
- 将分数视为理解。可读性公式衡量表面特征。它们无法检测逻辑混乱、缺失上下文、技术准确性,或结构是否有意义。6 年级文章如果缺乏连贯性,仍然可能无法理解。
- 粘贴带 HTML 或标记的文本。标签、URL、代码块和特殊字符会扭曲句子检测和词计数。先去掉标记(此工具尝试,但对于复杂的 HTML/Markdown 并不完美)。
更多常见问题
如果公式不一致,我应该相信哪一个?
选择为你的领域校准的公式。对于健康和患者教育,SMOG 是美国卫生与公众服务部的推荐(它保守,倾向于向上取整)。对于一般网页内容和新闻,Flesch-Kincaid Grade Level 与 Word、Google Docs 和 Yoast 使用的一致,因此与编辑工具的一致性很重要。对于自动评分(例如 CI lint),Coleman-Liau 或 ARI 更可靠,因为它们不需要音节计数(在软件中是近似的)。当公式相差超过 2 个年级时,查看文本:异常分数通常标记特定段落。
这对非英语文本有效吗?
为英语校准的公式在其他语言中给出无意义的结果,因为每词音节数和每句词数比率不同。对于西班牙语,使用Fernández Huerta公式。对于德语,Amstad或Wiener Sachtextformel。对于法语,Kandel-Moles改编。对于日语、中文、韩语,「音节」概念本身就不映射;你需要字符密度和 JLPT 等级分析。readability.js 等专门工具有单独的语言包。
为什么 Flesch Reading Ease 分数是 0-100 量表而不是年级水平?
Flesch 1948 年的论文使用 0-100 量表,其中90-100 =「非常容易」(4 年级),60-70 =「标准」(8-9 年级),0-30 =「非常困难」(大学毕业生)。1975 年的 Kincaid 重新校准将相同的表面特征转换为美国年级水平,供海军使用,海军需要将读者与手册匹配。两个公式使用相同的输入(音节/词、词/句),但不同的输出量表。大多数现代工具(包括这个)都报告两者,因为当你可以选择你喜欢的单位时,比较更容易。
AI 写作助手可以取代可读性工具吗?
LLM(ChatGPT、Claude、Gemini)可以建议更简单的措辞,但它们不能可靠地测量可读性,它们幻觉分数,每次运行给出不同的数字,并以隐藏异常值的方式跨段落平均。确定性公式(此工具中的公式)每次都给出相同的答案,让你将编辑与分数变化相关联。正确的工作流程:使用 LLM 重写,然后使用公式验证目标年级水平实际上已达到。Hemingway Editor(2014)是将建议与确定性评分相结合的早期示例。
我评分时,我的文本是否会发送到任何服务器?
不。所有六个公式(Flesch-Kincaid、Flesch Reading Ease、Gunning Fog、Coleman-Liau、SMOG、ARI)都在你的浏览器中运行。在键入或粘贴时打开 DevTools 中的 Network 标签;你会看到零出站请求。对医疗草稿、内部企业通信、未发表的新闻、法律草稿以及任何 NDA 约束的内容都是安全的。