Công cụ Chấm Điểm Khả Năng Đọc
Dán văn bản và xem ngay mức độ đọc của nó theo năm công thức được thiết lập.
Kết quả cập nhật khi bạn gõ. Tối thiểu khoảng 100 từ được khuyến nghị để có kết quả chính xác.
📚 Cơ sở khoa học và nguồn
Công cụ này dành cho ai
Đánh giá độ dễ đọc có lợi cho người tạo nội dung, giáo viên, người truyền thông sức khỏe và bất kỳ ai viết cho đối tượng đa dạng. Theo Trung tâm Thống kê Giáo dục Quốc gia (NCES), một phần đáng kể người trưởng thành Mỹ đọc ở mức độ biết chữ cơ bản hoặc thấp hơn, được đo bằng PIAAC. CDC và NIH khuyến nghị rằng các tài liệu sức khỏe được viết ở mức độ lớp 6 (tương đương lớp 5/lớp 6 ở Pháp) để đảm bảo sự hiểu biết rộng rãi. Người mắc rối loạn nhận thức, rối loạn học tập, người không nói tiếng mẹ đẻ và người cao tuổi bị ảnh hưởng không cân xứng bởi văn bản phức tạp.
Tài liệu tham khảo công thức
- Flesch, R. (1948). « A new readability yardstick. » Journal of Applied Psychology, 32(3), 221–233. · Công thức Flesch Reading Ease gốc; thang điểm 0–100 trong đó điểm cao hơn cho thấy đọc dễ hơn.
- Kincaid, J.P., Fishburne, R.P., Rogers, R.L. & Chissom, B.S. (1975). « Derivation of new readability formulas for Navy enlisted personnel. » Research Branch Report 8-75, Naval Technical Training Command. · Đã hiệu chỉnh lại công thức Flesch để tạo ra các cấp độ học của Mỹ.
- Gunning, R. (1952). The Technique of Clear Writing. McGraw-Hill. · Chỉ số Fog ước tính số năm học cần thiết để hiểu văn bản trong lần đọc đầu tiên.
- Coleman, M. & Liau, T.L. (1975). « A computer readability formula designed for machine scoring. » Journal of Applied Psychology, 60(2), 283–284. · Sử dụng đếm ký tự thay vì âm tiết để chấm điểm tự động đáng tin cậy hơn.
- McLaughlin, G.H. (1969). « SMOG grading, a new readability formula. » Journal of Reading, 12(8), 639–646. · Được công nhận rộng rãi là tiêu chuẩn để đánh giá biết chữ về sức khỏe bởi Bộ Y tế Hoa Kỳ.
- Smith, E.A. & Senter, R.J. (1967). « Automated Readability Index. » AMRL-TR-66-220. Wright-Patterson Air Force Base. · Công thức dựa trên ký tự, ban đầu được thiết kế để chấm điểm tự động các sách hướng dẫn kỹ thuật quân sự.
Tuyên bố từ chối
Các công thức độ dễ đọc cung cấp ước tính thống kê dựa trên các đặc điểm bề mặt của văn bản (độ dài từ, độ dài câu, số âm tiết). Chúng không đo lường sự hiểu biết, sự mạch lạc hay tính chính xác của nội dung. Không có công thức nào có thể tính đến đầy đủ kiến thức nền của người đọc, động lực của họ hoặc sự hiện diện của rối loạn nhận thức hoặc học tập. Các điểm này được sử dụng như một chỉ số trong số những chỉ số khác khi đánh giá khả năng tiếp cận của một văn bản. Công cụ này không cung cấp tư vấn y tế, giáo dục hoặc pháp lý.
75 năm lịch sử của các công thức khả đọc
Việc chấm điểm khả đọc bắt đầu với công trình tiến sĩ của Rudolf Flesch tại Columbia vào năm 1943, được chính thức hóa thành Flesch Reading Ease vào năm 1948: điểm 0-100 trong đó cao hơn nghĩa là dễ hơn. Hải quân Hoa Kỳ ủy thác việc tái hiệu chuẩn vào năm 1975 (Kincaid và cộng sự, Báo cáo 8-75 của Naval Technical Training Command) ánh xạ các đặc điểm bề mặt tương tự (âm tiết trên từ, từ trên câu) vào các cấp lớp học của Hoa Kỳ, đây là Flesch-Kincaid Grade Level được tích hợp vào Microsoft Word từ đầu những năm 1990. Các công thức khác lấp đầy các khoảng trống: Fog Index của Robert Gunning (1952) cho viết kinh doanh; SMOG của McLaughlin (1969), được Bộ Y tế và Dịch vụ Nhân sinh Hoa Kỳ áp dụng làm tiêu chuẩn vàng cho khả năng đọc viết về sức khỏe; Coleman-Liau (1975) và ARI (Smith & Senter, 1967) sử dụng số lượng ký tự thay vì âm tiết, tránh nhu cầu đếm âm tiết theo lập trình. Công thức Dale-Chall (Edgar Dale, 1948; sửa đổi 1995) sử dụng danh sách từ vựng các từ «quen thuộc». Lexile Framework mới hơn (MetaMetrics, 1989) và ATOS (Renaissance Learning, 1999) dựa trên corpus và được các trường học Hoa Kỳ sử dụng. Tất cả các công thức này đo các đại diện, không phải sự hiểu biết; coi kết quả là «khả đọc» chứ không phải «hiểu».
Cấp lớp mục tiêu cho các đối tượng khác nhau
- Truyền thông y tế và sức khỏe. CDC và NIH khuyến nghị viết ở cấp lớp 6 hoặc thấp hơn (Flesch Reading Ease ≥ 70, SMOG ≤ 8). Chỉ số Truyền thông Rõ ràng của CDC và hướng dẫn «Khả năng đọc viết về sức khỏe» của AMA mã hóa điều này. Hướng dẫn xuất viện bệnh viện, tờ thông tin vắc-xin và mẫu đồng ý của bệnh nhân thường xuyên không đạt được mục tiêu này từ 4-6 cấp lớp.
- Tin tức và báo chí. Phong cách nhà của Reuters, AP và BBC nhắm vào cấp lớp 9 (Flesch Reading Ease 60-70). New York Times trung bình khoảng cấp 9-10, The Economist cấp 13-14, USA Today cấp 6-7. Báo tabloid và bài đăng Reddit thường có điểm dưới cấp 8.
- Tài liệu pháp lý và chính phủ. Đạo luật Plain Writing của Hoa Kỳ năm 2010 yêu cầu các cơ quan liên bang viết tài liệu công khai bằng ngôn ngữ đơn giản; PlainLanguage.gov đề xuất tối đa cấp 8. Plain English Campaign của Vương quốc Anh (thành lập năm 1979) nhắm vào cấp 9 cho hợp đồng tiêu dùng. Hầu hết các chính sách bảo hiểm và EULA nằm ở cấp 14-18, vượt xa ngưỡng của hầu hết người tiêu dùng.
- Nội dung tiếp thị và SEO. Yoast SEO và Surfer khuyến nghị Flesch Reading Ease trên 60 (khoảng cấp 8) cho nội dung web nói chung. Buffer đã phân tích blog của họ và phát hiện rằng các bài đăng ở cấp 6-9 có mức độ tương tác cao hơn 36% so với các bài đăng ở cấp 13+. Mailchimp khuyến nghị cấp 7 cho dòng chủ đề email.
- Giáo dục và sách giáo khoa. Sách giáo khoa trường học nhắm vào một cấp lớp thấp hơn đối tượng: sách giáo khoa sinh học lớp 9 nhắm vào khả đọc cấp 8 để học sinh đang gặp khó khăn không bị loại trừ bởi ngôn ngữ. Các dải Lexile Common Core (2010) đề xuất các phạm vi điểm cụ thể trên mỗi cấp.
- Tài liệu kỹ thuật. Các công cụ như tài liệu nhà phát triển của Microsoft, Google và Apple nhắm vào cấp 8-10 trong nội dung hướng dẫn, cho phép cấp cao hơn cho tài liệu tham khảo. Việc tái cấu trúc «Plain language» của MDN Web Docs (2018-2020) đã giảm cấp trung bình từ 14 xuống 9.
- Viết học thuật. Các bài báo tạp chí thường xuyên có điểm cấp 14-20+, điều này phù hợp với đối tượng nhưng khiến chúng không thể tiếp cận được với những người không phải chuyên gia. Báo chí khoa học (Quanta, Aeon, The Conversation) nhắm tới việc dịch xuống cấp 10-12.
Nơi điểm khả đọc thực sự hữu ích
- Nội dung sức khỏe hướng đến bệnh nhân. NHS Digital, Mayo Clinic, WebMD và Healthline đều chạy kiểm tra khả đọc trước khi xuất bản. Không đạt được mục tiêu cấp 6 loại trừ khoảng một nửa người lớn Hoa Kỳ ở mức khả năng đọc viết cơ bản (PIAAC 2017). Tỷ lệ tái nhập viện liên quan đến sự hiểu biết của bệnh nhân về hướng dẫn xuất viện.
- Soạn thảo và sửa đổi. Điểm là tín hiệu phản hồi trong quá trình viết, không phải chỉ số có thể xuất bản. Viết bản nháp, chấm điểm, tìm các đoạn văn có cấp cao nhất (thường là câu dài hoặc thuật ngữ), đơn giản hóa những đoạn đó, chấm điểm lại. Hemingway Editor (2014) và Grammarly đã thêm phản hồi cấp lớp cụ thể cho vòng lặp này.
- Dịch thuật và bản địa hóa. Các công cụ bộ nhớ dịch thuật (MemoQ, SDL Trados, Phrase) chấm điểm văn bản nguồn trước khi dịch để gắn cờ các đoạn phức tạp cho các nhà ngôn ngữ học cấp cao. Các tổ chức quốc tế như UNESCO và Liên hợp quốc dịch ở cấp mục tiêu 6-8 để tối đa hóa tầm tiếp cận đối tượng qua các ngôn ngữ.
- Khả năng tiếp cận và WCAG. Tiêu chí Thành công WCAG 2.1 3.1.5 (Mức đọc) là AAA: «nội dung bổ sung hoặc một phiên bản không yêu cầu khả năng đọc nâng cao hơn cấp giáo dục trung học cơ sở thấp hơn». Các công cụ như axe DevTools chưa tự động hóa điều này nhưng các tác giả nội dung kiểm tra thủ công bằng cách sử dụng các công cụ khả đọc.
- Truyền thông chính phủ và dân sự. Đạo luật Plain Writing của Hoa Kỳ (tháng 10/2010), sáng kiến Clearer Communication của EU, hướng dẫn phong cách UK Government Digital Service (GDS) đều bắt buộc ngôn ngữ đơn giản. Mẫu thuế, thông tin cử tri, đơn xin phúc lợi thường xuyên có điểm trên cấp 14, điểm là phép thử quyết định cho việc tuân thủ.
- Căn chỉnh chương trình giảng dạy. Khi chọn tài liệu đọc cho một cấp cụ thể, giáo viên tham chiếu chéo điểm Lexile hoặc Flesch-Kincaid với các phạm vi Common Core. Các hệ thống danh mục thư viện (Follett Destiny, Lexile.com) bao gồm điểm để học sinh tự chọn sách ở cấp đọc của mình.
- SEO và tiếp thị nội dung. Các cập nhật nội dung hữu ích của Google ngày càng ưu ái nội dung dễ đọc. Yoast, Surfer, Clearscope và SemRush đều bao gồm điểm khả đọc. Nhóm nội dung của Buffer phát hiện rằng Flesch Reading Ease 60-80 tương quan với thời gian trên trang lâu hơn và tỷ lệ thoát thấp hơn.
Những sai lầm khiến điểm khả đọc gây hiểu lầm
- Chấm điểm ít hơn 100 từ. Tất cả các công thức đều mang tính thống kê và cần một mẫu hợp lý. Chấm điểm một câu đơn hoặc bài đăng Twitter tạo ra biến động hoang dã. Tối thiểu 200-300 từ cho Flesch-Kincaid đáng tin cậy; tối thiểu 30 câu cho SMOG (đặc tả gốc của nó).
- Tin tưởng một công thức duy nhất. Mỗi công thức có điểm mù. Flesch-Kincaid phạt nặng các từ dài; Coleman-Liau hoàn toàn bỏ qua tần suất từ; SMOG làm tròn mạnh mẽ. Báo cáo ba điểm và lấy trung vị hoặc khoảng cho tín hiệu tốt hơn bất kỳ con số đơn lẻ nào.
- Bỏ qua thuật ngữ chuyên ngành. Một bài báo y khoa về «nhồi máu cơ tim» có điểm cấp 15 ngay cả khi các câu xung quanh đơn giản. Các công thức chỉ thấy độ dài từ, không phải sự quen thuộc với đối tượng. Kết hợp điểm khả đọc với một danh sách thuật ngữ hoặc giải thích lần đầu sử dụng.
- Tối ưu hóa quá mức cho cấp lớp. Chia mỗi câu thành 8 từ và thay thế mỗi từ đa âm tiết tạo ra văn xuôi chia cắt, trẻ con thực sự khó đọc hơn cho người lớn. Nhắm vào cấp lớp của đối tượng, không phải con số thấp nhất có thể.
- Áp dụng các công thức tiếng Anh cho các ngôn ngữ khác. Flesch-Kincaid được hiệu chuẩn cho các mẫu âm tiết tiếng Anh. Tiếng Tây Ban Nha, Đức, Phần Lan, Nhật đều cần hiệu chuẩn riêng (Fernández Huerta cho tiếng Tây Ban Nha, Amstad cho tiếng Đức, RIX của Anderson cho mục đích chung). Chạy các công thức tiếng Anh trên văn bản đã dịch cho điểm vô nghĩa.
- Coi điểm là sự hiểu biết. Các công thức khả đọc đo các đặc điểm bề mặt. Chúng không thể phát hiện sự nhầm lẫn logic, thiếu ngữ cảnh, độ chính xác kỹ thuật, hoặc liệu cấu trúc có ý nghĩa hay không. Một bài báo cấp 6 vẫn có thể không thể hiểu được nếu thiếu sự mạch lạc.
- Dán văn bản có HTML hoặc đánh dấu. Thẻ, URL, khối mã và ký tự đặc biệt làm sai lệch phát hiện câu và số đếm từ. Loại bỏ đánh dấu trước (công cụ này cố gắng nhưng không hoàn hảo cho HTML/Markdown phức tạp).
Thêm các câu hỏi thường gặp
Tôi nên tin công thức nào nếu chúng không đồng ý?
Chọn công thức được hiệu chuẩn cho lĩnh vực của bạn. Đối với sức khỏe và giáo dục bệnh nhân, SMOG là khuyến nghị của Bộ Y tế và Dịch vụ Nhân sinh Hoa Kỳ (nó bảo thủ, có xu hướng làm tròn lên). Đối với nội dung web nói chung và báo chí, Flesch-Kincaid Grade Level khớp với những gì Word, Google Docs và Yoast sử dụng, vì vậy tính nhất quán với các công cụ chỉnh sửa là quan trọng. Đối với chấm điểm tự động (ví dụ: lint CI), Coleman-Liau hoặc ARI đáng tin cậy hơn vì chúng không cần đếm âm tiết (đó là gần đúng trong phần mềm). Khi các công thức khác nhau hơn 2 cấp, hãy nhìn vào văn bản: điểm ngoại lệ thường gắn cờ các đoạn cụ thể.
Điều này có hoạt động cho văn bản không phải tiếng Anh không?
Các công thức được hiệu chuẩn cho tiếng Anh cho kết quả vô nghĩa trong các ngôn ngữ khác vì tỷ lệ âm tiết-trên-từ và từ-trên-câu khác nhau. Đối với tiếng Tây Ban Nha, sử dụng công thức Fernández Huerta. Đối với tiếng Đức, Amstad hoặc Wiener Sachtextformel. Đối với tiếng Pháp, sự thích nghi Kandel-Moles. Đối với tiếng Nhật, Trung Quốc, Hàn Quốc, khái niệm «âm tiết» tự nó không ánh xạ; bạn cần phân tích mật độ ký tự và cấp độ JLPT thay vào đó. Các công cụ chuyên dụng như readability.js có các gói ngôn ngữ riêng biệt.
Tại sao điểm Flesch Reading Ease lại trên thang 0-100 thay vì các cấp lớp?
Bài báo 1948 của Flesch sử dụng thang 0-100 trong đó 90-100 = «rất dễ» (lớp 4), 60-70 = «tiêu chuẩn» (lớp 8-9), 0-30 = «rất khó» (tốt nghiệp đại học). Việc tái hiệu chuẩn Kincaid 1975 đã dịch các đặc điểm bề mặt tương tự thành các cấp lớp Hoa Kỳ cho Hải quân, vốn cần khớp người đọc với sách hướng dẫn. Cả hai công thức đều sử dụng các đầu vào giống nhau (âm tiết/từ, từ/câu) nhưng các thang đầu ra khác nhau. Hầu hết các công cụ hiện đại (bao gồm cả công cụ này) báo cáo cả hai vì so sánh dễ dàng hơn khi bạn có thể chọn đơn vị ưa thích của mình.
Các trợ lý viết AI có thể thay thế các công cụ khả đọc không?
LLM (ChatGPT, Claude, Gemini) có thể đề xuất từ ngữ đơn giản hơn nhưng chúng không đo khả đọc một cách đáng tin cậy, chúng ảo giác điểm, cho con số khác nhau mỗi lần chạy, và lấy trung bình qua các đoạn theo cách che giấu các giá trị ngoại lai. Các công thức xác định (những công thức trong công cụ này) cho câu trả lời giống nhau mỗi lần và cho phép bạn tương quan các chỉnh sửa với thay đổi điểm. Quy trình làm việc đúng: sử dụng LLM để viết lại, sau đó sử dụng công thức để xác minh rằng cấp lớp mục tiêu thực sự đã đạt được. Hemingway Editor (2014) là một ví dụ ban đầu về việc kết hợp các đề xuất với chấm điểm xác định.
Văn bản của tôi có được gửi đến bất kỳ máy chủ nào khi tôi chấm điểm không?
Không. Tất cả sáu công thức (Flesch-Kincaid, Flesch Reading Ease, Gunning Fog, Coleman-Liau, SMOG, ARI) chạy trong trình duyệt của bạn. Mở tab Network trong DevTools khi đang gõ hoặc dán; bạn sẽ thấy không có yêu cầu nào đi ra. An toàn cho các bản nháp y tế, truyền thông nội bộ doanh nghiệp, báo chí chưa xuất bản, bản nháp pháp lý và bất cứ điều gì thuộc NDA.