Penilaian Keterbacaan
Tempel teks dan lihat tingkat bacaannya secara seketika menurut lima rumus yang ditetapkan.
Hasil diperbarui saat Anda mengetik. Minimum sekitar 100 kata direkomendasikan untuk hasil yang akurat.
📚 Dasar ilmiah dan sumber
Untuk siapa alat ini dirancang
Penilaian keterbacaan menguntungkan pencipta konten, pendidik, komunikator kesehatan, dan siapa saja yang menulis untuk audiens yang beragam. Menurut National Center for Education Statistics (NCES), sebagian besar orang dewasa AS membaca pada tingkat literasi dasar atau lebih rendah, yang diukur oleh PIAAC. CDC dan NIH merekomendasikan dokumen kesehatan ditulis pada tingkat kelas 6 (sekitar SD-SMP) untuk memastikan pemahaman yang luas. Orang dengan gangguan kognitif, gangguan belajar, penutur non-asli, dan lansia secara tidak proporsional terpengaruh oleh teks yang kompleks.
Referensi rumus
- Flesch, R. (1948). "A new readability yardstick." Journal of Applied Psychology, 32(3), 221–233. · Rumus Flesch Reading Ease asli; skala 0–100 di mana skor lebih tinggi menunjukkan bacaan yang lebih mudah.
- Kincaid, J.P., Fishburne, R.P., Rogers, R.L. & Chissom, B.S. (1975). "Derivation of new readability formulas for Navy enlisted personnel." Research Branch Report 8-75, Naval Technical Training Command. · Mengkalibrasi ulang rumus Flesch untuk menghasilkan tingkat kelas AS.
- Gunning, R. (1952). The Technique of Clear Writing. McGraw-Hill. · Fog Index memperkirakan jumlah tahun pendidikan yang dibutuhkan untuk memahami teks pada bacaan pertama.
- Coleman, M. & Liau, T.L. (1975). "A computer readability formula designed for machine scoring." Journal of Applied Psychology, 60(2), 283–284. · Menggunakan jumlah karakter daripada suku kata untuk skor otomatis yang lebih andal.
- McLaughlin, G.H. (1969). "SMOG grading, a new readability formula." Journal of Reading, 12(8), 639–646. · Banyak dianggap sebagai standar emas untuk penilaian literasi kesehatan oleh Departemen Kesehatan AS.
- Smith, E.A. & Senter, R.J. (1967). "Automated Readability Index." AMRL-TR-66-220. Wright-Patterson Air Force Base. · Rumus berbasis karakter yang awalnya dirancang untuk penilaian otomatis manual teknis militer.
Penafian
Rumus keterbacaan memberikan estimasi statistik berdasarkan karakteristik teks yang dangkal (panjang kata, panjang kalimat, jumlah suku kata). Mereka tidak mengukur pemahaman, koherensi, atau akurasi konten. Tidak ada rumus yang sepenuhnya dapat memperhitungkan pengetahuan sebelumnya pembaca, motivasinya, atau keberadaan gangguan kognitif atau belajar. Skor ini digunakan sebagai indikator di antara yang lain saat mengevaluasi aksesibilitas teks. Alat ini tidak memberikan nasihat medis, pendidikan, atau hukum.
Sejarah 75 tahun formula keterbacaan
Penilaian keterbacaan dimulai dengan karya doktoral Rudolf Flesch di Columbia pada 1943, diformalkan sebagai Flesch Reading Ease pada 1948: skor 0-100 di mana lebih tinggi berarti lebih mudah. Angkatan Laut AS memesan rekalibrasi pada 1975 (Kincaid dkk., Laporan 8-75 Naval Technical Training Command) yang memetakan fitur permukaan yang sama (suku kata per kata, kata per kalimat) ke tingkat kelas sekolah AS, ini adalah Flesch-Kincaid Grade Level yang sudah ada di Microsoft Word sejak awal 1990-an. Formula lain mengisi celah: Fog Index Robert Gunning (1952) untuk penulisan bisnis; SMOG oleh McLaughlin (1969), diadopsi oleh Departemen Kesehatan dan Layanan Manusia AS sebagai standar emas untuk literasi kesehatan; Coleman-Liau (1975) dan ARI (Smith & Senter, 1967) menggunakan hitungan karakter daripada suku kata, menghindari kebutuhan menghitung suku kata secara terprogram. Formula Dale-Chall (Edgar Dale, 1948; direvisi 1995) menggunakan daftar kosa kata kata «familiar». Yang lebih baru Lexile Framework (MetaMetrics, 1989) dan ATOS (Renaissance Learning, 1999) berbasis korpus dan digunakan oleh sekolah AS. Semua formula ini mengukur proksi, bukan pemahaman; perlakukan hasil sebagai «keterbacaan» bukan «pemahaman».
Tingkat kelas target untuk audiens berbeda
- Komunikasi kesehatan dan medis. CDC dan NIH merekomendasikan penulisan pada tingkat kelas 6 atau di bawah (Flesch Reading Ease ≥ 70, SMOG ≤ 8). Clear Communication Index CDC dan pedoman «Health Literacy» AMA mengkodifikasi ini. Instruksi pemulangan rumah sakit, lembar informasi vaksin, dan formulir persetujuan pasien secara teratur meleset dari target ini sebesar 4-6 tingkat kelas.
- Berita dan jurnalisme. Gaya rumah Reuters, AP, dan BBC menargetkan tingkat kelas 9 (Flesch Reading Ease 60-70). New York Times rata-rata sekitar tingkat 9-10, The Economist tingkat 13-14, USA Today tingkat 6-7. Surat kabar tabloid dan posting Reddit sering mencetak di bawah tingkat 8.
- Dokumen hukum dan pemerintah. Plain Writing Act AS 2010 mengharuskan badan federal menulis dokumen publik dalam bahasa biasa; PlainLanguage.gov menyarankan maksimum tingkat 8. Plain English Campaign Inggris (didirikan 1979) menargetkan tingkat 9 untuk kontrak konsumen. Sebagian besar polis asuransi dan EULA berada di tingkat 14-18, jauh di atas ambang batas hampir semua konsumen.
- Konten pemasaran dan SEO. Yoast SEO dan Surfer merekomendasikan Flesch Reading Ease di atas 60 (sekitar tingkat 8) untuk konten web umum. Buffer menganalisis blog mereka dan menemukan bahwa postingan pada tingkat 6-9 memiliki keterlibatan 36% lebih tinggi daripada postingan pada tingkat 13+. Mailchimp merekomendasikan tingkat 7 untuk baris subjek email.
- Pendidikan dan buku teks. Buku teks sekolah menargetkan satu tingkat kelas di bawah audiens: buku teks biologi kelas 9 menargetkan keterbacaan tingkat 8 sehingga siswa yang berjuang tidak dikecualikan oleh bahasa. Pita Lexile Common Core (2010) menyarankan rentang skor tertentu per tingkat.
- Dokumentasi teknis. Alat seperti dokumentasi pengembang Microsoft, Google, dan Apple menargetkan tingkat 8-10 dalam konten tutorial, memungkinkan tingkat lebih tinggi untuk materi referensi. Refaktor «Plain language» MDN Web Docs (2018-2020) menurunkan tingkat rata-rata dari 14 menjadi 9.
- Penulisan akademik. Artikel jurnal secara rutin mencetak tingkat 14-20+, yang sesuai untuk audiens tetapi membuatnya tidak dapat diakses oleh non-spesialis. Jurnalisme sains (Quanta, Aeon, The Conversation) bertujuan menerjemahkan ke tingkat 10-12.
Di mana penilaian keterbacaan benar-benar membantu
- Konten kesehatan menghadap pasien. NHS Digital, Mayo Clinic, WebMD, dan Healthline semua menjalankan pemeriksaan keterbacaan sebelum penerbitan. Meleset dari target tingkat 6 mengecualikan sekitar setengah orang dewasa AS pada literasi dasar (PIAAC 2017). Tingkat masuk ulang rumah sakit berkorelasi dengan pemahaman pasien tentang instruksi pemulangan.
- Penyusunan dan revisi. Skor adalah sinyal umpan balik selama penulisan, bukan metrik yang dapat dipublikasikan. Tulis draf, beri skor, temukan paragraf tingkat kelas tertinggi (biasanya kalimat panjang atau jargon), sederhanakan itu, beri skor ulang. Hemingway Editor (2014) dan Grammarly menambahkan umpan balik tingkat kelas khusus untuk loop ini.
- Penerjemahan dan pelokalan. Alat memori penerjemahan (MemoQ, SDL Trados, Phrase) menilai teks sumber sebelum penerjemahan untuk menandai bagian kompleks bagi ahli bahasa senior. Organisasi internasional seperti UNESCO dan PBB menerjemahkan pada tingkat target 6-8 untuk memaksimalkan jangkauan audiens lintas bahasa.
- Aksesibilitas dan WCAG. Kriteria sukses WCAG 2.1 3.1.5 (Tingkat Membaca) adalah AAA: «konten tambahan atau versi yang tidak memerlukan kemampuan membaca yang lebih maju daripada tingkat pendidikan menengah bawah». Alat seperti axe DevTools belum mengotomatiskan ini, tetapi penulis konten memeriksa secara manual menggunakan alat keterbacaan.
- Komunikasi pemerintah dan sipil. Plain Writing Act AS (Oktober 2010), inisiatif Clearer Communication UE, panduan gaya UK Government Digital Service (GDS) semua memerintahkan bahasa biasa. Formulir pajak, informasi pemilih, aplikasi tunjangan secara rutin mencetak di atas tingkat 14, skor adalah uji kompas untuk kepatuhan.
- Penyelarasan kurikulum. Saat memilih materi bacaan untuk tingkat tertentu, guru memeriksa silang skor Lexile atau Flesch-Kincaid dengan rentang Common Core. Sistem katalog perpustakaan (Follett Destiny, Lexile.com) menyertakan skor sehingga siswa memilih sendiri buku pada tingkat bacaan mereka.
- SEO dan pemasaran konten. Pembaruan konten bermanfaat Google semakin menyukai konten yang dapat dibaca. Yoast, Surfer, Clearscope, dan SemRush semuanya menyertakan penilaian keterbacaan. Tim konten Buffer menemukan bahwa Flesch Reading Ease 60-80 berkorelasi dengan waktu di halaman yang lebih lama dan tingkat bouncing yang lebih rendah.
Kesalahan yang membuat skor keterbacaan menyesatkan
- Menilai kurang dari 100 kata. Semua formula bersifat statistik dan membutuhkan sampel yang masuk akal. Menilai satu kalimat atau posting Twitter menghasilkan ayunan liar. Minimum 200-300 kata untuk Flesch-Kincaid yang andal; minimum 30 kalimat untuk SMOG (spesifikasi aslinya).
- Memercayai satu formula. Setiap formula memiliki titik buta. Flesch-Kincaid menghukum kata panjang keras; Coleman-Liau mengabaikan frekuensi kata sepenuhnya; SMOG membulatkan agresif. Melaporkan tiga skor dan mengambil median atau rentang memberikan sinyal yang lebih baik daripada angka tunggal.
- Mengabaikan jargon spesifik domain. Artikel medis tentang «infark miokard» mencetak tingkat 15 bahkan jika kalimat sekitarnya sederhana. Formula hanya melihat panjang kata, bukan keakraban dengan audiens. Pasangkan skor keterbacaan dengan glosarium atau penjelasan pertama-kali-digunakan.
- Optimasi berlebihan untuk tingkat kelas. Memecah setiap kalimat menjadi 8 kata dan mengganti setiap kata multi-suku kata menghasilkan prosa terputus-putus, kekanak-kanakan yang sebenarnya lebih sulit dibaca untuk orang dewasa. Targetkan tingkat kelas audiens, bukan angka terendah yang mungkin.
- Menerapkan formula bahasa Inggris ke bahasa lain. Flesch-Kincaid dikalibrasi untuk pola suku kata bahasa Inggris. Spanyol, Jerman, Finlandia, Jepang semuanya membutuhkan kalibrasi mereka sendiri (Fernández Huerta untuk Spanyol, Amstad untuk Jerman, RIX Anderson untuk penggunaan umum). Menjalankan formula bahasa Inggris pada teks terjemahan memberikan skor yang tidak berarti.
- Memperlakukan skor sebagai pemahaman. Formula keterbacaan mengukur fitur permukaan. Mereka tidak dapat mendeteksi kebingungan logis, konteks yang hilang, akurasi teknis, atau apakah strukturnya masuk akal. Artikel tingkat 6 masih bisa tidak dapat dipahami jika kurang koherensi.
- Menempelkan teks dengan HTML atau markup. Tag, URL, blok kode, dan karakter khusus mengubah deteksi kalimat dan jumlah kata. Hapus markup terlebih dahulu (alat ini mencoba tetapi tidak sempurna untuk HTML/Markdown kompleks).
Pertanyaan yang lebih sering diajukan
Formula mana yang harus saya percaya jika mereka tidak setuju?
Pilih formula yang dikalibrasi untuk domain Anda. Untuk kesehatan dan pendidikan pasien, SMOG adalah rekomendasi Departemen Kesehatan dan Layanan Manusia AS (konservatif, cenderung membulatkan ke atas). Untuk konten web umum dan jurnalisme, Flesch-Kincaid Grade Level cocok dengan yang digunakan Word, Google Docs, dan Yoast, jadi konsistensi dengan alat pengeditan penting. Untuk penilaian otomatis (mis. lint CI), Coleman-Liau atau ARI lebih andal karena tidak perlu menghitung suku kata (yang merupakan perkiraan dalam perangkat lunak). Ketika formula berbeda lebih dari 2 tingkat, lihat teksnya: skor outlier biasanya menandai paragraf tertentu.
Apakah ini berfungsi untuk teks non-Inggris?
Formula yang dikalibrasi untuk bahasa Inggris memberikan hasil yang tidak berarti dalam bahasa lain karena rasio suku kata per kata dan kata per kalimat berbeda. Untuk Spanyol, gunakan formula Fernández Huerta. Untuk Jerman, Amstad atau Wiener Sachtextformel. Untuk Prancis, adaptasi Kandel-Moles. Untuk Jepang, Cina, Korea, konsep «suku kata» itu sendiri tidak memetakan; Anda memerlukan analisis kepadatan karakter dan tingkat JLPT. Alat khusus seperti readability.js memiliki paket bahasa terpisah.
Mengapa skor Flesch Reading Ease pada skala 0-100 bukan tingkat kelas?
Makalah Flesch 1948 menggunakan skala 0-100 di mana 90-100 = «sangat mudah» (kelas 4), 60-70 = «standar» (kelas 8-9), 0-30 = «sangat sulit» (lulusan perguruan tinggi). Rekalibrasi Kincaid 1975 menerjemahkan fitur permukaan yang sama ke tingkat kelas AS untuk Angkatan Laut, yang perlu mencocokkan pembaca dengan manual. Kedua formula menggunakan input yang sama (suku kata/kata, kata/kalimat) tetapi skala output yang berbeda. Sebagian besar alat modern (termasuk yang ini) melaporkan keduanya karena perbandingan lebih mudah saat Anda dapat memilih unit pilihan Anda.
Bisakah asisten penulisan AI menggantikan alat keterbacaan?
LLM (ChatGPT, Claude, Gemini) dapat menyarankan kata-kata yang lebih sederhana tetapi mereka tidak mengukur keterbacaan dengan andal, mereka berhalusinasi skor, memberikan angka yang berbeda setiap kali dijalankan, dan rata-rata di seluruh paragraf dengan cara yang menyembunyikan outlier. Formula deterministik (yang ada di alat ini) memberikan jawaban yang sama setiap kali dan memungkinkan Anda mengkorelasikan pengeditan dengan perubahan skor. Alur kerja yang benar: gunakan LLM untuk menulis ulang, lalu gunakan formula untuk memverifikasi bahwa tingkat kelas target benar-benar tercapai. Hemingway Editor (2014) adalah contoh awal menggabungkan saran dengan penilaian deterministik.
Apakah teks saya dikirim ke server saat saya menilainya?
Tidak. Keenam formula (Flesch-Kincaid, Flesch Reading Ease, Gunning Fog, Coleman-Liau, SMOG, ARI) berjalan di browser Anda. Buka tab Network di DevTools saat mengetik atau menempel; Anda akan melihat nol permintaan keluar. Aman untuk draf medis, komunikasi korporat internal, jurnalisme yang belum dipublikasikan, draf hukum, dan apa pun yang tunduk pada NDA.