フリーワード&文字カウンター・オンライン
以下にテキストを貼り付けるか入力すると、単語数、文字数、文章数、段落数、推定読書時間が即座に表示されます。
このツールについて
この無料の単語カウンターは、学生、ライター、ブロガー、ソーシャルメディア管理者に最適です。エッセイ、ツイート、Instagramのキャプションなどの単語を即座にカウントできます。読書時間は、1分あたり200単語という平均読書速度に基づいています。
一般的な単語数の制限
一般的な制限を知ることで、目標を達成しやすくなります:
- Twitter/X投稿 · 280文字
- Instagramキャプション · 2,200文字
- Meta description(SEO) · 155〜160文字
- 大学エッセイ · 通常250〜650単語
- ブログ記事(SEO) · ランキングには1,500〜2,500単語
- 短編小説 · 1,000〜7,500単語
よくある質問
読書時間はどのように計算されますか?
1分あたり200単語という標準的な平均を使用しています。これは、非技術的なコンテンツの成人の読書速度として広く受け入れられている平均です。
何が単語としてカウントされますか?
空白で区切られた文字の連続は1つの単語としてカウントされます。"well-known"のようなハイフンでつながれた単語は1つの単語としてカウントされます。数字や省略形もカウントされます。
私のテキストはどこかに保存されますか?
いいえ。すべてはブラウザ内で処理されます。テキストがサーバーに送信されたり、どこかに保存されたりすることはありません。タブを閉じれば消えます。
何が正確に単語として数えられるか?
Microsoft Word、Google Docs、Pages、Unixのwcコマンド、そしてほぼすべてのブラウザベースのカウンターは単一のルールに同意します:単語は、隣接する実行から空白で区切られた非空白文字の最大の実行です。wcのPOSIX標準は、単語を空白で区切られた印刷可能な文字の非ゼロ長のシーケンスとして定義しており、これは4行のJavaScript実装(text.trim().split(/\s+/).length)が生成する同じルールです。それは純粋に機械的です:形態論、句読点、または言語を理解しません。「Hello world」は2単語です;「Hello,world」は空白なしで1つです。「Don't」は1単語です;「do n't」は2つです。
言語学者は反論するでしょう。Oxford English Dictionaryは書記素語(空白で区切られた文字のシーケンス)と語彙素(抽象的な辞書のエントリ)を区別します。2つは一般的なケースで分岐します:
- ハイフンで結ばれた複合語。「State-of-the-art」は1単語、トークン内に空白はありません。Microsoft Word、Google Docs、このカウンターはすべて同意します。
- 短縮形。「Don't」、「won't」、「it's」、「you'd've」はすべて1単語として数えます。アポストロフィは標準的な英語の使用法に従って、トークンの一部として扱われます。
- 数字と小数。「3.14」は1つ;「3 . 14」は3つ。「1,000,000」は1つ;「1 000 000」(ヨーロッパの慣習)は3つ。
- 頭字語。「U.S.A.」は1単語;「U S A」は3つ。「NATO」は1つ。「Ph.D.」は1つ。
- URLとメール。「https://absolutool.com/tools」は任意の空白分割カウンターで1単語です。
通常の散文では、このルールと注意深い人間のカウンターとの間の意見の相違は通常1%未満です。高度に複合的、ハイフン付き、または数値的なテキストの場合、5-15%に達することがあります。空白ルールを超えて、UnicodeはフォーマルなWord Boundaryアルゴリズム(UAX #29)を公開しており、文字カテゴリーに基づいて単語境界を認識する14ルールの状態機です。JavaScriptはIntl.Segmenterで{granularity: 'word'}を介してそれを公開し、それが辞書なしで中国語、日本語、タイ語、またはクメール語で単語を数える唯一の正しい経路です。
スペースを使わない言語
中国語、日本語(純粋な漢字または漢字+ひらがな)、タイ語、ラオス語、クメール語、ビルマ語、チベット語は単語間スペースなしで書かれ、慣習はscriptio continuaと呼ばれます。中国語の段落で実行された空白トークナイザーは1を返します、段落全体が1つの「単語」として。これらのスクリプトでは、意味のある指標は単語数ではなく文字数です。
プロの翻訳では、経験則はおおよそ1つの中国語文字 ≈ 1.5-2.0英語単語;2つの日本語文字 ≈ 1つの英語単語;1つの韓国語文字 ≈ 0.55英語単語です。中国語から英語への翻訳者は通常、中国語の半分はソース文字数で、英語の半分はターゲット単語数で請求します。韓国語は、東アジアのスクリプトの中で唯一、単語間隔(띄어쓰기、tteoiseugi)を使用するため、空白トークナイゼーションは機能しますが、間隔ルールは悪名高く難しく、ネイティブスピーカーでもエッジケースで意見が分かれます。
ライターを単語ごとに支払う簡単な歴史
単語ごとの支払いは、19世紀後半のマス購読雑誌から始まりました。1920年代と1930年代までに、パルプ雑誌、Black Mask、Weird Tales、Astounding、Argosyは、4分の1セントから2セントの率で単語ごとに支払いました。Raymond Chandlerは有名なことに1930年代にBlack Maskから1単語1ペニーを得ました。モデルは今日も残っています:ペニーストックのコンテンツミルは単語あたり$0.01-$0.05、中層のトレード雑誌は$0.30-$0.75、トップ層のアメリカのグロッシー(The New Yorker、The Atlantic、Wired、Harper's)は単語あたり$1-$3、時折高プロファイル特集ではそれ以上を支払います。
制限が契約上のため、正確な単語数を知ることは収入です。1単語$1の1,500語の特集は$1,500;1,400では$1,400です。編集者は制限を強制します、2,000語の依頼は1,950-2,050を意味し、2,400ではなく、制限を逃すと固定料金の削減またはキルフィーを意味する可能性があります。
小説の単語数と毎日の単語習慣
出版界には大人向け小説の目標単語数が驚くほど一貫しています。大人の文芸小説は80,000-100,000語に達します;商業的スリラー、ミステリー、ロマンスは70,000-90,000;叙事詩的ファンタジーとSFは100,000-120,000(時に150,000+)。ヤングアダルトは50,000-80,000、ミドルグレード25,000-55,000、絵本100-500、中編17,500-40,000、短編1,000-7,500、フラッシュフィクションは1,000未満。代理人は品質に関係なく、これらの範囲外のデビュー小説の問い合わせを拒否します、慣習的な範囲は読者の期待と印刷機の経済性を符号化しています。
1999年にChris Batyによって設立されたNational Novel Writing Monthは、11月に50,000語の目標を設定し、グレート・ギャツビー(50,061)とスローターハウス5(49,459)の長さにほぼ等しいです。それは30日間で1日1,667語に相当します。Stephen KingはOn Writingで1日2,000語を推奨します;Anthony Trollopeは郵便局の仕事に行く前に1日3,000語を書きました;Graham Greeneは1日正確に500語で止めると報告されています;Mark Twainは1,400を目指しました。毎日の単語習慣は「アイデアがある」を「N日で終わる」に変えるものです。1日1,000語で90,000語の小説は90日です。
学術および雑誌の単語カウント
USとUKの高等教育では、典型的な課題の長さは:高校エッセイ300-1,000語;大学エッセイ(人文科学)1,500-3,000;学期論文3,000-6,000;優等論文12,000-20,000;修士論文20,000-40,000;博士論文は人文科学で80,000-100,000(科学では多くの場合より短く、40,000-60,000)です。Common App個人陳述書は650語に制限されており、アプリケーションポータルがそれを強制します。UCAS個人陳述書は英国で4,000文字または47行に制限され、どちらか短い方です。ほとんどの大学はエッセイ制限を±10%の許容範囲で強制します。
ジャーナル記事は500-1,500語の手紙、1,500-3,000語の概要、4,000-8,000語の標準研究論文、6,000-12,000語のレビューに及びます。Nature Lettersは3,000語で上限;JAMA Original Investigationは3,000で3段落の要約付き;PNAS Direct Submissionは6印刷ページ、おおよそ6,000語です。
覚えておくべきソーシャルメディア文字制限
- X/Twitter投稿: 280文字(2006年3月のローンチ時はもともと140;2017年11月に280に倍増)。X Premiumの加入者は2023年2月以降、最大25,000文字まで投稿できます。URLは基底の長さに関係なく常に23文字としてカウントされ、絵文字は2、CJK文字は2としてカウントされます。
- Bluesky: 300文字。
- Threads (Meta): 500文字。
- LinkedIn投稿: 3,000文字;最初の~210(デスクトップ)または~140(モバイル)が「もっと見る」の前に表示されます。
- Instagramキャプション: 2,200文字、125文字のプレビュー付き。
- TikTokキャプション: 4,000文字。
- SMS GSM-7: セグメントあたり160文字;UCS-2(非ラテン文字用)は70に低下します。
- Googleメタディスクリプション: デスクトップで切り詰められる前にほぼ155-160文字、モバイルでは~120。
- Googleタイトルタグ: ほぼ50-60文字、またはデスクトップで約600ピクセル。
文のセグメンテーションはピリオドで分割するよりも難しい
素朴なルール、.、!、?で分割する、は最初の段落以内ですべての現実的な英語テキストで失敗します。「Dr. Smith met Mr. Jones at U.S. Steel」は1つの文です;素朴な分割は4つを返します。「J. R. R. Tolkien wrote The Hobbit」は1つです;素朴は4つを返します。「The pH of 7.4 is normal」は1つです;素朴は2つを返します。ドメイン名(「Visit absolutool.com.」)とメールは偽陽性を作り出します;省略符号(「Wait...what?」)は偽陰性を作り出します。
堅牢なセグメンテーションには、キュレートされた略語リスト(NLTKのPunktセグメンターによって使用されるアプローチ、KissとStrunkの2006年の論文がF1 ≈ 0.97で100万単語のコーパスで訓練しました)または統計モデルが必要です。ブラウザベースのカウンターの場合、実用的な妥協は、空白と大文字に続く[.!?]+で分割することで、小さな略語ブラックリスト(Mr|Mrs|Dr|Prof|Sr|Jr|St|Inc|Ltd|U.S|e.g|i.e|etc|vs)です。それでも、ノイズの多いテキストでの精度は約90%で上限に達します。文の数を近似として捉えてください。
各段落で1つの可読性公式
Flesch Reading Ease (1948)。Rudolf Fleschの公式:206.835 − 1.015 × (語/文) − 84.6 × (音節/語)。高いほど簡単です。0-30は「非常に難しい、大学卒業」;60-70は「平易な英語、8-9年生」;90-100は「非常に簡単、5年生」。Reader's Digestは~65を目指します;Timeは~52を目指します;Harvard Law Reviewは約30で動作します。
Flesch-Kincaid Grade Level (1975)。技術マニュアルの可読性のために米海軍からJ. Peter Kincaidに委託されました:0.39 × (語/文) + 11.8 × (音節/語) − 15.59。出力は米国の学年レベル(8.0 = 8年生)です。今ではMicrosoft Wordのスペルチェックに組み込まれており、コピーライティングで最も引用される可読性メトリックです。
SMOG (1969)。Harry McLaughlinの「Simple Measure of Gobbledygook」は、テキストの最初、中間、最後から10の連続した文の中で3音節以上の単語のみを数えます。米国国立衛生研究所がヘルスケア患者リーフレットに好んで使用するのは、健康テキストでの実際の理解とFlesch-Kincaidよりもよく相関するためです。
Gunning Fog (1952)。Robert Gunningの指数:0.4 × ((語/文) + 100 × (複雑な語/語))。Wall Street JournalはFog ~11を目指します;ロンドンのTimesは~14。Gunningの主張は、Fog 12を超えるビジネス文書は読者を失うというものでした。
読書および会話時間、数字はどこから来るのか
このカウンターは1分あたり200単語で読書時間、1分あたり130単語で会話時間を表示します。200 wpmの数字は、Marc Brysbaertの190研究の2019年メタ分析と比較して保守的で、ノンフィクションで238 wpm、フィクションで260 wpmに収束しました(Journal of Memory and Language)。やや遅い側に誤るのはユーザーフレンドリーな選択で、「5分の読書」が7分の読書ではなく4分の読書になる方が良いです。130 wpmの会話速度は会話の発話と一致します;フォーマルなスピーチは平均100-130 wpmです。20分の基調講演はおおよそ2,600の発話単語です。Mediumの「X min read」機能は、2014年にMike Sallによって導入され、もともと275 wpmで調整されていました。
なぜあなたのカウントがWordのと異なるのか
3つの一般的な原因:(1) Microsoft WordとGoogle Docsはハイフン付き単語を1つとして扱います(このカウンターと一致)、しかし一部のPHPベースのカウンターはすべての非文字文字で分割し、「well-known」に対して2つを返します。(2) Wordから貼り付けると、不可視文字、湾曲した引用符、改行禁止スペース(U+00A0)、ソフトハイフン(U+00AD)が持ち込まれ、ツールによってトークンを断片化または融合する可能性があります。(3) ユニーク単語カウントはデフォルトで大文字小文字を区別するため、「The」と「the」は2つの別々のユニーク単語として数えられます;大文字小文字を取り除き、ステミング(「running」→「run」)を行うと、典型的な散文でユニークカウントが約15%低下します。
中国語または日本語のテキストが0(または1)単語を表示する場合、それは空白トークナイザーが言われた通りのことをしているのです、注意を文字数に移してください、それはそれらのスクリプトに対する意味のある指標です。「3,000」が1単語として数えられる場合、それはコンマが非空白で、トークンが連続しているためです;それは正しい動作で、Wordと一致します。
その他の質問
可読性スコアはどのくらい正確ですか?
可読性公式は単語/文と音節/単語から複雑さを推定し、あなたの散文が良いかどうかを実際には理解しません。「8年生」のスコアは8年生の読解材料に典型的な文の長さと音節密度プロファイルを意味します;明確さを認証しません。スコアをサニティチェックとして使用し、判決としてではありません。Hemingwayは約4年生でスコア;King James Bibleは約8年生;Wall Street Journalは約11年生。
このカウンターはMarkdownまたはHTMLを処理しますか?
テキストエリア内のすべてを文字通りカウントします、**bold**、#ヘッダー、<p>のようなHTMLタグを含む。レンダリングされたテキストのみをカウントしたい場合、まずコンテンツをMarkdownプレビューアまたはブラウザのReader Viewに貼り付け、その後クリーンなテキストをここにコピーしてください。Hugo、Jekyll、11ytはすべて、構築されたページの単語数を計算する前にfront-matterとMarkdownを取り除きます。
正確な単語数に達するための最良のヒントは何ですか?
目標を10-15%超えて書き、その後カットしてください。カットすることは詰めるよりもはるかに簡単で、カットはほぼ常に散文をより強くします、なぜなら削除しやすいものが最も弱いからです。伝統的な編集者のアドバイス(「あなたの愛するものを殺す」)は、最初に書いたものがあれば、つまり殺すべき愛するものがある場合にのみ意味があります。
法的説明書や法廷申立に使用できますか?
サニティチェックには、はい、米国最高裁判所は申立人の説明書を13,000語に制限し、Federal Rule 32(a)(7)(B)は控訴説明書を13,000語に制限し、どちらも空白でカウントされます。提出時に必要な認証された単語数には、Microsoft Wordのカウントを使用してください(裁判所が名前で受け入れる)、このツールはラフドラフトチェックとして扱ってください。