如何统计任意文本的字数与字符数
知道您的文本包含多少个字或字符比您想象的更常重要。社交媒体帖子有字符限制。学术论文有字数计数。SEO元描述需要达到特定范围。即使是电子邮件主题行在某些长度下表现更好。基于浏览器的计数器在您输入时实时显示所有内容,无需服务器上传。
平台字符限制
| 平台 | 限制 | 计算什么 |
|---|---|---|
| Twitter/X帖子 | 280字符 | 包括空格在内的所有字符 |
| Twitter/X Premium | 25,000字符 | 每个「长帖」推文 |
| Instagram标题 | 2,200字符 | 所有字符 |
| Instagram简介 | 150字符 | 个人资料的可见部分 |
| LinkedIn帖子 | 3,000字符 | 所有字符 |
| LinkedIn标题 | 220字符 | 个人资料中您姓名下方 |
| TikTok标题 | 4,000字符 | 每个视频帖子 |
| Facebook帖子 | 63,206字符 | 但80以下最佳互动 |
| Bluesky帖子 | 300字符 | 包括空格 |
| Mastodon toot | 500字符 | 默认;一些实例允许更多 |
| 元描述(SEO) | 155-160字符 | 在搜索结果中可见 |
| 标题标签(SEO) | 50-60字符 | SERP中超过此值会被截断 |
| SMS消息 | 160字符 | 每段 |
| 电子邮件主题行 | 50-60字符 | 用于移动显示 |
| YouTube标题 | 100字符 | 完整显示 |
| YouTube描述 | 5,000字符 | 没有「更多」时前125个可见 |
| Reddit帖子标题 | 300字符 | 子reddits可能设置更低限制 |
| Discord消息 | 2,000字符 | 每条消息;更长的分成多个 |
| WhatsApp消息 | 65,536字符 | 聊天实际上无限制 |
如何计算字数和字符
- 粘贴或输入您的文本:在计数器中输入文本。统计数据会在您输入时立即更新。
- 查看统计数据:查看字数、字符数(带和不带空格)、句子数、段落数和估计阅读时间。
- 复制结果:点击「复制统计」将分析保存到剪贴板。
字数计数的简史
字数计数比计算机早了几个世纪。中世纪抄写员计数字数来估算付款(在一些修道院按文本「行」付款,在其他修道院按「页」付款)。第一本指定字数的英语风格指南可能是Strunk & White的《风格的元素》(1918),它将250-300字定为典型段落最大值。
字数计数随着打字机变得机械化:一份标准打字稿件页面约为250字(12点Courier,双倍行距,1英寸边距)。这仍然是出版业中的「标准稿件页」,小说家按字协商书籍预付款,一个已发布页面相当于约250字的稿件。
Microsoft Word在Word 95(1995)中添加了内置字数统计,使其成为即时的,而不是您手动跟踪的东西。基于Web的字数计数器在1990年代后期出现。今天,每个写作工具(Google Docs、Notion、Obsidian、VS Code、Word、Pages)都有实时字数计数;当您粘贴没有编辑器的文本时,存在专用的基于浏览器的计数器。
基本计数之外
好的字数计数器不仅仅给您一个数字:
阅读时间:估计大约每分钟200-250字。对于博客文章和文章很有用,让读者知道他们要花多少时间。
关键字密度:特定单词作为总字数百分比出现的频率。对SEO很重要:您希望目标关键词自然出现(1-2%密度)而不会塞满。
句子和段落计数:帮助您判断写作的结构。短段落(2-4句)在屏幕上更容易阅读。
平均单词长度:较短的平均单词长度通常意味着更容易阅读。海明威平均每个单词4.2个字母;学术论文通常平均5.5+。
最常用单词:按频率显示主要单词。对发现重复或找到您的「习惯」单词(作家倾向于无意识地过度使用某些单词)很有用。
可读性分数:Flesch-Kincaid(美国)、Gunning Fog、SMOG、Coleman-Liau给出年级估计。大多数报纸瞄准8年级阅读水平;企业文档通常达到12+。
什么算「单词」
单词的定义比您可能预期的变化更大:
- 空格分隔:大多数计数器按空格分割文本。「It's」是1个单词;「well-being」是1个单词(连字符连接);「U.S.A.」是1个单词(无空格)。
- 复合计数:一些风格指南将带连字符的单词计为2个(「twenty-five」 → 2个单词)。大多数计数器不会。
- 数字:「1,000,000」通常是1个单词。「1 million」是2个单词。
- 首字母缩略词:「FAQ」是1个单词。「F.A.Q.」也是1个单词(无内部空格)。
- 表情符号:通常每个1个单词,但一些计数器将它们计为0(非文本)或按其字形簇大小(对于肤色修饰符可以是4+个码点)。
- CJK语言:中文、日文、韩文不使用单词之间的空格。纯字符计数(或字符对计数)近似单词计数。一些计数器使用适当的单词分段;大多数回退到字符计数。
对于跨工具的一致字数,将相同文本粘贴到多个计数器中,选择与目标平台计数匹配的计数器。
Unicode和表情符号陷阱
现代文本计数必须正确处理Unicode:
- 组合字符:「é」可以是一个码点(U+00E9)或两个(U+0065 + U+0301组合锐音符)。两者显示相同。朴素的字符计数根据编码给出1或2。
- 代理对:表情符号和稀有字符使用2个UTF-16代码单元。除非您使用
[...str].length(返回1),否则JavaScript的.length对「😀」返回2。Twitter、Discord和大多数平台按字形簇计数。 - 肤色修饰符:👍🏽是一个用户感知的字符但2个码点(拇指+色调修饰符)。家庭表情符号如👨👩👧👦可以是7+个码点。
- 零宽度连接符:像👨💻(男人+ZWJ+笔记本电脑)这样的表情符号序列使用零宽度连接符。按码点分割会过度计数。
- 从右到左文本:阿拉伯语和希伯来语添加计入限制但不可见的方向控制字符。
好的计数器使用Intl.Segmenter API(原生浏览器,自2022年起)正确处理所有这些。
常见陷阱
- Twitter Premium「长帖」推文计算不同:25,000字符限制,但媒体(图像、视频)在免费层计入限制,在付费层无影响。
- SMS多段消息成本更高:超过160字符的SMS被分成多段,每段单独收费。使用标记多段的计数器。
- GSM-7 vs Unicode SMS:GSM-7编码的SMS每段允许160字符;Unicode(任何非拉丁字符)将限制降至每段70字符。单个表情符号或重音字母可能成倍增加您的SMS成本。
- 仅有空白的「空」文本:只有空格、制表符或换行符的文本计数字符但零单词。轻松发现意外粘贴的空白。
- Markdown标记计为文本:字数计数器通常计算原始Markdown,包括
**粗体**标记和[链接文本](url)语法。如果您的平台将Markdown渲染为纯文本,可见的字符数比源数少。 - 隐藏的跟踪字符:反垃圾邮件工具有时会添加不可见的跟踪字符(零宽度空格、零宽度连接符)以检测复制粘贴。这些计入平台限制。
提示
- 先写后计:不要让字符限制约束您的初稿。自由写作,然后修剪以适应。
- 发布前检查:发布前将您的社交媒体帖子粘贴到计数器中。被截断在句子中间看起来不专业。
- 对博客文章使用阅读时间:在您的文章中添加「5分钟阅读」设置读者期望,可以增加参与度。
- 注意不可见字符:一些文本编辑器添加隐藏字符(零宽度空格、非断行空格),它们计入限制但不可见。字符计数器揭示这些。
- 按内容类型瞄准字数:长篇博客文章1,500-2,500字(SEO最佳点),通讯文章500-800字,产品描述300-500字,广告标题50-150字。
- 与阅读级别检查器配对:仅计算字数并不告诉您写作是否清晰。可读性分数(Flesch-Kincaid、Hemingway)揭示您的文本是否符合受众的阅读水平。
隐私和机密文本
字数计数器完全在您的浏览器中运行。您粘贴的文本、生成的统计数据和任何自定义设置都保留在您的设备上。没有任何内容被上传到服务器、记录或与任何人共享。
这很重要,因为文本输入通常是机密的:客户的电子邮件草稿、机密法律往来、内部公司写作、个人日记条目、未发表书籍的章节草稿。云字数计数器在其服务器请求中记录您的文本,有时为「改进」或分析而保留它。对于敏感写作,仅浏览器计数器具有零暴露:粘贴、查看计数、关闭选项卡、结束。
基于浏览器的计数在页面加载后也可以离线工作,在旅行或在低连接环境中写作时很有用。
常见问题
含空格和不含空格的字符数有什么区别?
含空格计数计算所有字符,包括单词之间的空格。不含空格只计算字母、数字和标点。某些平台按其中一种方式计算 · Twitter/X 计算空格,短信也是。
阅读时间如何计算?
阅读时间通常按成人平均 200–250 字/分钟估算。一篇 1,000 字的文章大约需要 4–5 分钟阅读。
计数器支持其他语言吗?
支持。字数和字符计数器支持所有语言和 Unicode 字符,包括中文、日文、韩文、阿拉伯文、emoji 和带重音字符。
我的文本会被存储或发送到某处吗?
不会。所有计数都在您的浏览器中进行。您的文本从不离开您的设备。