免费在线 PDF 压缩

在保持质量的同时缩小 PDF 文件大小。即时结果，不会上传到任何服务器。

您的文件不会离开设备

将 PDF 拖到此处 或点击浏览

支持 PDF 文件 · 最大 100 MB

关于 PDF 压缩: 此工具通过删除冗余数据和优化文档结构来压缩 PDF。结果取决于 PDF 内容，文本较多的 PDF 可压缩 10-30 %，而图像较多的 PDF 可压缩 20-50 %。与服务器端工具相比，客户端压缩存在一些限制。

工作原理

在上方选择或拖入 PDF 文件。
点击"压缩 PDF"以在您的浏览器中处理文件 · 不会上传任何内容。
立即下载优化后的 PDF。

为什么要压缩 PDF？

大型 PDF 文件难以分享、上传缓慢，还占用存储空间。压缩后的 PDF 加载更快、更易通过邮件发送、占用更少磁盘空间。本工具进行一次轻量的结构优化 · 使用对象流重新保存 PDF 并丢弃孤立资源。文本为主的 PDF 通常可减少 5-15%；图片为主的 PDF 减少较少，因为图片本身不会重新编码。

常见问题

压缩会影响 PDF 质量吗？

不会 · 图像、文本和矢量图形原样通过。体积减小完全来自更紧凑的文件结构，而非内容的重新编码。

文件大小限制是多少？

此工具支持最大 100 MB 的 PDF。处理时间取决于文件大小和您的设备。大文件可能需要几秒钟。

我的 PDF 会上传到服务器吗？

不会。所有压缩都在您的浏览器本地进行。您的 PDF 不会离开设备，确保完全的隐私和安全。

为什么不能压缩更多？

PDF 压缩效果取决于内容类型。纯文本 PDF 压缩较少，因为文本已经高效编码。图像较多的 PDF 可以压缩更多。服务器端工具可以通过重新编码图像实现更高的压缩率。

可以压缩加密的 PDF 吗？

此工具适用于标准 PDF。加密或受密码保护的 PDF 若没有密码则无法处理。

这里讲的「压缩」到底是什么

「压缩」这个词在 PDF 工具圈里干了不少活。它至少指三种相当不同的操作,使用同一个界面动词的工具会给出差异巨大的输出体积。结构性优化会在去掉死对象之后重建文件的间接对象图,把小对象聚合到压缩过的对象流里,并把交叉引用表改写为二进制流。一个像素都不动,一点画质都不丢,普通业务文档的常见节省在 3% 到 15% 之间。图像重编码会解码已嵌入的 JPEG 流,可选地降采样,然后以更低的质量因子重新编码。在以照片为主的 PDF 上,节省可以达到 60% 甚至更多,但操作是有损的。激进的重新渲染会按某个 DPI 把每一页都栅格化,再把栅格作为 JPEG 嵌回去;这就是商业工具里那些「极限压缩」预设在表面友好名字下做的事,产物本质上就是一摞被装进 PDF 外壳的图片。

本工具只做第一种压缩。选择是有意的:结构性优化是无损的,速度快,在浏览器里跑无需服务器往返,而且保留原 PDF 一切承诺过的属性(文字仍可选取,矢量图形仍然锐利,无障碍标签仍然挂着,表单字段仍然可用)。图像重编码与栅格化在某些场景下有用,但它们用保真度换体积,而且需要要么很大的 JavaScript 编解码器包,要么本工具刻意避免的服务器渲染栈。所以诚实的表述是:本工具总能把以文字为主的 PDF 明显缩小,而对以图片为主的 PDF 只能略微缩一点。需要在一整本高分辨率扫描作品集上做激进瘦身的人,要找的本来就是另一类工具。

PDF 内部压缩的小史

从 1993 年的第一份 PDF Reference 起,核心压缩主力其实就已经是 FlateDecode 了:同一个 deflate 算法也驱动着 gzip、PNG 和整个 zip 格式。Adobe 选 deflate,是因为它通过 Phil Katz 的 PKZIP 工作刚进入公有领域,而且在 PDF 内部字典和内容流那种结构化文本上能拿到大约 2 比 1 的压缩比。早期还有三种面向图像的过滤器加入 FlateDecode 阵营。DCTDecode(JPEG)从 PDF 1.0 起就是嵌入照片的标准方式;CCITTFaxDecode(1980 年代的 Group 3 和 Group 4 传真压缩算法)负责黑白扫描文档;LZWDecode 曾短暂与 FlateDecode 竞争,但因 1990 年代 Unisys 的 LZW 专利争端,在 PDF 1.4 被弃用。

对非图像压缩影响最大的变化,出现在 2003 年的 PDF 1.5 中:对象流和交叉引用流。在那之前,PDF 中每一个间接对象都得在文件主体的顶层出现,前面带着一段短短的对象头;每个对象都被记在文件末尾那张扁平的 ASCII 交叉引用表里。这两部分加起来,平均每个对象要带大约 30 字节的额外开销,而在一个有上千个对象、复杂度中等的文档上,这就是大约 30 KB 的结构性浪费。PDF 1.5 引入了两个互补的机制:对象流用一个 deflate 编码的流把大量小对象压在一起;交叉引用流用压缩过的二进制版本替换了原来人类可读的 xref 表。两者合起来,经常能在毫无保真度代价的前提下,把一个 PDF 的大小削掉 10% 到 15%。

图像压缩过滤器家族又扩张了两次:PDF 1.4(2001)加入 JBIG2Decode 用于高比率的二值图像压缩,PDF 1.5(2003)加入 JPXDecode 用于 JPEG 2000 小波压缩。这两个就是 PDF 规范中图像压缩复杂度的最高水位线;之后再没添加过新东西,尽管对 AVIF、HEIC、JPEG XL 这些现代编解码器的研究一直在继续,而当前的 ISO 32000-2 规范并不允许它们中的任何一个。也就是说,PDF 的压缩选项已经被冻结了二十多年。这也正是结构性重写依然有意义的原因之一:野外的每一份 PDF 都还在用 2003 年时代的格式外壳,而野外的每一份 PDF 都依然能从在这个外壳下做一次干净的重新序列化中获益。

本工具具体在做什么

本工具在浏览器里跑的压缩,会让 PDF 经过三个确定性的步骤,全部由 pdf-lib 执行。第一,读取文件的交叉引用表,把每一个间接对象解析进一个内存模型;损坏或未被引用的对象会被记录下来。第二,优化通道从文档目录出发遍历对象图,把所有不能被传递性访问到的对象丢弃。PDF 在生命周期里会不断积累孤立对象,尤其是经由 Acrobat 中的反复编辑,或者通过那种「新版本被追加而旧版本未被移除」的增量保存;仅这一步的真实节省,从 0%(一个刚生成的 PDF)到 20% 以上(一个多年里被反复打开、反复保存的 PDF)都有可能。

第三,剩下的对象会被用 PDF 1.5 的特性写出来:小对象被汇集到压缩过的对象流里,文件的交叉引用表也作为压缩过的二进制流而不是 ASCII 文本被写出。所有在输入里已经是压缩过的流(FlateDecode 编码的内容流、嵌入的 JPEG),都原样穿过;不会尝试做二次压缩,因为既省不了空间,还可能引入微妙的 bug。输出与输入逐字节不同,但在视觉上、文字上和结构上完全一致:每一页的渲染一样,每一个词在同一处可选取,每一处批注还在原来的位置,每一个表单字段仍然叫同一个名字。压缩后界面上显示的「减少」百分比是这样算的:(输入大小减去输出大小)除以输入大小。

为什么图像很重的 PDF 几乎缩不动

大多数为压缩而上传 PDF 的用户都会惊讶:自己 20 MB 的摄影作品集回来变成了 19.4 MB。原因是,典型摄影类 PDF 的字节并不在结构性外壳里,而在图像内容流里。一份保存成 PDF 的高分辨率扫描件,可能有 95% 甚至更多的字节就是图像流;结构性开销(目录、页面树、xref、字体元数据)即便在很长的文档里也只占总体几百千字节。由于本工具不解码也不重新编码图像流,这些字节的绝对大小就是不会动。

一个手里有 50 MB 图像很重的 PDF、又真心需要把它降到 10 MB 以下的用户,有三条路可走,而其中没有一条是在本工具当前架构里可以实现的。最干净的工作流是再往上一步:把原始图像拿出来,过一次免费在线图像压缩器,然后用图片转 PDF 把 PDF 重新组装回来。第二条路是用一款内置图像重编码功能的桌面工具,例如 Adobe Acrobat 的 PDF Optimizer,或 Apple「预览」里的「减小文件大小」Quartz 滤镜。第三条路是用一家商业的服务器侧服务,它们的「高强度压缩」模式本质上就是在云端做了上述同样的事。激进度与隐私之间的取舍是根本性的:一条真正激进的图像压缩流水线,要么需要好几兆字节的 JavaScript 图像编解码器(本工具刻意不打包它们),要么需要一台服务器(那就放弃了隐私承诺)。本工具落在「保守但私密」的那个角落里。

结构性那一遍真正能帮到的场景

邮件附件大小上限。 Outlook、Gmail 和绝大多数企业邮件服务器,把附件大小限制在 20 到 25 MB。一份 23 MB 的 PDF 想刚好挤进上限,经过一次结构性重写,通常可以瘦下 10% 到 15%,恰好够把它送到正确的那一边。
网页上传表单。 许多政府和高校的提交门户会设单文件大小上限,常常是 5 MB 或 10 MB 这种相当随意的数字。在文字为主的文档上,结构性那一遍就足以把文件挤到这些上限之下。
归档与存储。 对那些要把几百万份 PDF 长期归档的机构来说,在入库时做一遍结构性重写,可以在毫无内容风险的前提下,把归档总大小压低一个明显的百分比。Internet Archive 以及若干国家图书馆的入库流水线就在跑类似的处理。
清理增量保存的痕迹。 被反复编辑的 PDF 会比所需大得多,因为增量保存是追加而不是重写。一次压缩就能把文件重置到它的最小表示,通常能从那些长期被用的工作文件里再挤出 20% 甚至更多。
为网页嵌入准备 PDF。 当一份 PDF 准备通过 iframe 或 PDF.js 嵌入到网页里时,每一千字节都会计入首屏延迟。结构性重写为浏览器查看提供了尽可能好的加载体验,尤其在缓慢的移动网络上。

与其他 PDF 功能的相互作用

无障碍标签得到保留。 驱动屏幕阅读器行为的结构树,以从文档目录可达的间接对象形式保存。优化通道会传递性地访问到这些对象,并把它们原封不动地保留下来。一份打过标记的 PDF 在本工具跑完后仍然是一份打过标记的 PDF。
表单字段仍然能用。 交互式表单(AcroForm)字典处于文档级别,压缩过程中会被保留。输出的 PDF 仍可填写,字段名和默认值都完好。
书签得到保留。 Outlines 树会被保留。在 Acrobat 或任何标准阅读器中,通过书签的导航在压缩后的输出上与输入完全一致。
「快速 Web 视图」会丢失。 对象流与旧的线性化提示表不兼容。一份用对象流重写过的 PDF 会失去自己的「Fast Web View」属性,哪怕它原来是有的。这是 PDF 1.5 规范里有意的折中,不是 bug;但如果你下游的工具链特别要求线性化 PDF,这就要紧了。
签名会断。 一份带电子签名的 PDF 在被压缩后,会失去签名,因为签名是对输入文件某段精确字节范围的密码学哈希。压缩后的输出仍然是合法的 PDF,但签名标识会变成「无效」。如果你需要保留签名,就不要去压缩已经签名的文件;让它保持原样,去压一份未签名的副本。

浏览器内压缩 vs 云端压缩

在 Google 搜索结果里占据榜首的那些云端 PDF 压缩服务(Smallpdf、ILovePDF、PDF24 的网页版、Adobe Acrobat 在线版、Sejda 的免费档),都会把你的源 PDF 上传到自己的服务器,在那里做完压缩,再把更小的文件作为下载送回来。它们的隐私政策都会写「上传文件会在几小时内被删除」,但这些文件依然要经过运营方的网络,在处理窗口期间留在他们的磁盘上,并经过运营方为防止滥用而保留的日志体系。它们以此为代价提供的好处,是能用上一个仅在浏览器里跑的工具无法靠不打包好几兆 JavaScript 就提供的、激进得多的图像重编码与栅格化能力。

本工具不上传。你的 PDF 通过标准的 File API 被读入浏览器标签页,在同一个标签页里由 pdf-lib 库解析并重写,然后通过标准的下载 API 写回到你的磁盘。压缩过程中唯一的网络流量,是页面初次打开时从 CDN 一次性加载 pdf-lib 本身。你可以亲自验证:打开浏览器开发者工具的「网络」面板,跑一遍压缩,看是否会有任何携带你文件内容的请求被触发。一切保密性强的东西(HIPAA、GDPR、律师当事人特权、保密协议项下的资料),都更适合在浏览器里压缩。需要从 50 MB 压到 5 MB 的摄影源材料,则更适合托付给一个你已经读过其数据处理条款的服务器侧工具,或者组合用图像压缩器和图像转 PDF 来走一遍显式的「解码-再压缩-重新组装」循环。

免费在线 PDF 压缩

压缩完成

工作原理

为什么要压缩 PDF？

常见问题

这里讲的「压缩」到底是什么

PDF 内部压缩的小史

本工具具体在做什么

为什么图像很重的 PDF 几乎缩不动

结构性那一遍真正能帮到的场景

与其他 PDF 功能的相互作用

浏览器内压缩 vs 云端压缩

更多常见问题

相关工具

PDF 合并

PDF 拆分

图像压缩器

PDF 灰度化