如何在不损失质量的情况下压缩 PDF

· 7 分钟阅读

PDF是共享文档最常见的文件格式之一,但它们可能变得意外的大。带有嵌入图像、字体或扫描页面的PDF很容易超过电子邮件附件限制(通常为25 MB)。压缩PDF可减小其文件大小,同时保持内容完整和可读。基于浏览器的压缩器在本地处理整个工作,而无需将您的文档上传到服务器。

为什么PDF变得如此大

并非所有PDF都是相同的。一个简单的文本文档可能是50 KB,而一个扫描的合同可能是20 MB。主要因素:

如何在线压缩PDF

  1. 上传您的PDF:将您的文件(最大100 MB)拖放到上传区域或点击浏览。
  2. 选择压缩级别:选择轻度(10-20%减少,最佳质量)、中度(20-35%,平衡)或重度(30-50%,最大压缩)。
  3. 压缩并下载:点击「压缩PDF」在您的浏览器中处理,然后下载较小的文件。工具会显示大小减少。

PDF压缩的简史

PDF(1993)从一开始就考虑了压缩。原始的PDF 1.0规范包括FlateDecode(与ZIP和PNG相同的Deflate算法)用于一般数据,以及JPEG嵌入用于图像。多年来,PDF添加了:

版本年份添加的压缩
1.01993FlateDecode(zlib/Deflate)、JPEG、CCITT Fax
1.21996LZW压缩(有专利问题)
1.42001JBIG2用于双层图像(扫描的高压缩)
1.52003JPEG 2000、对象流、交叉引用流
1.7 / Ext 32009改进的元数据压缩
2.02017用于快速Web查看的更好流线性化

现代PDF压缩工具使用每个对象最有效的编码重建PDF。一个编码不佳的PDF可以仅通过重新编码而无任何质量损失就缩小50%。来自旧工具(2000年代初)的PDF比已经使用高效编码的现代工具的PDF压缩得多得多。

免费的Ghostscript库(自1986年起,早于PDF本身)一直是开源世界的事实PDF压缩引擎。大多数基于浏览器的压缩器使用Ghostscript的端口或pdf-lib(JavaScript)来完成工作。

选择正确的压缩级别

轻度压缩删除元数据、未使用的对象,并优化内部结构。这对任何文档都是安全的,文本和图像保持不变。

中度压缩另外减少嵌入图像的图像分辨率。适用于您以数字方式共享的文档,其中不需要打印质量的图像。

重度压缩积极降低图像质量。当您需要尽可能小的文件且文档主要是文本时使用。富含图像的PDF将显示明显的质量损失。

压缩技术详细说明

技术它做什么质量成本
流重新编码用zlib/Deflate重新压缩对象流无,无损
图像下采样降低嵌入图像的DPI(300到150)图像质量损失,文本良好
图像重新编码以较低质量重新编码JPEG(95%到75%)图像质量损失
图像格式转换将PNG转换为照片的JPEG转换伪影
字体子集化仅嵌入使用的字形,而不是整个字体
删除未使用的对象剥离孤立数据
删除重复项去重相同的流
剥离元数据删除作者、历史、评论隐私改善,内容不变
线性化重新排序以实现快速Web查看无,轻微开销
删除缩略图剥离缓存的页面预览查看器必须重新渲染缩略图
OCR层展平合并单独的文本和图像层可搜索性可能会改变

好的压缩器在任何影响质量的技术之前应用无损技术(重新编码、子集化、去重)。一些压缩器暴露所有旋钮;其他使用预设。

图像分辨率目标

对于不同的用途,不同的DPI设置有意义:

用途推荐DPI为什么
打印(专业)300 DPI高质量打印的行业标准
打印(家庭)200 DPI对办公打印机足够
屏幕查看150 DPI在标准显示器上清晰
电子邮件附件100-150 DPI平衡大小和可读性
Web嵌入96 DPI标准屏幕分辨率
移动预览72 DPI较小的文件,在手机上仍然可读

从600 DPI扫描的PDF压缩到150 DPI通常会损失70-80%的文件大小,屏幕上没有可见的质量差异。

常见陷阱

更小PDF的提示

何时不要压缩

某些PDF应保持全尺寸:

替代方法

如果浏览器压缩不够缩小:

对于不应离开您机器的机密PDF,基于浏览器的压缩(此工具)或本地桌面工具(Adobe Acrobat、Ghostscript)是唯一安全的选择。

隐私和机密PDF

PDF压缩器完全在您的浏览器中运行。您上传的PDF、中间处理和压缩输出都保留在您的设备上。没有任何内容上传到服务器、记录或与任何人共享。

这很重要,因为您压缩的PDF通常非常敏感:准备发送电子邮件的签署合同、财务报表、用于旅行文件的扫描护照、发送给专家的医疗记录、禁运中的内部公司报告、员工记录、法律辩护、纳税申报表。云PDF压缩器按设计将您的文件上传到他们的服务器,通常为「服务改进」保留它们,并参与了真正的数据泄露,其中机密合同和人员记录最终被搜索引擎索引。基于浏览器的压缩器没有任何暴露:PDF永远不会离开您的机器。

基于浏览器的压缩在页面加载后也可以离线工作,对于在飞机上、在没有互联网访问的安全设施中处理文档,或在任何您不能或不应将机密文档上传到第三方的地方都很有用。

常见问题

我可以将 PDF 大小减小多少?

取决于内容。以文字为主的 PDF 只能减少 10–20%,而含大嵌入图像的 PDF 可以减少 30–50% 或更多。

压缩会降低 PDF 质量吗?

轻度压缩通过移除未使用数据和元数据来保持质量。高度压缩在图像丰富的 PDF 中可能降低图像质量,但文字仍清晰可读。

压缩后的 PDF 仍可打印吗?

可以。压缩后的 PDF 功能完整 · 可以像原文件一样打印、查看和分享。文字质量不受压缩影响。

在线压缩敏感 PDF 安全吗?

使用浏览器内的工具是安全的。您的 PDF 完全在您的设备上处理,从不发送到服务器。