如何将 PDF 分割为单独的页面
一份 50 页的 PDF 适合归档,但不适合分享。当您只需要发送第 3 到 7 页,或者当您需要每页作为单独的文件时,分割就是答案。PDF 分割是办公工作中最常见的文件操作之一:合同审查、法律证据开示、课程材料分发、财务报告和数十个其他工作流程都会经过一个步骤,将长文档分解成较小的部分。
何时分割 PDF
- 分享特定章节:从长报告中提取相关页面,而不是发送整个文档。一份 200 页的年度报告浓缩为 12 页的执行摘要,符合收件人的注意力时长。
- 电子邮件附件:一份 30 MB 的 PDF 无法通过电子邮件网关。将其分割成较小的块,保持在 25 MB 限制(Gmail)、20 MB(Outlook 365)或 10 MB(许多企业网关)以下。
- 组织文档:将多章节文档分离为每个章节的单独文件。一份带有五个附录的董事会文件包变成六个单独的文件,每个文件在文件系统中都有自己的标题。
- 提取表单:从较大的 PDF 包中提取单个表单。保险申请、税务申报和政府提交通常捆绑 50 多页,您只需要其中的几个特定表单。
- 分发课程材料:存储为一个 PDF 的课程包变成每个讲座的文件集,学生更容易选择性下载。
- 法律证据开示:在诉讼中,律师通常将源文档分割为按文档或按证人的集合进行审查和制作。对每个分割进行 Bates 标记是相关任务。
如何在线分割 PDF
- 上传您的 PDF:单击"选择文件"或将 PDF 拖放到上传区域。大多数浏览器中最高支持 100 MB 的文件;非常大的文件可能会减慢处理速度。
- 选择分割模式:选择"提取所有页面"以将每个页面作为单独的文件获取,或选择"自定义范围"以准确指定您想要的页面。
- 分割并下载:单击"分割 PDF"并将提取的页面下载为 ZIP 文件。
使用自定义页面范围
自定义范围输入让您准确指定所需内容:
1-5将第 1 到 5 页提取到一个合并的 PDF 中3, 7, 12仅将第 3、7 和 12 页提取到一个合并的 PDF 中(按该顺序)1-3, 8-10将第 1-3 页和第 8-10 页提取为一个合并的 PDF5-从第 5 页提取到文档末尾-3从第 1 页提取到第 3 页(等同于1-3)
您列出范围的顺序就是它们在输出 PDF 中出现的顺序。因此 5-7, 1-3 产生一个先包含第 5、6、7 页然后是第 1、2、3 页的 PDF。这在您想要在分割的同时重新排序章节时很有用。
常见分割策略
按章或节分割:打开 PDF,从目录中记下每章开始的页码,然后使用与章节边界匹配的自定义范围运行分割。对于章节起始于第 5、23、47、78 页的书籍 PDF,您将使用诸如 5-22, 23-46, 47-77, 78- 的范围。
分割以符合电子邮件大小限制:对于需要在每封邮件 10 MB 以下的 30 MB PDF,对于图像密集型文档大约每兆字节计算三页,对于文本密集型文档每兆字节计算十页。目标是产生 8-9 MB 输出文件的分割以留出余量。
按受众分割:当单个 PDF 包含多个收件人的内容时(带有 CFO 部分、COO 部分等的董事会文件包),分割成每个受众的文件,以便每个收件人只看到他们需要的内容。这也是基本的保密纪律。
分割用于归档:对于打算用于归档存储的长文档,分割成每部分的文件可以更容易地以后检索特定部分,而无需下载整个文档。配合明确的命名约定(Title_Ch01_Introduction.pdf)。
历史与背景
PDF 由 Adobe 于 1993 年 6 月作为 Acrobat 1.0 发布。从一开始,该格式就支持页面级结构:每个页面都是 PDF 对象树中的独立对象,具有自己的内容流、资源和元数据。分割 PDF 相当于将相关页面对象复制到新的 PDF 文档中。
第一批广泛可用的 PDF 分割器是命令行工具(pdftk,由 Sid Steward 编写,2003 年发布),它们封装了底层 PDF 对象模型。Adobe 在版本 6(2003)中向 Acrobat Pro 添加了页面提取功能。基于 Web 的分割器在 2013 年随 Smallpdf、iLovePDF 和 PDF24 出现。使用 pdf-lib(2018)和 pdf.js(Mozilla,2011)的基于浏览器的客户端分割器使得无需服务器上传即可进行在线分割成为可能,这对于机密文档很重要。
隐私和机密文档
许多分割工作流程涉及机密文档:法律合同、医疗记录、财务报表、内部 HR 文档。云分割器需要将 PDF 上传到第三方服务器,这正是您希望避免的敏感内容操作。基于浏览器的分割器(包括本站的 PDF 分割器)完全在您的浏览器中使用 JavaScript 运行。文件在本地加载到内存中,页面提取在您的机器上运行,输出直接下载。没有上传,没有服务器处理,没有关于您分割了什么的遥测数据。对于机密文档,这是要避免的故障模式:一个免费的云分割器悄悄保留您文件的副本用于分析或训练。
常见陷阱
- 页码与 PDF 页面索引:PDF 上打印的页码(可能从罗马数字前言开始)可能与 PDF 的内部页面索引(从 1 开始)不匹配。当您指定自定义范围时,您使用的是 PDF 的内部索引,而不是打印的页码。通过预览检查。
- 加密的 PDF:如果 PDF 需要密码才能打开,您必须先使用 PDF 解锁工具删除密码。基于浏览器的分割器在没有密码的情况下无法处理加密的 PDF。
- 表单字段和注释:当您从带有表单字段的 PDF 中提取单个页面时,该页面上的表单数据被保留,但跨页表单逻辑(下一步按钮引用、依赖其他页面的计算字段)会中断。对于表单密集型 PDF,分割通常是个坏主意。
- 已签名的 PDF:数字签名的 PDF 在分割时会失去其签名,因为签名涵盖整个原始文档。分割输出是有效的 PDF,但未签名。对于审计或合规工作流程,请将分割文档为与任何签名工作流程分开的步骤。
提示
- 首先预览 PDF:滚动浏览并记下分割前您需要哪些页码。这比分割后检查每个文件节省时间。
- 分割后合并:如果您需要将文档不同部分的页面合并到一个文件中,请提取您需要的页面,然后使用 PDF 合并工具按正确顺序将它们合并。
- 分割后压缩:如果生成的文件仍然太大,请在分割后通过 PDF 压缩器运行它们。仅分割可能不会将每个文件的大小减少到足以满足严格的电子邮件限制。
- 立即重命名输出:分割器的 ZIP 输出通常使用通用名称,如 page_1.pdf、page_2.pdf。在提取后立即将它们重命名为有意义的名称(Smith_Contract_Sect_A.pdf),以避免以后丢失。
- 保留原件:始终在原始 PDF 的副本上工作。分割本身是非破坏性的(原始文件不会被修改),但如果您不小心删除了原件,您无法仅从分割中重建它而不付出努力。
常见问题
可以将 PDF 分为单独的页面吗?
可以。选择「提取所有页面」将每页变为自己的 PDF。它们会一起以 ZIP 文件下载。
可以提取特定的页面范围吗?
可以。使用「1-3, 5, 7-10」这样的自定义范围,只将需要的页面提取为一个新 PDF。
分割会改变内容吗?
不会。每个提取的页面都是原文的精确副本 · 文字、图片和格式都保留。
我的 PDF 会发送到服务器吗?
不会。所有分割都在您的浏览器中进行。您的 PDF 从不离开您的设备。