PDF 元数据编辑器,免费

编辑 PDF 元数据 · 标题、作者、主题、关键词等。完全在您的浏览器中运行。

您的数据从不离开设备
将 PDF 拖到此处 或点击浏览 (最大 10 MB)

什么是 PDF 元数据?

PDF 元数据是关于文档的信息,不会出现在可见内容中。包括标题、作者、主题、关键词、创建日期及其他属性。这些信息有助于整理、搜索和识别文档。

为什么编辑 PDF 元数据?

常见问题

编辑元数据会改变 PDF 的内容吗?

不会。只有元数据被修改。PDF 的内容、页面和版式保持完全一致。

可以编辑加密 PDF 的元数据吗?

如果 PDF 受密码保护,您无法用此工具编辑其元数据。必须先解锁该文件。

文件大小限制是多少?

此工具支持最大 10 MB 的 PDF。较大的文件处理时间可能更长。

PDF元数据的本质

PDF文件可在两个地方同时携带文档级元数据。最初的机制自PDF 1.0(1993年)起存在,即文档信息字典(称为「DocInfo」或/Info):一个从PDF尾部引用的键/值对象。PDF 1.4(2001年)新增了第二种更丰富的机制,即XMP元数据流,一个嵌入为附属于文档目录的流对象的XML数据包(符合Adobe可扩展元数据平台的RDF/XML格式)。XMP于2012年成为开放的ISO标准(ISO 16684-1)。

这两个存储位置并不等同,可能相互矛盾。Adobe参考规范和ISO 32000标准均表示,当XMP存在时优先使用XMP,DocInfo应视为遗留镜像。在ISO 32000-2(PDF 2.0)中,旧版DocInfo字典除CreationDateModDate(签名处理程序仍使用)外,其余字段已被正式弃用。实际上,几乎所有阅读器(Adobe Acrobat、Foxit、macOS Preview、浏览器查看器)默认读取DocInfo,仅对DocInfo从未支持的字段(如版权)才回退至XMP。

标准DocInfo字段包括Title(标题)、Author(作者)、Subject(主题)、Keywords(关键字)、Creator(创建文档的应用程序,如「Microsoft Word」)、Producer(生成实际PDF的应用程序,如「Adobe PDF Library 17.0」)、CreationDate(创建日期)、ModDate(修改日期)(PDF日期格式如D:20240315093000-04'00')和Trapped。XMP将字段组织为命名空间:Dublin Core的dc:titledc:creatordc:rightsdc:language;XMP-MM的DocumentIDInstanceIDHistory编辑日志;PDF/A和PDF/UA合规标记;以及工具自定义的命名空间。本编辑器直接提供最常用的DocInfo字段;仅XMP支持的字段需要更专业的编辑器处理。

简史

PDF源于约翰·沃诺克1991年的内部Adobe备忘录(「Camelot」文件),提出了一种在不同设备上保持视觉保真度的便携文档格式。Adobe于1993年随Acrobat 1.0推出PDF 1.0;DocInfo字典从第一天就存在。整个1990年代至2000年代初,该格式相继增加了加密、超链接、表单、JavaScript、透明度、带标签的PDF无障碍功能(PDF 1.4,2001年)以及XMP元数据机制(同为PDF 1.4)。PDF/A(强制嵌入XMP并禁止加密的归档子集)于2005年被批准为ISO 19005-1。Adobe于2008年将PDF移交给ISO,PDF 1.7成为ISO 32000-1:2008ISO 32000-2:2017发布了PDF 2.0,主要元数据变化是弃用DocInfo,转而支持XMP。2020年修订版以及PDF协会于2023年4月免费发布规范,使该标准现已可公开获取。

隐私问题:PDF泄露了什么

由典型办公软件创建的PDF所泄露的来源信息,远比大多数用户意识到的要多。从一份PDF中通常可以提取:

值得关注的真实案例

本工具的诚实适用范围

本编辑器允许您查看和覆写标准DocInfo字段,对于在外发文件前清理作者名称、修正令文档管理系统困惑的错误标题元数据,或从新闻稿中去除工作站指纹,确实很有用。但它不是完整的净化工具。具体而言:

对于敏感文件的完整净化,正确的工具是Adobe Acrobat Pro的「净化文档」命令、开源的cpdf命令行工具的-remove-metadata选项,或ExifTool-all=指令加上手动检查。敏感工作流通常选择从提取的纯文本重新创建文档,而不是试图清理原件。

查看元数据的工具

何时会用到本工具

更多问题

为什么我的编辑有时显示在DocInfo中而不在XMP中(反之亦然)?

因为PDF同时携带两个存储位置,两者可能相互矛盾。本编辑器写入DocInfo(每个阅读器都会检查的字段)。对于有明确DocInfo对应关系的字段,XMP也会相应更新。某些查看器(尤其是Adobe Acrobat)优先读取XMP;如果编辑后看到「过时」的元数据,请用其他阅读器打开文件,确认问题是仅在XMP中,还是您的阅读器只是在缓存旧版本。

本工具会破坏数字签名吗?

是的,几乎总是如此。PDF上的数字签名保护包括元数据在内的整个文档;修改任何字节都会破坏签名的密码学验证。如果您需要编辑已签名PDF的元数据,要么先在签名者许可下删除签名,编辑元数据,然后重新签名;要么在原始工作流中在签名前应用元数据更改。

PDF/A归档文件怎么处理?

PDF/A文件有额外的XMP要求(pdfaid:partpdfaid:conformance标记,以及必填的Dublin Core字段)。在不更新XMP数据包的情况下编辑PDF/A的DocInfo可能在技术上使文件不再符合PDF/A规范。对于归档工作流,请使用具备PDF/A感知的编辑器,如Acrobat Pro或veraPDF。

如何制作一份「完全匿名」的PDF?

对于常规文件:在此编辑DocInfo以清除识别字段,然后通过Acrobat的「净化文档」或cpdf -remove-metadata处理结果。对于高风险的匿名化(举报、新闻报道、法律披露):在不同机器上仅使用从原件提取的纯文本从头重新创建PDF,不包含任何来自原件的图像。打印后重新扫描也可行(重新扫描PDF的OCR层是全新创作的),但代价是文件大小和图像质量。

有任何内容会被发送至服务器吗?

不会。PDF由pdf-lib在您浏览器中本地解析和重写;修改后的文件直接下载到您的设备。您的PDF内容不会离开本页面,当文件包含内部作者姓名、客户信息或机密主题行时尤为有用,您无需将其上传至第三方服务。pdf-lib库本身通过公共CDN加载一次(附带子资源完整性验证),然后被缓存。

相关工具