在线 PDF 涂黑,免费
永久涂黑敏感文字和图片。立即保护机密信息。
支持 PDF · 最大 100 MB
关于 PDF 涂黑
PDF 涂黑是永久移除或隐藏文档中敏感信息的过程。与仅仅用形状高亮或覆盖文字不同,正确的涂黑会完全移除底层数据,使其无法恢复。此工具使用纯色矩形永久覆盖内容 · 使涂黑区域下的原始文字或图片无法被提取或查看。
何时涂黑文档
- 法律文件: 移除机密客户信息、案件编号或敏感细节。
- 医疗记录: 遮盖患者姓名、ID 号码、诊断或治疗细节。
- 财务文件: 隐藏银行账号、社会安全号码或账户余额。
- 商业文档: 保护商业机密、员工信息或专有数据。
- 政府文件: 通过移除机密或敏感信息以遵守披露法律。
涂黑最佳实践
- 仔细审阅: 使用预览确认所有敏感区域都已涂黑。
- 分享前核对: 下载并检查最终 PDF,确认涂黑完整。
- 使用正确的颜色: 黑色是法律文档的标准;白色适用于浅色背景。
- 涂黑所有出现位置: 不要遗漏跨多页出现的信息。
- 保留涂黑后的副本: 将未涂黑的原始文档单独妥善保管。
常见问题
涂黑真的是永久不可逆的吗?
是的。此工具在 PDF 渲染层用纯色矩形替换被涂黑区域。原始内容被永久覆盖,无法恢复或重新可见。与简单的图像叠加不同,PDF 涂黑会修改文档本身。
可以只涂黑页面的一部分吗?
可以。您可以在同一页上绘制多个涂黑区域以针对特定区域。只需点击并拖动即可创建所需数量的矩形。可以对每页应用不同的涂黑。
如果涂黑时出错了怎么办?
在应用涂黑之前,点击「清除所有涂黑」即可在当前页重新开始。一旦您点击「应用涂黑」,更改便是永久性的,无法撤销。请在最终确认前仔细审查预览。
涂黑会改变文件大小或文档完整性吗?
涂黑后的 PDF 仍保持完整功能。由于添加了涂黑矩形,文件大小可能略微增加。其他所有内容、格式和文档结构保持不变并完好。
下载后可以撤销涂黑吗?
不能。涂黑一经应用到 PDF 就是永久性的。处理敏感文档前请始终保留未涂黑的备份。下载涂黑后的文件后,涂黑矩形下的原始内容无法恢复。
我的 PDF 安全且私密吗?
是的。此工具完全在您的浏览器中处理 PDF。您的文件从不离开您的设备,也不会发送到服务器。涂黑在您的计算机本地完成,确保文档完全的隐私和安全。
可以一次涂黑多个 PDF 吗?
此工具一次处理一个 PDF。要涂黑多个文件,请分别处理每个:上传、涂黑、下载,然后上传下一个 PDF。
什么是 PDF 涂黑工具?
PDF 涂黑工具从 PDF 中永久移除敏感文本、图像或区域,用不透明的纯色矩形替代它们,使底层内容无法恢复。关键词是永久:涂黑与遮盖不同。用注释工具在名字上画黑色矩形从视觉上隐藏了名字,但将原始文本保留在 PDF 内部,任何使用文本提取工具的人都能找到它。真正的涂黑会从文件中删除字节,并在其位置替换不透明形状。这一区别已在法庭文件、政府文件和企业报告中导致不止一次意外数据泄露。
本工具实现真正的涂黑。您在要移除的区域(姓名、社保号、账户详情、图像中的脸部、签名)上绘制框,工具从每页中删除底层内容,然后在已删除区域上方绘制您选择颜色的不透明矩形。输出的 PDF 不携带任何被移除内容的痕迹:没有可提取的文本,没有隐藏的表单字段,没有这些坐标处嵌入的图像数据。如果接收者对涂黑后的 PDF 运行文本搜索或文本提取,涂黑区域返回空。
所有处理在您的浏览器中运行,使用 pdf-lib(JavaScript 中的 PDF 操作)和 pdf.js(PDF 渲染)。文件被加载到内存中,涂黑操作在本地执行,涂黑后的 PDF 直接下载到您的磁盘。没有文件被上传,没有云处理涉及,没有遥测被发送。这很重要,因为您最需要涂黑的文档(法律文件、医疗记录、财务报表、安全报告)正是您绝不应出于任何原因上传到第三方处理器的文档。
工具内部
顶部的拖放区接收要涂黑的 PDF。上传后,第一页在预览区域渲染,页面导航控件出现。您逐页浏览文档。在每页上,点击并拖动以在要移除的区域上绘制涂黑矩形。每个矩形是一个独立的涂黑;您可以在每页绘制任意多个。当前页面以半透明红色显示您进行中的矩形,以便您看到已标记的内容。
颜色选择器控制输出中涂黑区域的填充颜色。黑色是默认且最熟悉的(符合法律标准的涂黑);白色在页面已经是白色背景且您希望涂黑看起来像删除而非审查标记时可能有用。您可以清除当前页面的所有涂黑(重置页面)或移除最近的涂黑(清除最后)。涂黑计数显示整个文档中排队的框数,在提交前对其进行健全性检查很有用。
应用涂黑是不可逆步骤。点击时,pdf-lib 遍历每一页,从页面内容流中删除每个矩形下的内容,然后在它们的位置绘制纯色矩形。结果是一个新的 PDF,涂黑区域被消除,而不仅是被覆盖。然后浏览器提供涂黑后的 PDF 下载。如果您将来需要查阅,请将原始 PDF 副本保存在安全的地方;工具无法从涂黑输出中恢复原始内容。
历史与背景
纸质时代的涂黑:马克笔和影印机
在数字文档之前,涂黑是物理的:文员用黑色毡尖笔标记敏感段落,然后影印标记好的页面。标记页面的影印件成为公布的版本。马克笔从物理上遮蔽了下面的墨水,影印件只保留了黑色块。这种方式缓慢且费力但安全:接收者没有办法在没有原件的情况下恢复马克笔下的内容。整个二十世纪,政府机构和律师事务所都设有整个部门专门从事手工涂黑。
数字时代初期与涂黑失败模式
1990 年代和 2000 年代文档转向数字格式时,涂黑工具落后于此。最常见的错误是使用荧光笔或绘图工具用黑色框遮盖敏感文本,然后导出为 PDF。黑色框视觉上隐藏了文本,但在 PDF 文本层中保持完好。任何使用 Adobe Reader 的人都可以从黑色框下复制文本,或在文本编辑器中打开 PDF 直接阅读。大约从 2000 年到 2015 年,这种模式在法律文件、政府报告和企业文件中造成了数十起高调泄漏。
著名涂黑失败案例(2003-2014)
简短而不完整的列表:2003 年美国司法部发布了一份涂黑的 Bechtel 伊拉克重建合同;涂黑是图像覆盖,底层文本仍可复制。2010 年与 Bradley Manning 案相关的法庭文件有类似可提取的涂黑文本。2011 年 TSA 机场安全操作手册发布时,涂黑部分在源文件中仍可读。2014 年 Paul Manafort 的法庭文件包含不当涂黑的段落,记者在几分钟内就读出来了。每起事件都让产生该文件的组织难堪,并引发了内部政策审查。这些失败促使政府和法律行业转向专用涂黑工具,而不是临时高亮。
Adobe Acrobat 添加正确涂黑(2006)
Adobe 在 2006 年的 Acrobat Professional 8 中添加了专用涂黑工具,然后在 2000 年代初的涂黑失败之后大力推广。Acrobat 工具标记涂黑区域,然后单独的应用步骤实际从页面流中删除内容并写入不透明矩形。两步设计(标记,然后应用)是有意的:标记步骤可逆,应用步骤不可逆,用户在不可逆操作之前会被警告。Adobe 还添加了查找和涂黑功能,可在整个文档中定位社保号或电子邮件地址等模式。
PDF/A 和涂黑标准(ISO 32000-2,2017)
2017 年发布的 ISO 32000-2 标准添加了一个正式的 Redact 注释类型(第 12.5.6.23 节),它定义了涂黑标记应如何编码,以及应用步骤应如何产生永久涂黑的输出。符合标准的 PDF 工具可以一致地解释 Redact 注释。标准还建议在应用步骤期间清理元数据、嵌入文件、隐藏表单字段、JavaScript 和其他非可见内容。这一明确规范减少了供应商实现之间的分歧,使跨工具工作流程更加可靠。
基于浏览器的涂黑成熟(2020 年起)
随着 pdf.js 和 pdf-lib 的成熟,基于浏览器的涂黑变得可行。早期的云涂黑服务(Smallpdf、iLovePDF、PDF24)要求将敏感文档上传到第三方服务器,这使用户涂黑医疗记录、法律文件或财务数据的目的落空。完全在 JavaScript 中运行的客户端浏览器工具解决了隐私问题:文档永不离开设备,但涂黑逻辑仍然有效。本工具遵循这一发展路线,使用 pdf-lib 的内容流操作来真正删除涂黑字节,而不是覆盖它们。
实用工作流程
法律开示生产
在民事和刑事诉讼中,各方根据开示规则向对方律师出示文件。其中一些文件包含特权通信、工作成果、第三方私人信息或商业秘密,即使周围文件可以出示,这些也必须保留。涂黑去除特权内容,同时保留其余部分。涂黑后的 PDF 被加盖 Bates 编号并出示。使用真正的涂黑工具而不是高亮,避免了产生一份对方律师可以在五秒内取消涂黑的文件这种有据可查的尴尬。
FOIA 和公共记录回应
回应《信息自由法》请求(美国)、《信息访问法》请求(加拿大)或全球同等法规的政府机构必须发布所请求的记录,但可根据列举的豁免涂黑特定内容:国家安全、个人隐私、执法方法、律师-客户特权。涂黑必须是永久的,因为发布的文件会送给请求者,并且经常送给积极寻找涂黑失败的记者。真正的涂黑工具在这里至关重要。
符合 HIPAA 的医疗记录共享
美国医疗提供者在为研究、计费审计、保险索赔调查或法律程序共享医疗记录前,必须从中涂黑受保护的健康信息(PHI)。PHI 包括姓名、年份以外的日期、小于州的地理标识符、联系信息、社保号、账号以及一长串其他标识符。从多页医疗记录手动涂黑所有这些是繁琐的,但这是遵守隐私规则的唯一方法。客户端涂黑工具将记录保留在设备上,这本身就有助于 HIPAA 合规。
GDPR 主体访问响应
欧盟企业响应 GDPR 主体访问请求时,必须向请求者提供企业持有的个人数据,同时涂黑同一文件中提到的任何其他人的个人数据。如果公司电子邮件线程提到了请求者和三位同事,则提供给请求者的版本中,同事的姓名、联系方式和个人信息必须被涂黑。涂黑必须是永久的,以便后续接收者无法恢复第三方数据。
保险索赔文件共享
当被保险人与第三方(理赔员、经纪人、律师、监管机构)共享索赔档案时,他们通常需要从支持文件中涂黑医疗或财务详情。银行对账单包含与索赔无关的其他交易。医疗账单包含与索赔无关的状况和治疗。涂黑无关信息保护被保险人的隐私,同时仍提供评估索赔所需的数据。涂黑后的 PDF 可以通过电子邮件发送或上传到相关门户。
研究数据匿名化
处理包含个人身份信息文件(法庭记录、医疗记录、社交媒体导出)的学术和企业研究人员,经常需要在与合作者共享或发布研究成果之前对源数据进行匿名化。从每个文件中涂黑姓名、地点和标识符,产生可以在论文中引用并与共同作者分享的匿名版本。伦理委员会批准(美国的 IRB)通常要求这种永久涂黑作为涉及人类受试者研究的批准条件。
常见陷阱
遮盖与删除不同
最常见的涂黑失败是用形状或高亮工具在敏感文本上画黑色矩形,然后导出为 PDF。矩形是位于页面顶部的独立对象。下面的文本仍在 PDF 中,可以被任何用光标选择它、在文本编辑器中打开 PDF 或运行文本提取工具的人完全提取。始终使用执行真正涂黑的工具(删除底层内容并用矩形替换它),而不是遮盖。本工具进行真正的涂黑;许多临时工作流程则不然。
元数据泄漏涂黑故事
PDF 元数据(作者、标题、修改日期、生产软件)可以揭示谁编辑了文档以及何时编辑,即使可见内容已被涂黑。导出的 Word 转 PDF 文档的 Microsoft Office 元数据可以包括评论、跟踪更改和先前作者的姓名。PDF 元数据可以包括原始文件名,本身可能就是敏感的。将元数据清理作为涂黑工作流程的一部分:使用 PDF 元数据工具或在应用步骤中剥离元数据的涂黑工具。Acrobat Pro 中的文档检查器会这样做;许多快速工具不会。
表单字段、JavaScript 和附件持续存在
PDF 可以携带交互式表单字段、嵌入的 JavaScript、附加文件、音频、视频和 3D 内容,这些在页面上不可见呈现。可见页面上的涂黑矩形不会触及这些。如果表单字段包含敏感内容(例如,从数据库自动填充的隐藏姓名字段),涂黑可见页面将使表单数据完好无损。将剥离表单数据、JavaScript 和附件作为单独的步骤。本工具使用的 pdf-lib 库在您应用真正的涂黑时会移除表单字段,但始终通过在暴露表单数据的查看器中打开输出来验证。
比较涂黑和未涂黑版本暴露秘密
如果同一文档的涂黑版本和较早未涂黑版本都泄露,逐像素比较会准确显示涂黑了什么。这就是记者有时从法庭文件中重建涂黑内容的方式:通过找到较早的草稿。永远不要分发同一文档的多个版本;一旦涂黑版本发布,未涂黑版本就成为安全风险,应被控制或销毁。这更多是操作陷阱而不是工具故障,但它是击败涂黑泄漏的最常见途径。
OCR 可以从涂黑不当的扫描中恢复文本
对于扫描的 PDF(文本是图像而不是可选文本),在扫描图像上画矩形通常是安全的,因为没有文本层可供提取。例外是扫描经过 OCR,识别的文本与图像一起存储为隐藏文本层。涂黑可见图像会使 OCR 文本层完好无损,可由文本提取工具恢复。要么将 OCR 层与图像一起涂黑,要么在生成涂黑扫描之前剥离 OCR 层。
字符级涂黑的字体宽度泄露
对于非常短的涂黑(长段落中的单个词),矩形的宽度可能泄露信息:更宽的矩形暗示更长的词。对于姓名,这可能缩小可能性。对于数字,如果格式已知,这可能是决定性的(涂黑的九位数字可能是 SSN)。为防止基于宽度的推断,涂黑整行或整句而不是精确的字符段,并对相同类型的涂黑使用标准化的矩形宽度,无论底层内容长度如何。
隐私和数据处理
您上传的 PDF、绘制的涂黑矩形和涂黑输出 PDF 都保留在您的设备上。pdf.js 处理渲染,您在透明画布覆盖层上标记涂黑,pdf-lib 执行涂黑操作并生成输出文件,所有这些都在浏览器内的 JavaScript 中。没有网络请求承载文件内容,没有上传发生,没有关于您涂黑内容的遥测被收集。这对涂黑比对几乎任何其他 PDF 操作都更重要:涂黑的全部目的是保护敏感内容,因此任何上传文档的工具甚至在您开始之前就已使目的落空。
实际含义:您可以在页面加载后断开互联网连接,完全离线运行整个涂黑工作流程。许多法律和医疗工作流程要求这种气隙处理作为政策,特别是在涂黑受特权、律师-客户保密或 HIPAA 保护的文件时。涂黑文件以普通浏览器下载形式出现;除您选择保存下载文件的地方外,任何地方都不保存任何内容。将原始 PDF 保存在单独的受控位置,并将涂黑输出视为唯一安全可分享的版本。
何时不使用此工具
当 PDF 受密码加密时(先解锁)
如果 PDF 需要密码才能打开,pdf.js 无法渲染它,工具也无法加载它进行涂黑。首先使用 PDF 解锁工具移除密码(您需要知道密码),然后涂黑,然后可选地在涂黑输出上重新应用密码保护。按此顺序操作有效,因为涂黑输出是一个新的 PDF,可以独立于原始版本进行加密。
对于基于模式的搜索和涂黑(使用桌面版 Acrobat Pro)
如果您需要在一千页文档中涂黑每个社保号、每个电子邮件地址或某个特定名字的每个实例,手工绘制矩形是不切实际的。Adobe Acrobat Pro 的查找和涂黑功能允许您指定模式(SSN、电子邮件、电话号码的正则表达式),并自动标记整个文档中的每个匹配项。本浏览器工具专注于手动基于区域的涂黑。对于大规模基于模式的批量涂黑,使用桌面 Acrobat 工作流程。
对于涂黑源文档而不是导出
如果文档源于 Word、Google 文档或其他可编辑格式,且您希望从源中永久移除文本,则在源应用程序中进行,而不是在 PDF 中。在 Word 中删除敏感文本,保存新的 Word 文件,然后导出为 PDF。这避免了涂黑 PDF 在某处仍有未涂黑源的保管链问题。当 PDF 是权威原件(法庭命令、现有备案)或您无法访问源时,PDF 涂黑是正确的选择。
对于仅涂黑元数据(使用元数据剥离器)
如果 PDF 的可见内容没问题,但元数据包含敏感信息(作者姓名、原始文件名、编辑历史),则不需要涂黑工具。使用元数据剥离工具清除文档信息字典和 XMP 元数据。本站点上的 PDF 元数据工具读取元数据;一些 PDF 工具提供清理元数据或文档检查器功能来清除它。涂黑工具专注于可见内容;元数据剥离器专注于不可见内容。
更多问题
如何验证涂黑真的是永久的?
在文本编辑器中打开涂黑的 PDF(任何处理二进制文件的编辑器),或对其运行文本提取工具。尝试在任何 PDF 查看器中从涂黑区域选择并复制文本。如果涂黑有效,所有三种方法对涂黑区域都返回空。另一种检查:在 Adobe Acrobat 中打开 PDF 并运行文档检查器;它会列出任何幸存的可提取内容。如果在任何这些检查中都看不到涂黑文本,涂黑就是真实的。
本工具是否清理 PDF 元数据?
当您应用涂黑时,pdf-lib 会重写 PDF,默认情况下不保留原始的每个元数据字段。作者姓名、修改日期和生产者字符串通常会被重置。然而,这不是全面的元数据剥离。对于敏感工作流程,在分享前通过专用的元数据剥离步骤运行涂黑输出(或使用 PDF 元数据工具检查并清除特定字段)。
我应该为涂黑矩形使用什么颜色?
黑色是法律和政府标准,立即识别为涂黑。当文档背景也是白色且您希望涂黑看起来像删除而不是审查标记时,白色可能有用,但它在视觉上可能模糊(看起来像空白而不是涂黑内容)。对于大多数专业用途,使用黑色:它明确、传统,并向接收者表明某些内容被故意移除。
涂黑的 PDF 比原始的更大还是更小?
通常略小,因为涂黑内容从页面流中删除。在涂黑区域上绘制的矩形是最小的附加数据。偶尔由于 pdf-lib 重写内容流的方式,文件大小会增加一小部分。对于多达几百页的文档,变化通常可以忽略不计。如果文件大小是约束,通过 PDF 压缩步骤运行涂黑输出。
涂黑输出对法庭电子备案系统(PACER、ECF)可接受吗?
涂黑 PDF 是标准 PDF,可在任何接受 PDF 的电子备案系统中工作,包括 PACER、州法院电子备案系统和联邦机构。大多数法院要求涂黑是永久的(这是本工具产生的)。检查您管辖区的具体本地规则:有些要求涂黑用涂黑印章(法庭认可的图形,标识应用了哪种豁免类型)标记,这是基本涂黑之上的工作流程。本工具提供的基本删除和替换满足永久性技术要求。
除了文本,我能涂黑图像吗?
可以。涂黑矩形基于区域,而不是基于内容类型:矩形下的任何像素都被移除,无论它们来自文本还是图像。在照片中的脸部上绘制涂黑框会永久移除页面该区域中的图像数据。这适用于截图、照片、图表、签名和任何其他图形内容。对于全页仅图像的 PDF(扫描),涂黑的工作方式与基于文本的 PDF 相同。