無料オンラインPDF墓黒ツール

機密のテキストや画像を永久的に墓黒します。機密情報をすぐに保護します。

ファイルはお使いのデバイスから出ません
PDFをここにドロップ またはクリックして参照

PDFファイルに対応 · 最大100 MB

使い方: PDFをアップロードし、プレビューの機密領域にボックスを描き、「墓黒を適用」をクリックして内容を永久的に墓黒します。墓黒は選択した領域内のテキスト、画像、すべてのコンテンツを覚います。元のPDFデータは単色の長方形に置き換えられます。

PDF墓黒について

PDF墓黒とは、文書から機密情報を永久的に削除または非表示にするプロセスです。単純なハイライトや図形による文字の覚いとは異なり、適切な墓黒は基礎となるデータを完全に削除するため、復元することはできません。このツールは単色の長方形を使用してコンテンツを永久的に覚い、墓黒下の元のテキストや画像を抽出または閲覧することを不可能にします。

文書を墓黒すべきとき

墓黒のベストプラクティス

よくある質問

墓黒は本当に永久的で復元不能ですか?

はい。このツールはPDFレンダリングレベルで墓黒領域を単色の長方形に置き換えます。元のコンテンツは永久的に覚われ、回復または再度表示することはできません。単純な画像オーバーレイとは異なり、PDF墓黒は文書そのものを変更します。

ページの一部だけを墓黒できますか?

はい。同じページに複数の墓黒ボックスを描いて、特定の領域を對象とすることができます。クリックしてドラッグするだけで必要な数の長方形墓黒を作成できます。ページごとに異なる墓黒を適用できます。

墓黒中に間違いを犯した場合は?

墓黒を適用する前に「すべての墓黒をクリア」をクリックして現在のページでやり直してください。「墓黒を適用」をクリックすると、変更は永久的になり、元に戻すことはできません。最終化前に必ずプレビューを注意深く確認してください。

墓黒はファイルサイズや文書の完全性に影響しますか?

墓黒されたPDFは完全に機能します。追加の墓黒長方形によりファイルサイズがわずかに増加する場合があります。その他のすべてのコンテンツ、書式、文書構造は変更されずそのままです。

取得後に墓黒を元に戻せますか?

いいえ。PDFに適用された墓黒は永久的です。墓黒する前に常に機密文書の未墓黒のバックアップを保存してください。墓黒されたファイルが取得されると、墓黒下の元のコンテンツは復元できません。

私のPDFは安全かつプライベートですか?

はい。このツールはPDFをブラウザ内で完全に処理します。ファイルがデバイスを離れたり、サーバーに送信されたりすることはありません。墓黒はご自分のコンピューターでローカルに行われ、文書の完全なプライバシーとセキュリティを確保します。

複数のPDFを一度に墓黒できますか?

このツールは一度に1つのPDFを処理します。複数の文書を墓黒するには、アップロード、墓黒、取得を行い、次のPDFをアップロードして、ファイルごとに個別に処理します。

PDF墨消しツールとは?

PDF墨消しツールは、PDFから機密のテキスト、画像、領域を恒久的に削除し、純色の四角形で置き換え、下にあった内容を復元できないようにします。鍵となる言葉は「恒久的に」です。墨消しは覆い隠しと同じではありません。注釈ツールで名前の上に黒い四角形を描けば、名前は視覚的に隠れますが、PDFの中の元のテキストは残り、テキスト抽出ツールを持つ誰もが見つけられます。本物の墨消しはファイルからバイトを削除し、不透明な形をその場所に置き換えます。この区別は、裁判書類、政府文書、企業報告書において複数回の偶発的なデータ漏えいを引き起こしてきました。

本ツールは本物の墨消しを実装します。削除する領域(名前、社会保障番号、口座詳細、画像内の顔、署名)の上に箱を描くと、ツールが各ページの下にある内容を削除し、選んだ色の不透明な四角形を削除領域の上に描きます。出力PDFには取り除かれたものの痕跡が残りません。抽出可能なテキストはなく、隠しフォームフィールドもなく、その座標に埋め込まれた画像データもありません。受信者が墨消し済みPDFでテキスト検索やテキスト抽出を実行しても、墨消し領域は何も返しません。

すべての処理はpdf-lib(JavaScriptでのPDF操作)とpdf.js(PDF描画)を使ってブラウザ内で実行されます。ファイルはメモリに読み込まれ、墨消し操作はローカルで実行され、墨消し済みPDFは直接ディスクへダウンロードされます。ファイルはアップロードされず、クラウド処理は関与せず、テレメトリも送信されません。これが重要なのは、あなたが最も墨消しを必要とする文書(法的提出書類、医療記録、財務諸表、セキュリティ報告書)が、いかなる理由でも第三者プロセッサにアップロードすべきでない文書とまったく同じだからです。

ツールの内側

上部のドロップゾーンは墨消し対象のPDFを受け取ります。アップロード後、最初のページがプレビュー領域に描画され、ページ移動コントロールが現れます。文書をページごとにたどっていきます。各ページで、削除したい領域の上にクリックとドラッグで墨消しの四角形を描きます。各四角形が個別の墨消しで、各ページに必要なだけ描けます。現在のページでは進行中の四角形が半透明の赤で表示され、すでに印を付けたものが見えます。

カラーピッカーは、出力で墨消し領域を埋める色を制御します。黒が既定で最も一般的(法的標準の墨消しに一致)です。白はページの背景が既に白で、墨消しを検閲マークではなく削除のように見せたいときに便利です。現在のページのすべての墨消しを消す(ページをリセット)か、最新のものを取り消す(最後を消去)ことができます。墨消し件数は文書全体で何個の箱が予約されているかを示し、確定前の確認に役立ちます。

墨消しを適用は不可逆のステップです。クリックすると、pdf-libがすべてのページをたどり、各四角形の下の内容をページコンテンツストリームから削除し、その場所に純色の四角形を描きます。結果として得られる新しいPDFでは、墨消しされた領域は覆われているのではなく消えています。ブラウザは墨消し済みのPDFをダウンロード用に提示します。元のPDFが必要になる場合に備えて、安全な場所にコピーを保管してください。ツールは墨消し済みの出力から元の内容を復元できません。

歴史と背景

マーカーとコピー機による紙時代の墨消し

デジタル文書以前、墨消し作業は物理的なものでした。職員が機密箇所に黒のフェルトペンで印を付け、その上から書類をコピーする。印を付けたページのコピーが公開版となります。マーカーは下のインクを物理的に覆い隠し、コピーには黒い塊だけが残ります。遅く労働集約的でしたが安全でした。原本がなければマーカーの下の内容を復元する手段はありません。政府機関や法律事務所は20世紀を通じて、手作業の墨消しに専従する部署を丸ごと運営していました。

初期デジタル時代と墨消し失敗のパターン

1990年代から2000年代にかけて文書がデジタル化されたとき、墨消しツールはそれに追いつけませんでした。最もよくある失敗は、ハイライトや図形描画ツールで機密のテキストを黒い箱で覆い、その後PDFに書き出すというものでした。黒い箱は見た目には文字を隠しましたが、PDFのテキストレイヤーには文字がそのまま残りました。Adobe Readerを持つ人なら誰でも黒い箱の下のテキストをコピーできましたし、PDFをテキストエディタで開けば直接読むこともできました。このパターンが2000年から2015年頃にかけて、訴訟資料、政府報告書、企業文書で数十件の重大な情報漏えいを引き起こしました。

有名な墨消し失敗 (2003-2014)

短く不完全なリスト: 2003年、米司法省はBechtelとのイラク復興契約書を墨消し版で公開しましたが、墨消し部分は画像のオーバーレイで、その下のテキストはコピー可能でした。2010年のBradley Manning関連の裁判書類でも、同様に抽出可能な墨消しテキストが含まれていました。2011年にはTSAの空港セキュリティ運用マニュアルが、墨消しされたはずのセクションがソース内で読める状態で公開されました。2014年にはPaul Manafortの裁判書類で不適切に墨消しされた箇所があり、ジャーナリストたちが数分で読み解きました。各事件は発行元の組織に恥をかかせ、内部ポリシーの見直しを促しました。これらの失敗は、政府と法務業界を即席のハイライトではなく専用の墨消しツールへと押しやりました。

Adobe Acrobatが正しい墨消しを追加 (2006)

Adobeは2006年に専用のRedactツールをAcrobat Professional 8に追加し、2000年代初頭の墨消し失敗の後、これを強く推進しました。Acrobatのツールは墨消し対象の領域に印を付け、その後別の「適用」ステップが実際にページコンテンツストリームから内容を削除し、不透明な四角形を書き込みます。二段階の設計(印を付けてから適用)は意図的でした。印を付ける段階は可逆的、適用段階は不可逆的で、ユーザーは不可逆な操作の前に警告を受けます。Adobeはまた、社会保障番号やメールアドレスのようなパターンを文書全体から見つける「検索して墨消し」機能も追加しました。

PDF/Aと墨消し標準 (ISO 32000-2、2017)

2017年に公開されたISO 32000-2標準は、正式なRedact注釈タイプ(セクション12.5.6.23)を追加し、墨消しマークの符号化方法と適用ステップが恒久的に墨消しされた出力をどう生成すべきかを定義しました。準拠するPDFツールはRedact注釈を一貫して解釈できます。同標準はまた、適用ステップ中にメタデータ、埋め込みファイル、隠しフォームフィールド、JavaScriptなどの非可視コンテンツを浄化するよう推奨しています。この明示的な仕様は、ベンダー実装間のばらつきを減らし、ツールをまたぐワークフローをより信頼できるものにしました。

ブラウザベースの墨消しが成熟 (2020年以降)

pdf.jsとpdf-libが成熟するにつれて、ブラウザベースの墨消しが現実的になりました。以前のクラウド墨消しサービス(Smallpdf、iLovePDF、PDF24)は機密文書を第三者サーバへアップロードする必要があり、医療記録、法務文書、財務データを墨消ししたいユーザーにとって目的を打ち消すものでした。完全にJavaScriptで動くクライアントサイドのブラウザツールはプライバシー問題を解決します。文書はデバイスを離れず、墨消しロジックは依然として機能します。本ツールもその流れを汲み、pdf-libのコンテンツストリーム操作を使って、墨消しされたバイトを重ねるのではなく実際に削除します。

実用的なワークフロー

訴訟ディスカバリーでの文書提出

民事および刑事の訴訟では、当事者がディスカバリー規則のもと相手方弁護士に文書を提出します。それらの文書の一部には、特権通信、弁護士の労作物、第三者の私的情報、企業秘密が含まれていることがあり、周囲の文書が提出可能であっても、これらは差し止めねばなりません。墨消しは特権内容を取り除きつつ残りを保ちます。墨消しされたPDFがベイツ・スタンプを押されて提出されるものとなります。ハイライトではなく本物の墨消しツールでこれを行えば、相手方弁護士が5秒で墨消しを解除できる文書を提出するという、よく知られた恥ずかしい事態を避けられます。

FOIAおよび公的記録への応答

情報公開法(米国の Freedom of Information Act)、情報アクセス法(カナダの Access to Information Act)、または世界中の同等の法令に基づくリクエストに応じる政府機関は、要求された記録を公開しなければなりませんが、列挙された免除(国家安全保障、個人プライバシー、法執行手法、弁護士・依頼人特権)のもとで特定の内容を墨消しできます。墨消しは恒久的でなければなりません。公開された文書はリクエスト提出者に渡り、墨消し失敗を積極的に探すジャーナリストに渡ることが多いからです。ここでは本物の墨消しツールが不可欠です。

HIPAA準拠の医療記録共有

米国の医療提供者は、研究、請求監査、保険金請求調査、または法的手続きのために共有する前に、医療記録から保護対象保健情報(PHI)を墨消ししなければなりません。PHIには、名前、年以外の日付、州より小さい地理的識別子、連絡先情報、社会保障番号、口座番号、その他の長いリストの識別子が含まれます。複数ページの医療記録からこれらすべてを手作業で墨消しするのは退屈ですが、Privacy Ruleに準拠する唯一の方法です。クライアントサイドの墨消しツールは記録をデバイス上に保ち、それ自体がHIPAA準拠に役立ちます。

GDPRのデータ主体アクセス要求への応答

GDPRのデータ主体アクセス要求に応じるEU企業は、保持する個人データを請求者に提供する必要がありますが、同じ文書で言及されている他の人の個人データは墨消ししなければなりません。社内メールスレッドが請求者と3人の同僚に言及している場合、同僚の名前、連絡先詳細、個人情報は請求者に提供する版から墨消しされなければなりません。後続の受信者が第三者データを回復できないように、墨消しは恒久的でなければなりません。

保険金請求書類の共有

被保険者が請求ファイルを第三者(調査員、ブローカー、弁護士、規制当局)と共有するとき、しばしば裏付け文書から医療や財務の詳細を墨消しする必要があります。銀行明細書には請求と無関係の他の取引が含まれます。医療請求書には請求と無関係の状態や治療が含まれます。無関係の情報を墨消しすれば、請求の評価に必要なデータを提供しつつ被保険者のプライバシーを守れます。墨消し済みPDFはメール送信または関連ポータルへアップロードできます。

研究データの匿名化

個人を特定できる情報を含む文書(裁判記録、医療記録、ソーシャルメディアのエクスポート)を扱う学術および企業の研究者は、共著者と共有したり研究成果として公開したりする前に、元データを匿名化する必要があることがよくあります。各文書から名前、場所、識別子を墨消しすれば、論文で引用したり共著者と共有できる匿名化された版が得られます。倫理委員会(米国のIRB)の承認では、人間を対象とする研究の承認条件として、この種の恒久的な墨消しを要求することがよくあります。

よくある落とし穴

覆うことは削除することと同じではない

最もよくある墨消し失敗は、図形やハイライトツールで機密のテキストの上に黒い四角形を描き、PDFに書き出すことです。その四角形はページの上に乗る別のオブジェクトです。下のテキストは依然PDFの中にあり、カーソルで選択すれば、PDFをテキストエディタで開けば、あるいはテキスト抽出ツールをかければ、誰でも完全に取り出せます。下にある内容を削除して四角形に置き換える本物の墨消しを行うツールを必ず使い、単なる覆い隠しは避けてください。本ツールは本物の墨消しを行います。多くの即席ワークフローはそうではありません。

メタデータが墨消しのストーリーを漏らす

PDFメタデータ(著者、タイトル、変更日、生成元ソフトウェア)は、可視内容を墨消しした後でも、誰が文書を編集したのか、いつ編集したのかを明らかにし得ます。WordからPDFに書き出した文書のMicrosoft Officeメタデータには、コメント、変更履歴、以前の著者名が含まれている場合があります。PDFメタデータには元のファイル名が含まれていて、それ自体が機密の場合もあります。墨消しワークフローの一部としてメタデータをサニタイズしてください。PDF metadataツール、または適用ステップでメタデータを削除する墨消しツールを使う。Acrobat ProのDocument Inspectorはこれを行います。多くの簡易ツールは行いません。

フォームフィールド、JavaScript、添付は残る

PDFは対話的なフォームフィールド、埋め込みJavaScript、添付ファイル、音声、動画、3Dコンテンツを保持でき、これらはページ上に目に見える形では描画されません。可視ページ上の墨消し四角形はこれらに触れません。フォームフィールドが機密の内容を保持していた(例えばデータベースから自動入力された隠しの名前フィールド)場合、可視ページの墨消しではフォームデータは無傷で残ります。フォームデータ、JavaScript、添付ファイルは別パスで削除してください。本ツールが使うpdf-libライブラリは本物の墨消しを適用するときにフォームフィールドを削除しますが、フォームデータを露出するビューアで出力を開いて必ず確認してください。

墨消し版と未墨消し版を比較すると秘密が露出する

同じ文書の墨消し版と先行の墨消し前版の両方が流出した場合、ピクセル単位の比較で何が墨消しされたかが正確に分かります。ジャーナリストが裁判書類から墨消し内容を再構築するのは、こうして以前のドラフトを見つけることがあります。同じ文書の複数版を絶対に配布しないでください。墨消し版が公開されたら、墨消し前版はセキュリティリスクとなり、管理または破棄すべきです。これはツール失敗というより運用上の落とし穴ですが、墨消しを無効化する漏えいで最も一般的な経路です。

OCRが不十分に墨消しされたスキャンからテキストを復元しうる

スキャン済みPDF(テキストが選択可能なテキストではなく画像になっている)では、スキャン画像の上に四角形を描くことは抽出すべきテキストレイヤーがないため一般に安全です。例外は、スキャンがOCRを通り、認識されたテキストが画像の隣に隠しテキストレイヤーとして保存されている場合です。可視画像を墨消ししてもOCRテキストレイヤーは無傷で残り、テキスト抽出ツールで回復可能です。OCRレイヤーを画像と一緒に墨消しするか、墨消し済みスキャンを生成する前にOCRレイヤーを除去してください。

文字単位の墨消しではフォント幅が情報を漏らす

ごく短い墨消し(長い文章中の単語1つ)では、四角形の幅が情報を漏らし得ます。幅の広い四角形は長い単語を示唆します。名前ではこれが可能性を絞り込むかもしれません。数字では書式が分かれば決定的になり得ます(墨消しされた9桁の数字はおそらくSSN)。幅に基づく推測を防ぐには、正確な文字列ではなく行全体や文全体を墨消しし、下にある内容の長さに関わらず同じ種類の墨消しには標準化された四角形幅を使ってください。

プライバシーとデータの取り扱い

アップロードするPDF、描く墨消しの四角形、出力される墨消し済みPDFはすべてあなたのデバイスにとどまります。pdf.jsが描画を処理し、あなたは透明なキャンバスのオーバーレイ上に墨消しを印付けし、pdf-libが墨消し操作を実行して出力ファイルを生成します。これらすべてがブラウザ内のJavaScriptで動きます。ファイル内容を運ぶネットワークリクエストはなく、アップロードは発生せず、あなたが何を墨消ししたかについてのテレメトリも収集されません。これは他のほぼどんなPDF操作よりも墨消しで重要です。墨消しの本来の目的は機密内容を守ることなので、文書をアップロードするツールは始める前から目的を打ち消してしまいます。

実用上の含意: ページが読み込まれた後はインターネットから切断して、墨消しワークフロー全体をオフラインで実行できます。多くの法的・医療的ワークフローは、特に弁護士秘匿特権、弁護士・依頼人間の秘密、HIPAA の対象となる文書を墨消しするときに、この種のエアギャップ処理を方針として要求します。墨消し済みファイルは通常のブラウザダウンロードとして現れ、あなたがダウンロードファイルを保存する場所以外には何も保存されません。元のPDFは別の管理された場所に保管し、墨消し済み出力を共有しても安全な唯一の版として扱ってください。

このツールを使うべきでないとき

PDFがパスワードで暗号化されているとき(先にロック解除)

PDFを開くのにパスワードが必要な場合、pdf.jsはそれを描画できず、ツールも墨消しのために読み込めません。まずPDF unlockツールでパスワードを外し(パスワードを知っている必要があります)、墨消しを行い、必要に応じて墨消し出力に改めてパスワード保護を適用してください。この順で機能するのは、墨消し出力が元とは独立して暗号化できる新しいPDFだからです。

パターンベースの検索と墨消しの場合(デスクトップのAcrobat Proを使う)

千ページの文書全体ですべての社会保障番号、すべてのメールアドレス、特定の名前のあらゆる出現箇所を墨消しする必要がある場合、手で四角形を描くのは現実的ではありません。Adobe Acrobat Proの「検索して墨消し」機能は、パターン(SSN、メール、電話番号の正規表現)を指定し、文書全体で一致するものに自動的に印を付けます。本ブラウザツールは手動の領域ベースの墨消しに焦点を当てています。パターンベースの大量墨消しには、デスクトップのAcrobatワークフローを使ってください。

書き出しではなく元の文書を墨消しするとき

文書がWord、Google Docs、その他の編集可能な形式に由来し、ソースからテキストを恒久的に削除したい場合は、PDFではなくソースアプリケーションでそれを行ってください。Wordで機密のテキストを削除し、新しいWordファイルを保存してからPDFに書き出します。これにより、墨消し済みPDFのどこかに墨消し前のソースが残るというチェーン・オブ・カストディの問題を避けられます。PDFが信頼できる原本(裁判所命令、既存の提出書類)である場合、またはソースへアクセスできない場合は、PDF墨消しが正しい選択です。

メタデータのみを墨消しするとき(メタデータ削除を使う)

PDFの可視コンテンツは問題なく、機密情報がメタデータ(著者名、元のファイル名、編集履歴)に含まれている場合、墨消しツールは必要ありません。メタデータ削除ツールで文書情報辞書とXMPメタデータを消去してください。本サイトのPDF metadataツールはメタデータを読み取ります。一部のPDFツールはメタデータをサニタイズまたはDocument Inspector機能で消去します。墨消しツールは可視コンテンツに焦点を当て、メタデータ削除ツールは不可視コンテンツに焦点を当てます。

他の質問

墨消しが本当に恒久的だと確認するにはどうすればよいですか?

墨消し済みPDFをテキストエディタ(バイナリファイルを扱えるエディタ)で開くか、テキスト抽出ツールをかけてください。任意のPDFビューアで墨消し領域からテキストを選択してコピーしてみてください。墨消しが正しく行われていれば、これら三つの方法のいずれも、墨消し領域については何も返しません。もう一つの確認: PDFをAdobe Acrobatで開き、Document Inspectorを実行する。残存している抽出可能コンテンツがリストアップされます。これらいずれの確認でも墨消しされたテキストが見えなければ、墨消しは本物です。

このツールはPDFのメタデータを掃除しますか?

pdf-libは墨消しを適用するときPDFを書き直し、既定では元のすべてのメタデータフィールドを保持しません。著者名、変更日、生成元の文字列は通常リセットされます。ただしこれは包括的なメタデータ削除ではありません。機密性の高いワークフローでは、共有前に墨消し出力を専用のメタデータ削除ステップ(またはPDF metadataツールを使って特定のフィールドを確認・消去)に通してください。

墨消しの四角形には何色を使うべきですか?

黒は法律と政府の標準で、墨消しとして一目でわかります。白は文書の背景も白で、墨消しを検閲マークではなく削除のように見せたいときに便利ですが、視覚的に紛らわしい(墨消し内容ではなく空白に見える)場合があります。プロの用途のほとんどには黒を使ってください。あいまいさがなく慣例的で、何かが意図的に削除されたことを受け手に伝えます。

墨消し済みのPDFは元より大きくなりますか、小さくなりますか?

通常はわずかに小さくなります。墨消しされた内容がページストリームから削除されるためです。墨消し領域の上に描かれる四角形はごく小さな追加データに過ぎません。pdf-libがコンテンツストリームを書き直す関係で、ファイルサイズがわずかに増えることもあります。数百ページまでの文書では変化は通常無視できます。ファイルサイズが制約になる場合、墨消し出力をPDF圧縮ステップに通してください。

墨消し出力は裁判所の電子提出システム(PACER、ECF)で受け入れられますか?

墨消し済みPDFは標準のPDFで、PACER、州裁判所の電子提出システム、連邦機関を含むPDFを受け付けるあらゆる電子提出システムで動作します。ほとんどの裁判所は墨消しが恒久的であることを要求しており(本ツールはそれを生成します)。あなたの管轄の具体的なローカルルールを確認してください。中には墨消しに「墨消しスタンプ」(どの種の免除が適用されたかを示す、法廷で認知された図像)を付けることを求めるものもあり、これは基本的な墨消しの上に重ねるワークフローです。本ツールが提供する基本的な「削除と置換」は、恒久性の技術的要件を満たします。

テキストに加えて画像も墨消しできますか?

はい。墨消しの四角形は領域ベースで、コンテンツタイプベースではありません。四角形の下のピクセルは、テキストから来たものか画像から来たものかに関わらず削除されます。写真の顔の上に墨消しボックスを描けば、そのページの該当領域の画像データが恒久的に消えます。スクリーンショット、写真、図表、署名、その他のグラフィックコンテンツに対しても動作します。全ページが画像のみのPDF(スキャン)でも、テキストベースのPDFと同じように墨消しが機能します。

関連ツール