無料オンラインPDF比較
2つのPDFファイルを並べて表示し、差異を視覧的にハイライトします。結果は即座に表示され、サーバーへのアップロードは一切ありません。
PDF対応 · 最大100MB
PDF対応 · 最大100MB
使い方
- 左のドロップゾーンで最初のPDFを選択またはドラッグしてアップロードします。
- 右のドロップゾーンに2番目のPDFをアップロードします。
- 表示モードを選択します。「並べて表示」は両方のPDFを同時に表示し、「オーバーレイ」は差異を赤でハイライトします。
- 「前へ」「次へ」ボタンまたはページ番号を直接入力してページを移動します。
- オーバーレイモードでは、赤いハイライトが両方のドキュメントの同じページ番号間のピクセル差異を示します。
なぜPDFを比較するのか?
PDF比較は、バージョン管理、品質保証、文書管理に不可欠です。文書のリビジョン間の変更追跡、編集の正確な適用確認、不正な変更の特定、契約書や法的文書のバージョン比較、フォーム送信の検証、複数コピー間の整合性確保に利用できます。自動差異ハイライトにより、手動確認と比べて時間を節約し、エラーを削減できます。
表示モードの説明
- 並べて表示 · 両方のPDFを同じ画面上で同時に表示します。レイアウトの変更、追加、削除を見つけるのに最適です。両方のPDFは独立してナビゲートできます。
- オーバーレイ · 2番目のPDFを最初のPDFに重ね、すべてのピクセル差異を赤でハイライトします。詳細な変更検出に最適です。比較には両方のPDFのページ数が同じである必要があります。
使用例
- バージョン管理 · 文書のバージョン間の変更を追跡し、何が変更されたかを特定します。
- 法務・契約 · 契約書のバージョンを比較し、すべての修正が正しく適用されたことを確認します。
- コンプライアンス · フォームやレポートが承認済みのテンプレートまたは以前のバージョンと一致することを確認します。
- 品質保証 · 生成された文書が期待される出力と一致することを検証します。
- 不正検出 · PDFの不正な変更や改ざんを特定します。
よくある質問
オーバーレイモードでは差異がどのようにハイライトされますか?
オーバーレイモードでは、レンダリングされたページをピクセル単位で比較します。2つのPDF間で異なるピクセルは赤でハイライトされます。これにより、テキストの変更、画像の修正、間隔の調整、その他あらゆる視覚的な差異を検出できます。
異なるサイズのPDFを比較できますか?
はい。異なるページサイズのPDFに完全に対応しています。並べて表示モードでは、各PDFがネイティブサイズでレンダリングされます。オーバーレイモードでは、最初のPDFのサイズがキャンバスの基準となります。
スキャンされた画像ベースのPDFにも対応していますか?
スキャンされたPDF(ラスター画像で構成)に完全に対応しています。比較は両方のPDFをレンダリングして視覚的な出力を比較するため、他のPDFと同様にスキャン文書の変更を検出できます。
暗号化されたPDFを比較できますか?
このツールは標準的なPDFで動作します。パスワード保護または暗号化されたPDFの場合、比較する前にPDFロック解除ツールで保護を解除する必要があります。
PDFの最大サイズはどのくらいですか?
各PDFは最大100MBまで対応しています。処理時間はファイルサイズ、ページ数、お使いのデバイスの性能によって異なります。非常に大きなファイルの読み込みとレンダリングには数秒かかる場合があります。
比較は100%正確ですか?
はい、視覚的な差異については正確です。このツールはピクセル単位の正確な比較を行うため、あらゆる視覚的な変更を検出します。ただし、レンダリング出力を比較するため、フォントやPDFライブラリによるわずかなレンダリング差異が、実際のコンテンツが同一であっても差異として表示される場合があります。
PDF比較ツールとは何か?
PDF比較ツールは2つのPDFファイルを取り、それらの間で何が変更されたかを表示します。難しい部分は変更が何を意味するかを定義することです。同じに見えるドキュメントの場合、異なるソフトウェアによって生成されたために基となるバイトが異なっていても、同一と言うツールが欲しいです。実際の編集を含むドキュメントの場合、テキスト、レイアウト、または画像が変更された場所を正確に強調するツールが欲しいです。異なる比較戦略は、実際の変更を捕捉することとノイズを無視することの間で異なるトレードオフをします。
このツールは視覚的比較を使用します: 両方のPDFの各ページがピクセルグリッドにレンダリングされ、2つのグリッドが重ねられます。一致するピクセルは背景として表示されます。異なるピクセルは赤で強調されます。これはレイアウトのシフト、フォントの置換、画像の編集、テキストの書き換えを含むすべての視覚的変更を捕捉します。それは見えない変更(PDFメタデータ、隠しフォームフィールド、埋め込みJavaScript)を捕捉しません。これは機能です: それらは典型的なドキュメント レビューにとってめったに重要ではありません。
すべてはpdf.js(MozillaのPDFレンダラー)とpdf-lib(PDF操作ライブラリ)を使用してブラウザで実行されます。両方のPDFがメモリに読み込まれ、canvas要素にレンダリングされ、ピクセル比較がマシン上のJavaScriptで実行されます。ファイルはサーバーにアップロードされません。ツールは最大100 MBのPDFを処理し、パスワードで暗号化されていない限り、標準デジタルPDF、スキャンされたPDF、および任意のソースからのPDFで機能します。
ツールの中身
上部セクションには2つのドロップゾーンが横並びにあります: 左に元のPDF、右に修正されたPDFをドロップします。ラベルにより、どちらがどちらか明確になるので、追加されたテキストを削除されたテキストとして誤って解釈することはありません。両方のファイルは、ファイルマネージャーからドラッグするか、ファイルピッカーで選択できます。両方のファイルがロードされるとすぐに、ツールはそれぞれのページ数を報告します。これは実際の変更が起こったかどうかの最初の信号です。
ドロップゾーンの下に、ビューモードのトグルが並列表示(両ページが互いに隣にレンダリングされる)とオーバーレイ(両ページが結合され、違いが赤で強調される)を切り替えます。並列表示は最初の一覧やスクリーンショットの共有に最適です。オーバーレイは本当の比較が起こる場所です: 2つのレンダリング間で異なるピクセルは赤で表示されるので、両方のバージョンを読まずに何が変更されたかをすぐに見つけることができます。
ページナビゲーションでは、ドキュメントを1ページずつ進めることができます。2つのPDFのページ数が異なる場合、ナビゲーションは長い方で停止し、欠落しているページは空白として表示されます。ボタンは最初または最後のページにジャンプします。ページ番号入力により、特定のページに直接移動できます。長いドキュメントの場合、レンダリングではなくナビゲーションがボトルネックなので、ワークフローは: ロード、ページにジャンプ、比較、繰り返しです。
歴史と背景
コンピューターサイエンスにおけるdiff問題(1976)
ドキュメントの2つのバージョンを比較するのは古い問題です。最初の実用的な解決策は、1976年にBell LabsでDouglas McIlroyが書いたdiffユーティリティでした。Diffは2つのテキストファイルを比較し、最長共通部分列アルゴリズムを使用して異なる行を出力します。Eugene Myersは1986年にO(ND)論文でアルゴリズムを改善し、これはgitを含むほぼすべての最新diffツールの基礎となりました。テキストdiffは基礎ですが、テキストのみで機能し、レンダリングされたドキュメントでは機能しません。
視覚的diffとピクセル比較(1990年代)
1990年代は、ソーステキストではなくレンダリングされた出力を比較する視覚的diffツールを導入しました。WinMerge(1998)、BeyondCompare(Scooter Software、1996)、Araxis Merge(1996)はテキストと並んで画像比較を追加しました。ピクセル単位のdiffは概念的にシンプル(各ピクセル位置を比較し、不一致を強調)ですが、アンチエイリアシングまたはフォントヒンティングが異なるが人間には同じに見えるレンダリングを比較するとノイズを生成します。知覚的diffや構造的類似性(Wang et al. 2004)のような改良は、知覚的に無関係な違いをフィルタリングしようとします。
AcrobatがPDF比較を追加(2015)
Adobeは2015年にAcrobat Pro DCにCompare Files機能を追加しました。純粋な視覚的diffとは異なり、Acrobatの比較はテキスト認識型です: 挿入、削除、置換されたテキストを識別し、Wordの変更追跡ビューに似たサイドバーで変更を提示します。これは適切なテキスト レイヤーを持つデジタルPDFでよく機能しますが、スキャンされたPDFやカスタム フォント エンコーディングを持つPDFでは劣化します。Adobeのツールはデスクトップ アプリケーションでのみ実行されます。ブラウザでは利用できません。
DiffPDFおよびコマンドライン PDF diffツール(2010年代)
DiffPDF(2010)やdiff-pdf(Wineベースのラッパー、2012)などのオープンソースのコマンドラインツールは、スクリプト化されたワークフローにPDF比較をもたらしました。これらのツールは、テキスト(両方のPDFを抽出してテキストdiffを実行)または画像(両方のPDFをラスタライズして画像diffを実行)で比較します。PDF回帰にフラグを立てたいCIパイプラインで役立ちますが、ローカルのインストールが必要で、非開発者には扱いにくいです。
ブラウザベースのPDFレンダリングが成熟(2013)
Mozillaは2013年2月にFirefox 19にpdf.jsを同梱し、JavaScriptベースのPDFレンダリングを本番対応にしました。Chromeは同様の効果のために2013-2014年にPDFium(C++、Foxit派生)を統合しました。ブラウザがネイティブにPDFをレンダリングできるようになると、ブラウザベースのPDF比較ツールを構築することが実現可能になりました: 両方のファイルをJavaScriptに読み込み、各ページをcanvasにレンダリングし、canvasピクセル バッファーを比較します。このツールはその系統に従います。
プライバシー優先のクラウド代替(2020年以降)
COVID時代のリモートワークの急増は、多くのPDFツールをオンラインに押しやりました。ほとんどのクラウドPDF比較サービス(Smallpdf、iLovePDF、PDF24)は処理のために両方のファイルをサーバーにアップロードする必要があります。これは契約書、医療記録、財務諸表などの機密文書には受け入れられません。クライアント側で実行されるブラウザベースのツールは、プライバシーを保護する代替手段です: ファイルはデバイスを離れませんが、クラウドツールと同じ比較体験を得られます。
実用的なワークフロー
契約バージョンレビュー
相手方がレッドラインを引いた契約を送信し、変更されたのは1つの条項のみだと主張します。元のPDFと修正されたPDFを読み込み、オーバーレイモードに切り替え、ページを進めます。赤の強調は、相手方が指摘したものだけではなく、すべての実際の変更を示します。これはテキストのみのレッドラインが見逃すかもしれない、こっそり挿入された変更(日付のシフト、変更された数字、静かに追加された条項)を捕捉します。フォローアップのために、予期しない赤の領域のスクリーンショットを保存してください。
デザインおよびマーケティング資料の承認
デザイナーがバージョン2のパンフレットを送信し、フィードバックに対応したと主張します。バージョン1とバージョン2を読み込み、各ページを重ね、変更を確認します。ピクセルdiffは、2つのバージョンを順番に読むときに見落としやすい、タイポグラフィの微調整、色のシフト、画像の交換、レイアウトの調整を捕捉します。マルチページ資料の場合、これは両方を印刷して並べて置くよりもはるかに高速です。
技術ドキュメント回帰チェック
技術ドキュメントをPDF(ユーザーマニュアル、APIリファレンス、内部SOP)として公開する場合、新しいバージョンを以前のリリースと比較すると、意図しないdiffが捕捉されます。ピクセル比較は、テキストdiffが混乱させる方法で提示するかもしれないページ区切りシフトや番号付けし直されたセクションを捕捉するのに十分敏感です。数百ページのドキュメントの場合、最初に並列モードでスキャンし、その後異なるように見えるページをオーバーレイします。
税フォームの年次比較
税フォーム(IRS 1040、英国SA100、フランス2042など)は毎年変わります。今年のフォームを昨年のフォームと比較すると、新しい項目、削除された控除、番号付けし直されたセクションが識別されます。会計士と税務作成者にとって、これは税務当局からのフォーム変更ノートを読むよりも速いです。オーバーレイは印刷されたすべての変更をすぐに強調します。
学術論文の改訂追跡
論文がピアレビューを通過するとき、元の提出を改訂版と比較すると、どのレビュアーのコメントが対応されたかを確認するのに役立ちます。LaTeXで生成されたPDFは通常、視覚的diffがすべてのテキスト変更を捕捉するのに十分クリーンです。図や方程式が更新された場合、ピクセル比較はそれらを明確に強調します。両方のバージョンを完全に読むよりも時間を節約します。
規制とポリシーの変更追跡
政府規制、企業ポリシー、標準ドキュメント(ISO、IEEE、IETF)は通常PDFとして公開されます。新しいバージョンを以前のバージョンと比較するのは、実質的な変更を識別する最速の方法です。コンプライアンスチームは、ドキュメント全体を再読することなく、何が変更されたかについてステークホルダーに簡単に説明するためにこれを使用します。並列モードはコンテキストに適しています。オーバーレイモードは、すべてのマイクロ編集を見つけるのに適しています。
よくある落とし穴
異なるジェネレーターは異なるレンダリングを生成します
Microsoft Wordからエクスポートされたドキュメントと、Google Docsからエクスポートされた同じドキュメントは、わずかに異なるカーニング、行折り返し、またはフォント置換で同じテキストをレンダリングする可能性があります。ピクセルdiffはこれらを違いとしてフラグ立てします。ドキュメントの内容は変更されていなくても。同じソースドキュメントを2つの異なるツールからエクスポートして比較する場合は、ベースラインのノイズを期待してください。Adobeのテキスト認識型比較を使用するか、抽出後にテキストdiffを実行してノイズをフィルタリングします。
異なる解像度でスキャンされたPDFはどこでも異なって見えます
1つのPDFが300 DPIでのスキャンで、もう1つが同じ物理ドキュメントの600 DPIでのスキャンの場合、レンダリングされたピクセルは整列しません。すべてのページが赤の海として表示されます。同じDPIで再スキャンしてレンダリング解像度を一致させるか、両方でOCRを実行し、視覚的レンダリングの代わりにテキストを比較してください。視覚的diffは、両方のPDFが同様のピクセルグリッドにレンダリングされる場合にのみ機能します。
ページ回転の違い
1つのPDFのページが、もう1つのPDFの同じページに対して90度回転している場合、ピクセル比較はページ全体を異なるとしてフラグ立てします。比較する前に、両方のPDFのページ回転メタデータをチェックしてください。PDFリーダーは画面上で両方のページを直立して表示し、根本的な回転をマスクします。PDFメタデータツールを使用して回転を確認し、必要に応じて1つのPDFを回転させて一致させてください。
アンチエイリアシングはサブピクセルの違いを生成します
2回レンダリングされた同一のPDFを比較する場合でも、ブラウザのアンチエイリアシングはグリフのエッジに沿って小さなピクセル値の違いを生成する可能性があります。オーバーレイはテキストの周りに微かな赤の輪を示すかもしれません。これはレンダリングノイズであり、実際の変更ではありません。ノイズが信号を圧倒している場合、より高い比較しきい値(互いに5パーセント以内のピクセルを一致するものとして扱う)を検討するか、各グリフがより多くのピクセルを占有する高解像度でラスタライズしてください。
レイアウトシフトは赤の強調をカスケードします
ページの上部近くに1つの段落を追加すると、ページの残りが下にシフトします。挿入された段落の下のすべての行が異なるy座標に位置し、ピクセルdiffがすべて異なるものとして強調します。実際の変更は1つの段落でしたが、見える差分はその下のすべてです。これは、コンテンツが豊富なPDFの場合、テキスト認識型diff(段落を理解する)が純粋なピクセルdiffよりも良い結果を出すことが多い主な理由です。
視覚的diffは見えない変更を見逃します
PDFには見えない変更があります: メタデータの編集、埋め込みJavaScript、隠しフォームフィールド、不透明度ゼロに設定されたウォーターマーク、添付ファイル。視覚的比較はそれらを捕捉しません。なぜならピクセルにレンダリングされないからです。包括的な監査のために、視覚的diffをPDFメタデータツール(製作者、作成日、タイトル、カスタム辞書エントリを表示)とPDFロック解除ツール(暗号化フラグを明らかにする)と組み合わせます。視覚的diffは必要ですが、十分ではありません。
プライバシーとデータ処理
ツールに読み込む両方のPDFはずっとあなたのデバイスに留まります。pdf.jsとpdf-libはブラウザで実行されるJavaScriptライブラリです。ファイル内容でネットワークリクエストを行いません。ファイルはメモリに読み込まれ、canvas要素にレンダリングされ、ピクセル比較はJavaScriptで実行されます。どちらのファイルもアップロードせず、内容をログに記録せず、何が含まれているかを分析しません。これは重要です。なぜなら、最も比較したいドキュメント(契約書、財務レポート、法的通信、医療記録)は、まさにサードパーティサービスに送るべきでないものだからです。
ページがロードされると、ツールはオフラインで動作します。インターネットから切断し、両方のPDFをドロップし、比較を実行し、データが別のマシンに触れることなくオーバーレイをレビューできます。比較結果(赤で強調されたオーバーレイ)はページ上にレンダリングされた画像です。保存したい場合は、スクリーンショットを撮ってください。サーバー側に何も保存されず、何もアップロードされません。
このツールを使用しない場合
純粋なテキスト比較(代わりにdiff-checkerを使用)
PDFがテキストのみで、挿入と削除が指摘された行ごとのdiffが欲しい場合は、最初にテキストを抽出し(PDF-to-text)、結果をテキストdiffツールで実行します。テキストdiffは段落のリフロー、レイアウトシフト、フォント変更を自然に処理しますが、ピクセルdiffはそれらをうまく処理しません。Absolutoolのdiff-checkerツールはテキストに対してまさにこれを行います。ピクセルdiffは、レイアウトと視覚要素が重要な場合に最適で、純粋な散文では最適ではありません。
バイト同一であるべきPDFの比較
2つのPDFが完全に同じファイル(ビルドの再現性、ファイル整合性チェック、不正検出)であることを確認する必要がある場合は、視覚的diffではなくハッシュ比較(SHA-256、MD5)を使用してください。ハッシュ チェックは高速、決定的、レンダリングノイズに免疫です。file-hashツールは数秒でSHA-256ハッシュを計算します。ハッシュが一致すればファイルは同一、異なればレンダリング方法に関係なくファイルは同じではありません。
ブラウザメモリを超える非常に大きなPDF
2つの100 MB PDFを同時にロードし、各ページ用のレンダリングcanvasを加えると、多くのブラウザメモリを消費します。低スペックのラップトップやほとんどのモバイル デバイスでは、これによりタブがクラッシュする可能性があります。非常に大きなPDF(建築図面、数千ページのマニュアル)の場合、PDFスプリッターツールで各PDFを最初に分割し、対応するチャンクを比較します。または、メモリを多く消費する比較にはAdobe Acrobat Pro DCのようなデスクトップツールを使用してください。
異なるファイル形式のPDFの比較
1つのドキュメントがPDFで、もう1つがWordファイルまたはHTMLページの場合、このツールはそれらを比較できません。同じものを比較するために、両方を最初にPDF(または両方をテキスト)に変換してください。形式間の比較は、レンダラーが完全に異なるため、ほとんど常に膨大な視覚的diffを生成します。最初に共通の形式に変換してから、比較してください。
その他の質問
PDFが同一に見えるのに、なぜオーバーレイが赤を示すのですか?
ピクセル パーフェクトな比較は、人間が見ることができないサブピクセルのレンダリングの違いを捕捉します。2つのPDFは、フォントを異なってヒントしたり、エッジを異なってアンチエイリアスしたりする異なるツール(Word対LaTeX対InDesign)で生成された可能性があります。内容は同じですが、ピクセルはそうではありません。これらのケースでは、両方のPDFからテキストを抽出した後にテキストベースのdiffを優先するか、ノイズが実物であることを受け入れて、大きな赤の領域のみを見てください。
スキャンされたPDFを比較できますか?
はい、ツールはテキストではなくレンダリングされたピクセルを比較するので、スキャンされたPDFは機能します。問題は、両方のスキャンが同じ解像度と向きである必要があることです。さもなければ、比較は無意味なノイズになります。同じ物理ページのスキャンの場合、このツールは追加された手書き、編集マーク、またはスタンプなどの違いを捕捉します。異なるDPIで異なるページのスキャンの場合、最初に両方をOCRしてテキストを比較してください。
ツールはどちらのPDFが古いかを知っていますか?
いいえ、ツールは両方のPDFを対称的に扱います。それらが異なる場所を示します。どちらが元でどちらが改訂版かを推測しません。どちらの側にどのファイルを置くかをあなたが決めます。LeftとRightのラベルは純粋に位置的です。時間的なコンテキスト(どちらが先に来たか)が必要な場合は、ファイルマネージャーまたはPDFメタデータでファイルの変更時間を確認してください。
比較をレポートとしてエクスポートできますか?
直接ではありません: 比較はブラウザでライブにレンダリングされます。それを捕捉するために、オーバーレイページのスクリーンショットを撮り、レポートドキュメントに貼り付けます。より洗練されたレポート(注釈付きの違いのPDF)の場合、Adobe Acrobat Pro DCのCompare Files機能は印刷可能なレポートを生成します。このブラウザツールはライブの視覚的比較のみに焦点を当てています。
2つのPDFが異なるページ数の場合はどうなりますか?
ページナビゲーションは、いずれかのPDFの最大ページ数まで延長されます。1つのPDFのみが持つページに到達すると、もう一方の側は空白で表示されます。これは最も単純な動作であり、通常最も役立ちます: バージョン2が最後に2ページを追加した場合、それらのページを追加コンテンツとして表示します。ページが中間に挿入された場合、後続のすべてのページがシフトしているため、異なるように表示されます。それが挿入が発生したという信号です。
なぜテキストベースではなくピクセルベースの比較ですか?
ピクセル比較は、テキストの編集、レイアウトシフト、画像の変更、フォントの置換、色の微調整、編集など、すべての視覚的な事項を捕捉します。テキストベースの比較はテキストの変更のみを捕捉し、レイアウトと画像には盲目です。ドキュメント レビュー(契約書、レポート、マーケティング)の場合、視覚的変更はテキストと同じくらい重要なことがよくあります。ピクセル比較はより安全なデフォルトです。純粋な散文比較の場合、テキストdiffはより正確です。