So sánh PDF miễn phí trực tuyến

So sánh hai tệp PDF cạnh nhau với tính năng làm nổi bật sự khác biệt bằng hình ảnh. Kết quả tức thì, không tải lên bất kỳ máy chủ nào.

100% phía máy khách · tệp của bạn không bao giờ rời khỏi thiết bị
Tải lên PDF thứ nhất
Thả PDF vào đây hoặc nhấp để duyệt

Hỗ trợ PDF · lên đến 100 MB

Tải lên PDF thứ hai
Thả PDF vào đây hoặc nhấp để duyệt

Hỗ trợ PDF · lên đến 100 MB

Về so sánh PDF: Công cụ này hiển thị cả hai PDF trong trình duyệt và so sánh từng trang. Ở chế độ chồng lớp, bất kỳ sự khác biệt nào ở mức điểm ảnh đều được làm nổi bật bằng màu đỏ, giúp dễ dàng phát hiện thay đổi văn bản, sửa đổi bố cục, thay thế hình ảnh và các khác biệt trực quan khác. Việc so sánh được thực hiện cục bộ, tệp của bạn không bao giờ rời khỏi thiết bị.

Cách hoạt động

  1. Tải lên PDF thứ nhất bằng cách chọn hoặc kéo vào vùng thả bên trái.
  2. Tải lên PDF thứ hai vào vùng thả bên phải.
  3. Chọn chế độ xem: “Cạnh nhau” hiển thị cả hai PDF cùng lúc, “Chồng lớp” hiển thị khác biệt bằng màu đỏ.
  4. Điều hướng giữa các trang bằng nút Trước/Sau hoặc nhập trực tiếp số trang.
  5. Ở chế độ chồng lớp, vùng đỏ cho thấy sự khác biệt điểm ảnh giữa các trang cùng số trong cả hai tài liệu.

Tại sao nên so sánh PDF?

So sánh PDF rất cần thiết cho quản lý phiên bản, đảm bảo chất lượng và quản lý tài liệu. Sử dụng để theo dõi thay đổi giữa các bản sửa đổi tài liệu, xác minh chỉnh sửa đã được áp dụng đúng, phát hiện sửa đổi trái phép, so sánh các phiên bản hợp đồng hoặc tài liệu pháp lý, kiểm tra biểu mẫu đã gửi và đảm bảo tính nhất quán của tài liệu qua nhiều bản sao. Tính năng làm nổi bật khác biệt tự động giúp tiết kiệm thời gian và giảm sai sót so với kiểm tra thủ công.

Giải thích chế độ xem

Trường hợp sử dụng

Câu hỏi thường gặp

Chế độ chồng lớp làm nổi bật khác biệt như thế nào?

Chế độ chồng lớp so sánh từng điểm ảnh của các trang đã hiển thị. Bất kỳ điểm ảnh nào khác nhau giữa hai PDF đều được làm nổi bật bằng màu đỏ. Điều này phát hiện thay đổi văn bản, sửa đổi hình ảnh, điều chỉnh khoảng cách và mọi khác biệt trực quan khác.

Tôi có thể so sánh PDF có kích thước khác nhau không?

Có. PDF có kích thước trang khác nhau được hỗ trợ đầy đủ. Ở chế độ cạnh nhau, mỗi PDF hiển thị theo kích thước gốc. Ở chế độ chồng lớp, PDF thứ nhất quyết định kích thước khung vẽ.

Còn PDF quét hoặc dạng hình ảnh thì sao?

PDF quét (gồm ảnh raster) được hỗ trợ đầy đủ. Công cụ hoạt động bằng cách hiển thị cả hai PDF và so sánh kết quả trực quan, nên phát hiện được thay đổi trong tài liệu quét như bất kỳ PDF nào khác.

Tôi có thể so sánh PDF được mã hóa không?

Công cụ này hoạt động với PDF thông thường. Nếu PDF của bạn được bảo vệ bằng mật khẩu hoặc mã hóa, bạn cần gỡ bỏ bảo vệ trước bằng công cụ mở khóa PDF.

PDF có thể lớn bao nhiêu?

Mỗi PDF có thể lên đến 100 MB. Thời gian xử lý phụ thuộc vào kích thước tệp, số trang và cấu hình thiết bị. Tệp rất lớn có thể mất vài giây để tải và hiển thị.

Việc so sánh có chính xác 100% không?

Có, đối với khác biệt trực quan. Công cụ so sánh chính xác từng điểm ảnh, nên phát hiện được mọi thay đổi trực quan. Tuy nhiên, công cụ so sánh kết quả hiển thị chứ không phải cấu trúc PDF nội bộ, sự khác biệt nhỏ trong hiển thị do phông chữ hoặc thư viện PDF có thể xuất hiện dù nội dung thực tế giống nhau.

Công cụ so sánh PDF là gì?

Một công cụ so sánh PDF lấy hai tệp PDF và cho bạn thấy những gì đã thay đổi giữa chúng. Phần khó là xác định thay đổi có nghĩa là gì. Đối với các tài liệu trông giống nhau, bạn muốn một công cụ nói giống nhau, ngay cả khi các byte cơ bản khác nhau vì chúng được tạo ra bởi phần mềm khác nhau. Đối với các tài liệu chứa các chỉnh sửa thực sự, bạn muốn một công cụ làm nổi bật chính xác nơi văn bản, bố cục hoặc hình ảnh đã thay đổi. Các chiến lược so sánh khác nhau tạo ra các đánh đổi khác nhau giữa việc nắm bắt các thay đổi thực sự và bỏ qua nhiễu.

Công cụ này sử dụng so sánh trực quan: mỗi trang từ cả hai PDF được hiển thị thành lưới pixel, và hai lưới được xếp chồng lên nhau. Các pixel khớp được hiển thị làm nền; các pixel khác nhau được làm nổi bật bằng màu đỏ. Điều này nắm bắt mọi thay đổi trực quan, bao gồm dịch chuyển bố cục, thay thế phông chữ, chỉnh sửa hình ảnh và viết lại văn bản. Nó không nắm bắt được các thay đổi vô hình (siêu dữ liệu PDF, trường biểu mẫu ẩn, JavaScript nhúng), đó là một tính năng: những thứ đó hiếm khi quan trọng đối với việc đánh giá tài liệu thông thường.

Mọi thứ chạy trong trình duyệt của bạn bằng pdf.js (trình kết xuất PDF của Mozilla) và pdf-lib (thư viện thao tác PDF). Cả hai PDF được tải vào bộ nhớ, được hiển thị thành các phần tử canvas, và so sánh pixel chạy trong JavaScript trên máy của bạn. Không có tệp nào được tải lên máy chủ. Công cụ xử lý PDF lên đến 100 MB và hoạt động trên PDF kỹ thuật số tiêu chuẩn, PDF được quét và PDF từ bất kỳ nguồn nào miễn là chúng không được mã hóa bằng mật khẩu.

Bên trong công cụ có gì

Phần trên cùng có hai vùng thả cạnh nhau: thả PDF gốc ở bên trái, PDF đã sửa ở bên phải. Các nhãn làm rõ cái nào là cái nào, vì vậy bạn không vô tình hiểu văn bản được thêm là văn bản đã xóa. Cả hai tệp đều có thể được kéo từ trình quản lý tệp của bạn hoặc được chọn bằng bộ chọn tệp. Ngay khi cả hai tệp được tải, công cụ báo cáo số trang của mỗi tệp, đó là tín hiệu đầu tiên về việc các thay đổi thực sự đã xảy ra hay chưa.

Bên dưới các vùng thả, một công tắc chế độ xem chuyển đổi giữa Cạnh nhau (cả hai trang được hiển thị bên cạnh nhau) và Lớp phủ (cả hai trang được kết hợp với sự khác biệt được làm nổi bật bằng màu đỏ). Cạnh nhau là tốt nhất cho cái nhìn đầu tiên hoặc để chia sẻ ảnh chụp màn hình. Lớp phủ là nơi sự so sánh thực sự diễn ra: bất kỳ pixel nào khác nhau giữa hai kết xuất hiển thị bằng màu đỏ, vì vậy bạn có thể ngay lập tức phát hiện những gì đã thay đổi mà không cần đọc cả hai phiên bản.

Điều hướng trang cho phép bạn đi qua tài liệu từng trang một. Nếu hai PDF có số lượng trang khác nhau, điều hướng dừng ở trang dài hơn, và trang bị thiếu được hiển thị là trống. Các nút nhảy đến trang đầu tiên hoặc cuối cùng; đầu vào số trang cho phép bạn đi trực tiếp đến bất kỳ trang cụ thể nào. Đối với các tài liệu dài, điều hướng là nút thắt cổ chai chứ không phải kết xuất, vì vậy quy trình làm việc là: tải, nhảy đến một trang, so sánh, lặp lại.

Lịch sử và bối cảnh

Vấn đề diff trong khoa học máy tính (1976)

So sánh hai phiên bản của một tài liệu là một vấn đề cũ. Giải pháp thực tế đầu tiên là tiện ích diff được Douglas McIlroy viết tại Bell Labs vào năm 1976. Diff so sánh hai tệp văn bản và in ra các dòng khác nhau, sử dụng thuật toán dãy con chung dài nhất. Eugene Myers đã cải thiện thuật toán vào năm 1986 với bài báo O(ND) đã trở thành nền tảng cho gần như mọi công cụ diff hiện đại, bao gồm cả git. Diff văn bản là nền tảng, nhưng nó chỉ hoạt động trên văn bản, không phải trên các tài liệu đã kết xuất.

Diff trực quan và so sánh pixel (những năm 1990)

Những năm 1990 đã giới thiệu các công cụ diff trực quan so sánh đầu ra đã kết xuất thay vì văn bản nguồn. WinMerge (1998), BeyondCompare (Scooter Software, 1996) và Araxis Merge (1996) đã thêm so sánh hình ảnh bên cạnh văn bản. Diff pixel-by-pixel về mặt khái niệm đơn giản (so sánh từng vị trí pixel, làm nổi bật sự không khớp), nhưng nó tạo ra nhiễu khi so sánh các kết xuất trông giống hệt nhau với con người nhưng khác nhau bởi khử răng cưa hoặc gợi ý phông chữ. Các cải tiến như diff cảm nhận và độ tương đồng cấu trúc (Wang et al. 2004) cố gắng lọc ra các khác biệt không liên quan về mặt cảm nhận.

Acrobat thêm so sánh PDF (2015)

Adobe đã thêm tính năng Compare Files vào Acrobat Pro DC vào năm 2015. Không giống như diff trực quan thuần túy, so sánh của Acrobat nhận biết văn bản: nó xác định văn bản được chèn, bị xóa và bị thay thế và trình bày các thay đổi trong thanh bên, tương tự như chế độ xem theo dõi thay đổi của Word. Điều này hoạt động tốt trên PDF kỹ thuật số có lớp văn bản phù hợp nhưng suy giảm trên PDF được quét hoặc PDF với mã hóa phông chữ tùy chỉnh. Công cụ của Adobe chỉ chạy trên ứng dụng máy tính để bàn; nó không có sẵn trong trình duyệt.

DiffPDF và các công cụ diff PDF dòng lệnh (những năm 2010)

Các công cụ dòng lệnh mã nguồn mở như DiffPDF (2010) và diff-pdf (một trình bao bọc dựa trên Wine, 2012) đã mang so sánh PDF đến các quy trình làm việc được viết kịch bản. Các công cụ này so sánh hoặc bằng văn bản (trích xuất cả hai PDF và chạy diff văn bản) hoặc bằng hình ảnh (rasterize cả hai PDF và chạy diff hình ảnh). Chúng hữu ích trong các đường ống CI nơi bạn muốn gắn cờ các hồi quy PDF, nhưng chúng yêu cầu cài đặt cục bộ và khó khăn cho những người không phải nhà phát triển.

Kết xuất PDF dựa trên trình duyệt trưởng thành (2013)

Mozilla đã vận chuyển pdf.js đi kèm với Firefox 19 vào tháng 2 năm 2013, làm cho kết xuất PDF dựa trên JavaScript sẵn sàng cho sản xuất. Chrome đã tích hợp PDFium (C++, có nguồn gốc từ Foxit) vào năm 2013-2014 với hiệu ứng tương tự. Khi các trình duyệt có thể kết xuất PDF natively, việc xây dựng một công cụ so sánh PDF dựa trên trình duyệt trở nên khả thi: tải cả hai tệp trong JavaScript, kết xuất từng trang vào một canvas, so sánh các bộ đệm pixel canvas. Công cụ này đi theo dòng dõi đó.

Các giải pháp thay thế đám mây ưu tiên quyền riêng tư (từ 2020 trở đi)

Sự gia tăng làm việc từ xa thời COVID đã đẩy nhiều công cụ PDF trực tuyến. Hầu hết các dịch vụ so sánh PDF đám mây (Smallpdf, iLovePDF, PDF24) yêu cầu tải cả hai tệp lên một máy chủ để xử lý, điều này không thể chấp nhận được đối với các tài liệu bí mật như hợp đồng, hồ sơ y tế hoặc báo cáo tài chính. Các công cụ dựa trên trình duyệt chạy phía máy khách là một giải pháp thay thế bảo vệ quyền riêng tư: tệp không bao giờ rời khỏi thiết bị của bạn, nhưng bạn nhận được cùng trải nghiệm so sánh như các công cụ đám mây.

Quy trình thực tế

Đánh giá phiên bản hợp đồng

Một đối tác gửi hợp đồng có gạch đỏ tuyên bố chỉ có một điều khoản thay đổi. Tải PDF gốc và PDF đã sửa, chuyển sang chế độ lớp phủ, và đi qua các trang. Các điểm nổi bật màu đỏ hiển thị mọi sửa đổi thực tế, không chỉ những thứ mà đối tác đã chỉ ra. Điều này nắm bắt các thay đổi lén lút (sự dịch chuyển ngày, một con số bị điều chỉnh, một điều khoản được thêm vào âm thầm) mà các đường gạch đỏ chỉ văn bản có thể bỏ lỡ. Lưu ảnh chụp màn hình của bất kỳ vùng đỏ bất ngờ nào để theo dõi.

Phê duyệt tài liệu thiết kế và tiếp thị

Một nhà thiết kế gửi phiên bản 2 của một tờ gấp tuyên bố họ đã giải quyết phản hồi của bạn. Tải phiên bản 1 và phiên bản 2, lớp phủ từng trang, và xác minh các thay đổi. Diff pixel nắm bắt các điều chỉnh kiểu chữ, sự dịch chuyển màu sắc, hoán đổi hình ảnh và điều chỉnh bố cục mà dễ bỏ lỡ khi đọc hai phiên bản tuần tự. Đối với tài liệu nhiều trang, điều này nhanh hơn nhiều so với việc in cả hai và đặt chúng cạnh nhau.

Kiểm tra hồi quy tài liệu kỹ thuật

Khi bạn xuất bản tài liệu kỹ thuật dưới dạng PDF (sổ tay người dùng, tham chiếu API, SOP nội bộ), so sánh phiên bản mới với bản phát hành trước đó nắm bắt các diff không cố ý. So sánh pixel đủ nhạy để nắm bắt sự dịch chuyển ngắt trang hoặc một phần được đánh số lại mà diff văn bản có thể trình bày một cách khó hiểu. Đối với tài liệu có hàng trăm trang, quét qua chế độ cạnh nhau trước, sau đó lớp phủ bất kỳ trang nào trông khác.

So sánh năm này qua năm khác của các biểu mẫu thuế

Các biểu mẫu thuế (IRS 1040, UK SA100, Pháp 2042 v.v.) thay đổi mỗi năm. So sánh biểu mẫu năm nay với biểu mẫu năm ngoái xác định các mục dòng mới, các khoản khấu trừ đã loại bỏ và các phần được đánh số lại. Đối với kế toán và người chuẩn bị thuế, điều này nhanh hơn việc đọc ghi chú thay đổi biểu mẫu từ cơ quan thuế. Lớp phủ làm nổi bật mọi thay đổi được in ngay lập tức.

Theo dõi sửa đổi bài báo học thuật

Khi một bài báo trải qua đánh giá đồng nghiệp, so sánh bản nộp ban đầu với phiên bản đã sửa giúp xác minh các nhận xét của người đánh giá nào đã được giải quyết. Các PDF được tạo bằng LaTeX thường đủ sạch để diff trực quan nắm bắt mọi thay đổi văn bản. Nếu các hình hoặc phương trình được cập nhật, so sánh pixel làm nổi bật chúng rõ ràng. Tiết kiệm thời gian so với việc đọc đầy đủ cả hai phiên bản.

Theo dõi thay đổi quy định và chính sách

Các quy định của chính phủ, chính sách của công ty và các tài liệu tiêu chuẩn (ISO, IEEE, IETF) thường được xuất bản dưới dạng PDF. So sánh phiên bản mới với phiên bản trước đó là cách nhanh nhất để xác định các thay đổi đáng kể. Các nhóm tuân thủ sử dụng điều này để thông báo cho các bên liên quan về những gì đã thay đổi mà không cần đọc lại toàn bộ tài liệu. Chế độ cạnh nhau tốt cho bối cảnh; chế độ lớp phủ tốt để phát hiện mọi vi chỉnh sửa.

Các cạm bẫy phổ biến

Các trình tạo khác nhau tạo ra các kết xuất khác nhau

Một tài liệu được xuất từ Microsoft Word và cùng tài liệu được xuất từ Google Docs có thể kết xuất cùng văn bản với kerning, ngắt dòng hoặc thay thế phông chữ hơi khác nhau. Diff pixel đánh dấu những điều này là khác biệt, mặc dù nội dung tài liệu không thay đổi. Nếu bạn đang so sánh cùng một tài liệu nguồn được xuất từ hai công cụ khác nhau, mong đợi một mức nhiễu cơ bản. Sử dụng so sánh nhận biết văn bản của Adobe hoặc chạy diff văn bản sau khi trích xuất để lọc nhiễu.

Các PDF được quét ở các độ phân giải khác nhau trông khác nhau ở mọi nơi

Nếu một PDF là bản quét ở 300 DPI và cái kia là bản quét ở 600 DPI của cùng một tài liệu vật lý, các pixel được kết xuất sẽ không thẳng hàng. Mỗi trang sẽ xuất hiện như một biển đỏ. Khớp độ phân giải kết xuất bằng cách quét lại ở cùng DPI, hoặc chạy OCR trên cả hai và so sánh văn bản thay vì kết xuất trực quan. Diff trực quan chỉ hoạt động khi cả hai PDF kết xuất vào các lưới pixel tương tự.

Sự khác biệt về xoay trang

Nếu một trang trong một PDF được xoay 90 độ so với cùng trang trong PDF kia, so sánh pixel sẽ đánh dấu toàn bộ trang là khác. Kiểm tra siêu dữ liệu xoay trang của cả hai PDF trước khi so sánh. Các trình đọc PDF sẽ hiển thị cả hai trang thẳng đứng trên màn hình, che giấu sự xoay cơ bản. Sử dụng công cụ siêu dữ liệu PDF để xác minh sự xoay, và xoay một PDF để phù hợp nếu cần.

Khử răng cưa tạo ra sự khác biệt sub-pixel

Ngay cả khi so sánh các PDF giống hệt nhau được kết xuất hai lần, khử răng cưa của trình duyệt có thể tạo ra các khác biệt giá trị pixel nhỏ dọc theo các cạnh ký tự. Lớp phủ có thể hiển thị một quầng đỏ mờ xung quanh văn bản. Đây là nhiễu kết xuất, không phải là thay đổi thực sự. Nếu nhiễu áp đảo tín hiệu, hãy xem xét một ngưỡng so sánh cao hơn (coi các pixel trong vòng 5 phần trăm của nhau là khớp) hoặc rasterize ở độ phân giải cao hơn nơi mỗi ký tự chiếm nhiều pixel hơn.

Sự dịch chuyển bố cục tạo ra các điểm nổi bật đỏ liên hoàn

Nếu bạn thêm một đoạn văn duy nhất gần phía trên trang, phần còn lại của trang dịch xuống. Mọi dòng bên dưới đoạn văn được chèn bây giờ nằm ở một tọa độ y khác, và diff pixel làm nổi bật tất cả chúng là khác. Sự thay đổi thực tế là một đoạn văn nhưng diff có thể nhìn thấy là mọi thứ bên dưới nó. Đây là lý do chính tại sao diff nhận biết văn bản (hiểu các đoạn văn) thường cho kết quả tốt hơn diff pixel thuần túy cho các PDF nhiều nội dung.

Diff trực quan bỏ lỡ các thay đổi vô hình

PDF có thể có các thay đổi vô hình: chỉnh sửa siêu dữ liệu, JavaScript nhúng, trường biểu mẫu ẩn, hình mờ được đặt thành độ mờ không, tệp đính kèm. So sánh trực quan sẽ không nắm bắt được bất kỳ điều nào trong số đó vì chúng không kết xuất thành pixel. Để kiểm toán toàn diện, kết hợp diff trực quan với công cụ siêu dữ liệu PDF (hiển thị nhà sản xuất, ngày tạo, tiêu đề, các mục từ điển tùy chỉnh) và công cụ mở khóa PDF (tiết lộ các cờ mã hóa). Diff trực quan là cần thiết nhưng không đủ.

Quyền riêng tư và xử lý dữ liệu

Cả hai PDF mà bạn tải vào công cụ ở lại trên thiết bị của bạn suốt thời gian. pdf.js và pdf-lib là các thư viện JavaScript thực thi trong trình duyệt của bạn; chúng không thực hiện bất kỳ yêu cầu mạng nào với nội dung tệp. Các tệp được đọc vào bộ nhớ, được kết xuất thành các phần tử canvas, và so sánh pixel chạy trong JavaScript. Chúng tôi không bao giờ tải lên một trong hai tệp, không bao giờ ghi nội dung và không bao giờ phân tích những gì có trong chúng. Điều này quan trọng vì các tài liệu bạn muốn so sánh nhất (hợp đồng, báo cáo tài chính, thư từ pháp lý, hồ sơ y tế) là chính xác những thứ bạn không bao giờ nên gửi đến một dịch vụ bên thứ ba.

Sau khi trang được tải, công cụ hoạt động ngoại tuyến. Bạn có thể ngắt kết nối khỏi internet, thả cả hai PDF, chạy so sánh và xem xét lớp phủ mà dữ liệu của bạn không bao giờ chạm vào máy khác. Kết quả so sánh (lớp phủ được làm nổi bật bằng màu đỏ) là một hình ảnh được kết xuất trên trang; nếu bạn muốn giữ nó, hãy chụp ảnh màn hình. Không có gì được lưu phía máy chủ và không có gì được tải lên.

Khi không sử dụng công cụ này

So sánh văn bản thuần túy (sử dụng diff-checker thay thế)

Nếu các PDF của bạn chỉ là văn bản và bạn muốn một diff từng dòng với các chèn và xóa được nêu, hãy trích xuất văn bản trước (PDF-to-text) và chạy kết quả qua một công cụ diff văn bản. Diff văn bản xử lý dòng chảy đoạn văn, sự dịch chuyển bố cục và thay đổi phông chữ một cách tự nhiên, không có cái nào trong số đó diff pixel xử lý tốt. Công cụ diff-checker của Absolutool làm chính xác điều này cho văn bản. Diff pixel tốt nhất khi bố cục và các yếu tố trực quan quan trọng, không phải văn xuôi thuần túy.

So sánh các PDF lẽ ra phải giống nhau từng byte

Nếu bạn cần xác minh rằng hai PDF chính xác là cùng một tệp (khả năng tái tạo build, kiểm tra tính toàn vẹn của tệp, phát hiện gian lận), hãy sử dụng so sánh hash (SHA-256, MD5) thay vì diff trực quan. Kiểm tra hash nhanh hơn, xác định và miễn nhiễm với nhiễu kết xuất. Công cụ file-hash tính toán hash SHA-256 trong vài giây; nếu hash khớp nhau các tệp giống hệt nhau, nếu khác nhau các tệp không giống nhau bất kể cách chúng kết xuất.

Các PDF rất lớn vượt quá bộ nhớ trình duyệt

Tải hai PDF 100 MB cùng lúc, cộng với các canvas đã kết xuất cho mỗi trang, tiêu tốn nhiều bộ nhớ trình duyệt. Trên các laptop thông số thấp và hầu hết các thiết bị di động điều này có thể làm hỏng tab. Đối với các PDF rất lớn (bản vẽ kiến trúc, sổ tay hàng nghìn trang), hãy chia mỗi PDF trước với công cụ chia PDF và so sánh các phần phù hợp. Hoặc sử dụng một công cụ máy tính để bàn như Adobe Acrobat Pro DC cho so sánh nặng bộ nhớ.

So sánh các PDF ở các định dạng tệp khác nhau

Nếu một tài liệu là PDF và tài liệu kia là tệp Word hoặc trang HTML, công cụ này không thể so sánh chúng. Chuyển đổi cả hai sang PDF trước (hoặc cả hai sang văn bản) để bạn so sánh cùng loại với nhau. So sánh giữa các định dạng hầu như luôn tạo ra các diff trực quan khổng lồ vì các trình kết xuất hoàn toàn khác nhau. Chuyển đổi sang định dạng chung trước; sau đó so sánh.

Các câu hỏi khác

Tại sao lớp phủ hiển thị màu đỏ mặc dù các PDF trông giống hệt nhau?

So sánh pixel hoàn hảo nắm bắt các khác biệt kết xuất sub-pixel mà con người không thể nhìn thấy. Hai PDF có thể đã được tạo bởi các công cụ khác nhau (Word vs LaTeX vs InDesign) gợi ý phông chữ khác nhau hoặc khử răng cưa các cạnh khác nhau. Nội dung là giống nhau; các pixel thì không. Đối với những trường hợp này, ưu tiên diff dựa trên văn bản sau khi trích xuất văn bản từ cả hai PDF, hoặc chấp nhận rằng nhiễu là thật và chỉ nhìn vào các vùng đỏ lớn.

Tôi có thể so sánh các PDF được quét không?

Có, các PDF được quét hoạt động vì công cụ so sánh các pixel được kết xuất chứ không phải văn bản. Điểm bắt là cả hai bản quét phải ở cùng độ phân giải và hướng, nếu không so sánh sẽ là nhiễu vô dụng. Đối với các bản quét cùng một trang vật lý, công cụ này nắm bắt các khác biệt như chữ viết tay được thêm vào, dấu redaction hoặc tem. Đối với các bản quét của các trang khác nhau ở các DPI khác nhau, OCR cả hai trước và so sánh văn bản.

Công cụ có biết PDF nào cũ hơn không?

Không, công cụ xử lý cả hai PDF đối xứng. Nó cho bạn thấy chúng khác nhau ở đâu; nó không suy luận cái nào là bản gốc và cái nào là bản sửa đổi. Bạn quyết định đặt tệp nào ở phía nào. Các nhãn Trái và Phải hoàn toàn là vị trí. Nếu bạn cần ngữ cảnh thời gian (cái nào đến trước), hãy kiểm tra thời gian sửa đổi tệp trong trình quản lý tệp của bạn hoặc siêu dữ liệu PDF.

Tôi có thể xuất so sánh dưới dạng báo cáo không?

Không trực tiếp: so sánh được kết xuất trực tiếp trong trình duyệt. Để chụp nó, hãy chụp ảnh màn hình của các trang lớp phủ và dán vào tài liệu báo cáo. Để báo cáo tinh vi hơn (PDF của các khác biệt với chú thích), tính năng Compare Files của Adobe Acrobat Pro DC tạo ra một báo cáo có thể in được; công cụ trình duyệt này chỉ tập trung vào so sánh trực quan trực tiếp.

Điều gì xảy ra nếu hai PDF có số lượng trang khác nhau?

Điều hướng trang mở rộng đến số lượng trang tối đa của một trong các PDF. Khi bạn đến một trang chỉ một PDF có, phía bên kia hiển thị trống. Đây là hành vi đơn giản nhất và thường hữu ích nhất: nếu phiên bản 2 thêm hai trang ở cuối, bạn thấy các trang đó là nội dung được thêm vào. Nếu các trang được chèn vào giữa, mỗi trang tiếp theo sẽ xuất hiện khác vì chúng đã dịch chuyển; đó là tín hiệu rằng một sự chèn đã xảy ra.

Tại sao so sánh dựa trên pixel thay vì dựa trên văn bản?

So sánh pixel nắm bắt mọi thứ trực quan: chỉnh sửa văn bản, dịch chuyển bố cục, thay đổi hình ảnh, thay thế phông chữ, điều chỉnh màu sắc, redaction. So sánh dựa trên văn bản chỉ nắm bắt các thay đổi văn bản và mù với bố cục và hình ảnh. Đối với việc xem xét tài liệu (hợp đồng, báo cáo, tiếp thị) các thay đổi trực quan thường quan trọng không kém văn bản. So sánh pixel là mặc định an toàn hơn; để so sánh văn xuôi thuần túy, diff văn bản chính xác hơn.

Công cụ liên quan