Công cụ biên tập PDF miễn phí trực tuyến
Che vĩnh viễn văn bản và hình ảnh nhạy cảm. Bảo vệ thông tin bí mật ngay lập tức.
Hỗ trợ tệp PDF · tối đa 100 MB
Về biên tập PDF
Biên tập PDF là quá trình loại bỏ hoặc ẩn vĩnh viễn thông tin nhạy cảm khỏi tài liệu. Không giống như đánh dấu đơn giản hay che văn bản bằng hình dạng, biên tập đúng cách sẽ loại bỏ hoàn toàn dữ liệu cơ bản để không thể khôi phục. Công cụ này sử dụng các hình chữ nhật màu đặc để che nội dung vĩnh viễn, khiến việc trích xuất hay xem văn bản hoặc hình ảnh gốc bên dưới biên tập là không thể.
Khi nào nên biên tập tài liệu
- Tài liệu pháp lý: Loại bỏ thông tin khách hàng bí mật, số hồ sơ hoặc các chi tiết nhạy cảm.
- Hồ sơ y tế: Che tên bệnh nhân, số ID, chẩn đoán hoặc chi tiết điều trị.
- Tài liệu tài chính: Che số tài khoản ngân hàng, số an sinh xã hội hoặc số dư tài khoản.
- Tài liệu kinh doanh: Bảo vệ bí mật thương mại, thông tin nhân viên hoặc dữ liệu độc quyền.
- Tài liệu chính phủ: Tuân thủ luật công bố bằng cách loại bỏ thông tin mật hoặc nhạy cảm.
Thực hành tốt nhất cho biên tập
- Xem xét kỹ lưỡng: Sử dụng bản xem trước để đảm bảo bạn đã biên tập tất cả các khu vực nhạy cảm.
- Xác minh trước khi chia sẻ: Tải xuống và kiểm tra tệp PDF cuối để xác nhận biên tập đã hoàn tất.
- Sử dụng màu phù hợp: Biên tập màu đen là tiêu chuẩn cho tài liệu pháp lý; trắng cho nền sáng.
- Biên tập tất cả các trường hợp: Đừng quên thông tin xuất hiện trên nhiều trang.
- Lưu bản sao đã biên tập: Giữ tài liệu gốc chưa biên tập riêng biệt và an toàn.
Câu hỏi thường gặp
Biên tập có thực sự vĩnh viễn và không thể đảo ngược không?
Có. Công cụ này thay thế các khu vực đã biên tập bằng các hình chữ nhật màu đặc ở mức kết xuất PDF. Nội dung gốc được che vĩnh viễn và không thể khôi phục hay hiển thị lại. Không giống như lớp phủ hình ảnh đơn giản, biên tập PDF sửa đổi chính tài liệu.
Tôi có thể biên tập chỉ một phần của trang không?
Có. Bạn có thể vẽ nhiều ô biên tập trên cùng một trang để nhắm mục tiêu vào các khu vực cụ thể. Chỉ cần nhấp và kéo để tạo bao nhiêu biên tập hình chữ nhật tùy ý. Bạn có thể áp dụng các biên tập khác nhau cho các trang khác nhau.
Nếu tôi mắc lỗi khi biên tập thì sao?
Trước khi áp dụng biên tập, hãy nhấp “Xóa tất cả biên tập” để bắt đầu lại trên trang hiện tại. Khi bạn nhấp “Áp dụng biên tập”, các thay đổi là vĩnh viễn và không thể hoàn tác. Luôn xem kỹ bản xem trước trước khi hoàn tất.
Biên tập có ảnh hưởng đến kích thước tệp hoặc tính toàn vẹn của tài liệu không?
PDF đã biên tập vẫn hoạt động đầy đủ. Kích thước tệp có thể tăng nhẹ do các hình chữ nhật biên tập bổ sung. Tất cả nội dung khác, định dạng và cấu trúc tài liệu vẫn không thay đổi và nguyên vẹn.
Tôi có thể hoàn tác biên tập sau khi tải xuống không?
Không. Biên tập là vĩnh viễn khi đã được áp dụng cho PDF. Luôn giữ một bản sao lưu chưa biên tập của các tài liệu nhạy cảm trước khi biên tập. Khi tệp đã biên tập được tải xuống, nội dung gốc bên dưới biên tập không thể khôi phục.
PDF của tôi có an toàn và riêng tư không?
Có. Công cụ này xử lý PDF của bạn hoàn toàn trong trình duyệt của bạn. Tệp của bạn không bao giờ rời khỏi thiết bị hoặc được tải lên bất kỳ máy chủ nào. Biên tập diễn ra cục bộ trên máy tính của bạn, đảm bảo quyền riêng tư và bảo mật hoàn toàn cho tài liệu của bạn.
Tôi có thể biên tập nhiều PDF cùng lúc không?
Công cụ này xử lý một PDF mỗi lần. Để biên tập nhiều tài liệu, hãy xử lý từng tệp riêng lẻ bằng cách tải lên, biên tập, tải xuống rồi tải lên PDF tiếp theo.
Công cụ che PDF là gì?
Công cụ che PDF loại bỏ vĩnh viễn văn bản, hình ảnh hay vùng nhạy cảm khỏi một PDF, thay chúng bằng hình chữ nhật đặc màu để nội dung bên dưới không thể khôi phục. Từ khóa là vĩnh viễn: che không giống phủ lên. Một hình chữ nhật đen vẽ trên một cái tên bằng công cụ chú thích thì giấu tên khỏi tầm nhìn nhưng để văn bản gốc trong PDF, nơi bất kỳ ai có công cụ trích xuất văn bản đều có thể tìm thấy. Việc che thật sự xóa các byte khỏi tệp và thay vào đó là các hình mờ. Sự khác biệt này đã gây ra không ít vụ rò rỉ dữ liệu tình cờ trong hồ sơ tòa án, tài liệu chính phủ và báo cáo doanh nghiệp.
Công cụ này triển khai việc che thật sự. Bạn vẽ hộp lên các vùng cần loại bỏ (tên, số an sinh xã hội, chi tiết tài khoản, khuôn mặt trong ảnh, chữ ký) và công cụ xóa nội dung bên dưới khỏi mỗi trang, rồi vẽ một hình chữ nhật mờ với màu bạn chọn lên vùng đã xóa. PDF đầu ra không mang dấu vết gì của thứ đã bị loại bỏ: không có văn bản trích xuất được, không có trường biểu mẫu ẩn, không có dữ liệu hình ảnh nhúng tại các tọa độ đó. Nếu người nhận chạy tìm kiếm văn bản hoặc trích xuất văn bản trên PDF đã che, các vùng đã che không trả về gì.
Toàn bộ xử lý chạy trong trình duyệt của bạn dùng pdf-lib (thao tác PDF trong JavaScript) và pdf.js (dựng PDF). Tệp được nạp vào bộ nhớ, các thao tác che được thực thi cục bộ, và PDF đã che được tải trực tiếp về đĩa của bạn. Không có tệp nào được tải lên, không có xử lý trên đám mây tham gia, và không có dữ liệu đo từ xa nào được gửi đi. Điều này quan trọng vì các tài liệu bạn cần che nhất (hồ sơ pháp lý, hồ sơ y tế, sao kê tài chính, báo cáo bảo mật) chính là những tài liệu mà bạn không bao giờ nên tải lên một bên xử lý thứ ba vì bất kỳ lý do gì.
Bên trong công cụ có gì
Vùng thả ở phía trên tiếp nhận PDF cần che. Sau khi tải lên, trang đầu được dựng trong vùng xem trước và các nút điều hướng trang xuất hiện. Bạn duyệt tài liệu theo từng trang. Trên mỗi trang, nhấp và kéo để vẽ hình chữ nhật che lên vùng cần loại bỏ. Mỗi hình chữ nhật là một lượt che riêng; bạn có thể vẽ bao nhiêu tùy ý trên mỗi trang. Trang hiện tại hiển thị các hình đang vẽ bằng màu đỏ bán trong suốt để bạn thấy phần mình đã đánh dấu.
Bộ chọn màu kiểm soát màu sẽ lấp đầy vùng che trong đầu ra. Đen là mặc định và quen thuộc nhất (khớp tiêu chuẩn che pháp lý); trắng có ích khi trang đã có nền trắng và bạn muốn phần che trông như xóa bỏ thay vì dấu kiểm duyệt. Bạn có thể xóa hết lượt che trên trang hiện tại (Đặt lại trang) hoặc hủy lượt mới nhất (Xóa lượt cuối). Bộ đếm cho thấy bao nhiêu hộp đang xếp hàng trên toàn tài liệu, hữu ích để kiểm tra hợp lý trước khi xác nhận.
Áp dụng che là bước không thể hoàn tác. Khi bạn nhấp, pdf-lib duyệt mọi trang, xóa nội dung dưới mỗi hình chữ nhật khỏi luồng nội dung trang, và vẽ hình chữ nhật đặc màu vào chỗ đó. Kết quả là một PDF mới trong đó các vùng được che đã biến mất, không chỉ bị phủ lên. Trình duyệt sau đó cung cấp PDF đã che để tải xuống. Hãy giữ một bản PDF gốc ở nơi an toàn nếu sau này bạn cần tham khảo; công cụ không thể khôi phục nội dung gốc từ đầu ra đã che.
Lịch sử và bối cảnh
Che thông tin thời giấy với bút và máy photocopy
Trước thời tài liệu số, việc che thông tin nhạy cảm là vật lý: một nhân viên đánh dấu các đoạn nhạy cảm bằng bút dạ đen, rồi photocopy trang đã đánh dấu. Bản photocopy của trang đã đánh dấu trở thành phiên bản công bố. Bút dạ che lấp vật lý mực bên dưới, và bản photocopy chỉ giữ lại các khối đen. Quy trình chậm và tốn nhân lực nhưng an toàn: không có cách nào để người nhận khôi phục nội dung dưới lớp bút mà không có bản gốc. Các cơ quan chính phủ và hãng luật vận hành hẳn các phòng ban chuyên trách công việc che thông tin thủ công suốt thế kỷ hai mươi.
Thời số hóa sơ khai và mô thức thất bại của việc che
Khi tài liệu chuyển sang định dạng số trong thập niên 1990 và 2000, công cụ che thông tin tụt lại phía sau. Sai lầm phổ biến nhất là dùng bút đánh dấu hoặc công cụ vẽ hình để phủ hộp đen lên văn bản nhạy cảm, sau đó xuất sang PDF. Hộp đen ẩn văn bản về mặt thị giác nhưng để văn bản gốc nguyên vẹn trong lớp văn bản của PDF. Bất kỳ ai có Adobe Reader đều có thể sao chép văn bản từ dưới hộp đen, hoặc mở PDF trong trình soạn thảo văn bản và đọc trực tiếp. Mô thức này đã gây ra hàng chục vụ rò rỉ tầm cỡ trong hồ sơ pháp lý, báo cáo chính phủ và tài liệu doanh nghiệp từ khoảng năm 2000 đến 2015.
Những thất bại che thông tin nổi tiếng (2003-2014)
Một danh sách ngắn và chưa đầy đủ: năm 2003 Bộ Tư pháp Hoa Kỳ công bố hợp đồng tái thiết Iraq giữa Bechtel ở dạng đã che; phần che là lớp hình ảnh và văn bản phía dưới vẫn có thể sao chép. Năm 2010 một hồ sơ tòa án liên quan vụ Bradley Manning có văn bản che tương tự có thể trích xuất. Năm 2011 sổ tay hoạt động an ninh sân bay TSA được công bố với các phần che vẫn đọc được trong nguồn. Năm 2014 một hồ sơ tòa án của Paul Manafort có đoạn che không đúng cách mà các nhà báo đọc được chỉ trong vài phút. Mỗi sự cố làm bẽ mặt tổ chức phát hành và kích hoạt rà soát chính sách nội bộ. Những thất bại này đẩy ngành chính phủ và pháp luật chuyển sang dùng công cụ che chuyên dụng thay vì đánh dấu tạm bợ.
Adobe Acrobat thêm chức năng che đúng cách (2006)
Adobe bổ sung công cụ Redact chuyên biệt vào Acrobat Professional 8 năm 2006, rồi quảng bá mạnh sau các thất bại che thông tin đầu thập niên 2000. Công cụ trong Acrobat đánh dấu vùng cần che, sau đó bước Apply riêng biệt mới thật sự xóa nội dung khỏi luồng nội dung trang và vẽ các hình chữ nhật mờ. Thiết kế hai bước (đánh dấu, rồi áp dụng) là có chủ đích: bước đánh dấu là có thể hoàn tác, bước áp dụng thì không, và người dùng được cảnh báo trước thao tác không thể hoàn tác. Adobe cũng bổ sung tính năng Find and Redact tìm các mẫu như số an sinh xã hội hay địa chỉ email trên toàn bộ tài liệu.
PDF/A và tiêu chuẩn che (ISO 32000-2, 2017)
Tiêu chuẩn ISO 32000-2 công bố năm 2017 bổ sung kiểu chú thích Redact chính thức (mục 12.5.6.23) định nghĩa cách mã hóa dấu che và cách bước áp dụng phải sản sinh đầu ra che vĩnh viễn. Công cụ PDF tuân thủ có thể diễn giải chú thích Redact một cách nhất quán. Tiêu chuẩn cũng khuyến nghị làm sạch metadata, tập tin nhúng, trường biểu mẫu ẩn, JavaScript và các nội dung không hiển thị khác trong bước áp dụng. Quy định rõ ràng này đã giảm sự khác biệt giữa các triển khai của nhà cung cấp và khiến luồng công việc chéo công cụ trở nên đáng tin cậy hơn.
Che thông tin trong trình duyệt trưởng thành (từ 2020)
Khi pdf.js và pdf-lib trưởng thành, việc che thông tin trong trình duyệt trở nên khả thi. Dịch vụ che trên đám mây trước đó (Smallpdf, iLovePDF, PDF24) yêu cầu tải tài liệu nhạy cảm lên máy chủ bên thứ ba, điều này đánh mất mục đích đối với người dùng đang che hồ sơ y tế, tài liệu pháp lý hay dữ liệu tài chính. Công cụ trình duyệt phía máy khách chạy hoàn toàn bằng JavaScript đã giải quyết vấn đề riêng tư: tài liệu không bao giờ rời khỏi thiết bị, nhưng logic che vẫn hoạt động. Công cụ này đi theo hướng phát triển ấy, dùng thao tác luồng nội dung của pdf-lib để thực sự xóa các byte được che thay vì phủ chồng lên.
Luồng công việc thực tiễn
Cung cấp tài liệu trong discovery pháp lý
Trong tố tụng dân sự và hình sự, các bên cung cấp tài liệu cho luật sư đối phương theo quy định discovery. Một số tài liệu chứa giao tiếp thuộc đặc quyền, sản phẩm công việc, thông tin riêng tư của bên thứ ba hoặc bí mật kinh doanh phải được giữ lại dù tài liệu xung quanh có thể cung cấp. Việc che loại bỏ nội dung đặc quyền trong khi giữ phần còn lại. PDF đã che là bản được đóng dấu Bates và cung cấp. Làm điều này bằng công cụ che thật sự thay vì bút đánh dấu sẽ tránh được sự cố nổi tiếng khi cung cấp một tài liệu đã che mà luật sư đối phương có thể bỏ che trong năm giây.
Phản hồi FOIA và yêu cầu hồ sơ công
Các cơ quan chính phủ trả lời các yêu cầu Đạo luật Tự do Thông tin (Hoa Kỳ), Đạo luật Tiếp cận Thông tin (Canada), hay các luật tương đương trên toàn cầu phải công bố các hồ sơ được yêu cầu nhưng có thể che nội dung cụ thể theo các miễn trừ được liệt kê: an ninh quốc gia, quyền riêng tư cá nhân, phương pháp thực thi pháp luật, đặc quyền luật sư-khách hàng. Việc che phải vĩnh viễn vì tài liệu công bố sẽ tới tay người yêu cầu và thường tới tay nhà báo, những người tích cực tìm kiếm các thất bại che. Một công cụ che thật sự là thiết yếu ở đây.
Chia sẻ hồ sơ y tế tuân thủ HIPAA
Các nhà cung cấp dịch vụ y tế Hoa Kỳ phải che thông tin sức khỏe được bảo vệ (PHI) khỏi hồ sơ y tế trước khi chia sẻ cho nghiên cứu, kiểm toán thanh toán, điều tra yêu cầu bảo hiểm hay tố tụng pháp lý. PHI bao gồm tên, ngày tháng khác năm, định danh địa lý nhỏ hơn cấp bang, thông tin liên hệ, số an sinh xã hội, số tài khoản và một danh sách dài các định danh khác. Che tất cả những thứ này thủ công từ một hồ sơ y tế nhiều trang là chán nhưng là cách duy nhất để tuân thủ Privacy Rule. Công cụ che phía máy khách giữ hồ sơ trên thiết bị, điều đó tự nó giúp tuân thủ HIPAA.
Phản hồi yêu cầu truy cập của chủ thể dữ liệu GDPR
Các doanh nghiệp Liên minh châu Âu trả lời yêu cầu truy cập của chủ thể dữ liệu theo GDPR phải cung cấp cho người yêu cầu các dữ liệu cá nhân mà doanh nghiệp lưu giữ, đồng thời che dữ liệu cá nhân của bất kỳ người nào khác được nhắc đến trong cùng tài liệu. Nếu một chuỗi email công ty nhắc đến cả người yêu cầu và ba đồng nghiệp, tên đồng nghiệp, chi tiết liên hệ và thông tin cá nhân của họ phải được che khỏi phiên bản cung cấp cho người yêu cầu. Việc che phải vĩnh viễn để những người nhận sau không thể khôi phục dữ liệu của bên thứ ba.
Chia sẻ tài liệu yêu cầu bảo hiểm
Khi người được bảo hiểm chia sẻ hồ sơ yêu cầu bồi thường với bên thứ ba (giám định viên, môi giới, luật sư, cơ quan quản lý), họ thường cần che chi tiết y tế hay tài chính khỏi các tài liệu hỗ trợ. Sao kê ngân hàng bao gồm các giao dịch khác không liên quan đến yêu cầu. Hóa đơn y tế bao gồm các tình trạng và điều trị không liên quan đến yêu cầu. Che thông tin không liên quan bảo vệ quyền riêng tư của người được bảo hiểm trong khi vẫn cung cấp dữ liệu cần để đánh giá yêu cầu. PDF đã che có thể gửi email hoặc tải lên cổng thông tin liên quan.
Ẩn danh dữ liệu nghiên cứu
Các nhà nghiên cứu hàn lâm và doanh nghiệp làm việc với tài liệu chứa thông tin có thể nhận dạng cá nhân (biên bản tòa án, hồ sơ y tế, xuất khẩu mạng xã hội) thường cần ẩn danh dữ liệu nguồn trước khi chia sẻ với cộng tác viên hoặc xuất bản trong kết quả nghiên cứu. Che tên, vị trí và định danh từ mỗi tài liệu tạo ra phiên bản ẩn danh có thể trích dẫn trong bài báo và chia sẻ với đồng tác giả. Phê duyệt của hội đồng đạo đức (IRB ở Hoa Kỳ) thường yêu cầu kiểu che vĩnh viễn này là điều kiện phê duyệt nghiên cứu liên quan đến đối tượng con người.
Cạm bẫy thường gặp
Phủ lên không giống xóa đi
Thất bại che phổ biến nhất là vẽ hình chữ nhật đen lên văn bản nhạy cảm bằng công cụ vẽ hình hoặc bút đánh dấu, rồi xuất sang PDF. Hình chữ nhật là đối tượng riêng nằm trên trang. Văn bản phía dưới vẫn còn trong PDF, hoàn toàn có thể trích xuất bởi bất kỳ ai chọn nó bằng con trỏ, mở PDF trong trình soạn thảo văn bản, hoặc chạy công cụ trích xuất văn bản. Luôn dùng công cụ thực hiện việc che thật sự (xóa nội dung bên dưới và thay thế bằng hình chữ nhật), không chỉ phủ lên. Công cụ này thực hiện che thật sự; nhiều luồng tạm bợ thì không.
Metadata làm lộ câu chuyện của việc che
Metadata PDF (tác giả, tiêu đề, ngày sửa đổi, phần mềm sản xuất) có thể tiết lộ ai đã chỉnh sửa tài liệu và khi nào, ngay cả sau khi nội dung hiển thị đã được che. Metadata Microsoft Office của một tài liệu Word xuất sang PDF có thể bao gồm bình luận, theo dõi thay đổi và tên tác giả trước. Metadata PDF có thể bao gồm tên tệp gốc, bản thân nó có thể nhạy cảm. Hãy làm sạch metadata như một phần của luồng che: dùng công cụ PDF metadata hoặc công cụ che có xóa metadata trong bước áp dụng. Document Inspector trong Acrobat Pro làm việc này; nhiều công cụ nhanh thì không.
Trường biểu mẫu, JavaScript và tệp đính kèm vẫn còn
PDF có thể mang theo trường biểu mẫu tương tác, JavaScript nhúng, tệp đính kèm, âm thanh, video và nội dung 3D không hiển thị trên trang. Một hình chữ nhật che trên trang hiển thị không chạm vào những thứ này. Nếu một trường biểu mẫu chứa nội dung nhạy cảm (ví dụ trường tên ẩn tự động điền từ cơ sở dữ liệu), che trang hiển thị vẫn để dữ liệu biểu mẫu nguyên vẹn. Hãy bóc dữ liệu biểu mẫu, JavaScript và tệp đính kèm trong một bước riêng. Thư viện pdf-lib mà công cụ này dùng xóa trường biểu mẫu khi bạn áp dụng che thật sự, nhưng hãy luôn xác minh bằng cách mở đầu ra trong trình xem có hiển thị dữ liệu biểu mẫu.
So sánh bản che và chưa che làm lộ bí mật
Nếu cả phiên bản đã che và phiên bản chưa che trước đó của cùng một tài liệu bị rò rỉ, so sánh pixel-từng-pixel sẽ cho thấy chính xác cái gì đã được che. Đây là cách các nhà báo đôi khi tái dựng nội dung che từ hồ sơ tòa án: bằng cách tìm bản nháp trước đó. Đừng bao giờ phát hành nhiều phiên bản của cùng một tài liệu; một khi phiên bản đã che được công bố, phiên bản chưa che trở thành rủi ro bảo mật và phải được kiểm soát hoặc tiêu hủy. Đây là cạm bẫy vận hành hơn là lỗi công cụ, nhưng là vectơ phổ biến nhất khiến việc che thất bại.
OCR có thể khôi phục văn bản từ bản quét được che không đúng
Với PDF quét (trong đó văn bản là hình ảnh chứ không phải văn bản chọn được), vẽ hình chữ nhật lên hình ảnh quét nhìn chung an toàn vì không có lớp văn bản nào để trích xuất. Ngoại lệ là khi bản quét đã đi qua OCR và văn bản nhận diện được lưu cạnh hình ảnh dưới dạng lớp văn bản ẩn. Che hình ảnh hiển thị để lớp văn bản OCR nguyên vẹn, có thể khôi phục bằng công cụ trích xuất văn bản. Hãy che cả lớp OCR cùng với hình ảnh, hoặc loại bỏ lớp OCR trước khi tạo bản quét đã che.
Bề rộng phông tiết lộ thông tin với lượt che cấp ký tự
Với những lượt che rất ngắn (một từ duy nhất trong đoạn dài), chiều rộng hình chữ nhật có thể rò rỉ thông tin: hình chữ nhật rộng hơn gợi ý từ dài hơn. Với tên, điều này có thể thu hẹp khả năng. Với số, có thể kết luận chắc chắn nếu định dạng đã biết (số chín chữ số bị che nhiều khả năng là SSN). Để ngăn suy luận dựa trên chiều rộng, hãy che cả dòng hay cả câu thay vì dải ký tự chính xác, và dùng chiều rộng hình chữ nhật chuẩn hóa cho cùng loại lượt che bất kể độ dài nội dung bên dưới.
Quyền riêng tư và xử lý dữ liệu
PDF bạn tải lên, các hình chữ nhật che bạn vẽ, và PDF đã che ở đầu ra, tất cả đều ở lại trên thiết bị của bạn. pdf.js xử lý việc dựng hình, bạn đánh dấu các lượt che trên lớp canvas trong suốt phủ lên, và pdf-lib thực thi các thao tác che và sinh tệp đầu ra, tất cả bằng JavaScript bên trong trình duyệt của bạn. Không có yêu cầu mạng nào mang nội dung tệp đi, không có lần tải lên nào xảy ra, không có dữ liệu đo từ xa nào về những gì bạn đã che được thu thập. Điều này quan trọng với việc che hơn gần như mọi thao tác PDF khác: mục đích chính của việc che là bảo vệ nội dung nhạy cảm, nên bất kỳ công cụ nào tải tài liệu lên đều đánh mất mục đích trước cả khi bạn bắt đầu.
Hệ quả thực tiễn: bạn có thể ngắt kết nối Internet sau khi trang đã tải xong và chạy toàn bộ luồng che ngoại tuyến. Nhiều luồng pháp lý và y tế yêu cầu kiểu xử lý air-gapped này theo chính sách, đặc biệt khi che tài liệu thuộc đặc quyền pháp lý, bí mật giữa luật sư và khách hàng, hoặc HIPAA. Tệp đã che xuất hiện như một lần tải xuống bình thường của trình duyệt; không có gì được lưu ở đâu khác ngoài nơi bạn chọn lưu tệp đã tải. Hãy giữ PDF gốc ở vị trí riêng biệt và được kiểm soát, và coi đầu ra đã che là phiên bản duy nhất an toàn để chia sẻ.
Khi không nên dùng công cụ này
Khi PDF bị mã hóa bằng mật khẩu (mở khóa trước)
Nếu PDF cần mật khẩu để mở, pdf.js không thể dựng nó và công cụ không thể tải nó để che. Hãy bỏ mật khẩu trước bằng công cụ PDF unlock (bạn cần biết mật khẩu), rồi che, sau đó tùy chọn áp lại bảo vệ mật khẩu lên đầu ra đã che. Làm theo thứ tự này có hiệu quả vì đầu ra đã che là một PDF mới có thể mã hóa độc lập với bản gốc.
Cho tìm kiếm và che dựa trên mẫu (dùng Acrobat Pro trên máy tính)
Nếu bạn cần che mọi số an sinh xã hội, mọi địa chỉ email, hay mọi lần xuất hiện của một tên cụ thể trên tài liệu nghìn trang, vẽ hình chữ nhật thủ công là không thực tế. Tính năng Find and Redact của Adobe Acrobat Pro cho phép chỉ định mẫu (regex cho SSN, email, số điện thoại) và tự động đánh dấu mọi đoạn khớp trong toàn bộ tài liệu. Công cụ trình duyệt này tập trung vào việc che thủ công dựa trên vùng. Với việc che hàng loạt dựa trên mẫu ở quy mô lớn, hãy dùng luồng Acrobat trên máy tính để bàn.
Khi che tài liệu nguồn thay vì bản xuất
Nếu tài liệu có nguồn gốc từ Word, Google Docs hoặc định dạng có thể chỉnh sửa khác và bạn muốn xóa vĩnh viễn văn bản khỏi nguồn, hãy làm việc đó trong ứng dụng nguồn, không phải trên PDF. Xóa văn bản nhạy cảm trong Word, lưu tệp Word mới, rồi xuất sang PDF. Cách này tránh vấn đề chuỗi giám sát mà PDF đã che vẫn còn một bản nguồn chưa che ở đâu đó. Việc che PDF là bước đúng khi PDF là bản gốc có thẩm quyền (lệnh tòa, hồ sơ đã nộp) hoặc khi bạn không có quyền truy cập nguồn.
Khi chỉ cần che metadata (dùng công cụ bóc metadata)
Nếu nội dung hiển thị của PDF ổn nhưng metadata chứa thông tin nhạy cảm (tên tác giả, tên tệp gốc, lịch sử chỉnh sửa), bạn không cần công cụ che. Hãy dùng công cụ bóc metadata để xóa từ điển thông tin tài liệu và metadata XMP. Công cụ PDF metadata trên site này đọc metadata; một số công cụ PDF cung cấp chức năng Sanitise Metadata hoặc Document Inspector để xóa. Công cụ che tập trung vào nội dung hiển thị; công cụ bóc metadata tập trung vào nội dung không hiển thị.
Thêm câu hỏi
Làm sao xác minh rằng việc che thật sự vĩnh viễn?
Mở PDF đã che trong trình soạn thảo văn bản (bất kỳ trình nào xử lý được tệp nhị phân), hoặc chạy công cụ trích xuất văn bản trên đó. Thử chọn và sao chép văn bản từ các vùng đã che trong bất kỳ trình xem PDF nào. Nếu việc che hiệu quả, cả ba cách đều không trả về gì cho các vùng đã che. Một kiểm tra khác: mở PDF trong Adobe Acrobat và chạy Document Inspector; nó sẽ liệt kê mọi nội dung có thể trích xuất còn sót lại. Nếu không thấy văn bản đã che trong bất kỳ kiểm tra nào trong số đó, việc che là thật.
Công cụ này có làm sạch metadata PDF không?
pdf-lib viết lại PDF khi bạn áp dụng che, và mặc định không bảo toàn mọi trường metadata của bản gốc. Tên tác giả, ngày sửa đổi và chuỗi nhà sản xuất thường bị đặt lại. Tuy nhiên đây không phải bóc tách metadata toàn diện. Với luồng nhạy cảm, hãy đưa đầu ra đã che qua bước bóc metadata chuyên dụng (hoặc dùng công cụ PDF metadata để kiểm tra và xóa các trường cụ thể) trước khi chia sẻ.
Tôi nên dùng màu nào cho các hình chữ nhật che?
Đen là chuẩn pháp lý và chính phủ, ngay lập tức được nhận diện là vùng che. Trắng có ích khi nền tài liệu cũng trắng và bạn muốn vùng che trông như xóa bỏ thay vì dấu kiểm duyệt, nhưng có thể gây nhập nhằng thị giác (trông như khoảng trống thay vì nội dung bị che). Với hầu hết mục đích chuyên nghiệp, hãy dùng đen: rõ ràng, theo quy ước, và báo cho người nhận rằng đã có thứ gì đó bị cố ý loại bỏ.
PDF đã che sẽ lớn hơn hay nhỏ hơn bản gốc?
Thường nhỏ hơn một chút vì nội dung bị che được xóa khỏi luồng trang. Các hình chữ nhật vẽ lên vùng che là dữ liệu phụ tối thiểu. Đôi khi kích thước tệp tăng nhẹ do cách pdf-lib viết lại các luồng nội dung. Thay đổi thường không đáng kể với tài liệu vài trăm trang. Nếu kích thước tệp là ràng buộc, hãy đưa đầu ra đã che qua bước PDF compress.
Đầu ra đã che có chấp nhận được bởi hệ thống e-filing của tòa án (PACER, ECF) không?
PDF đã che là PDF chuẩn và hoạt động trong bất kỳ hệ thống e-filing nào chấp nhận PDF, gồm PACER, hệ thống e-filing của tòa án bang và các cơ quan liên bang. Hầu hết tòa án yêu cầu việc che phải vĩnh viễn (điều mà công cụ này tạo ra). Hãy kiểm tra quy định địa phương cụ thể cho phạm vi tài phán của bạn: một số yêu cầu các phần che được đánh dấu bằng con dấu che (đồ họa được tòa án nhận diện thể hiện loại miễn trừ nào được áp dụng), đây là một quy trình bổ sung trên việc che cơ bản. Việc xóa và thay thế cơ bản mà công cụ này cung cấp đáp ứng yêu cầu kỹ thuật về tính vĩnh viễn.
Tôi có thể che hình ảnh ngoài văn bản không?
Có. Hình chữ nhật che dựa trên vùng, không dựa trên loại nội dung: mọi pixel dưới hình chữ nhật đều bị loại bỏ, dù chúng đến từ văn bản hay hình ảnh. Vẽ một hộp che lên khuôn mặt trong ảnh sẽ loại bỏ vĩnh viễn dữ liệu hình ảnh ở vùng đó của trang. Cách này hoạt động cho ảnh chụp màn hình, ảnh chụp, sơ đồ, chữ ký và mọi nội dung đồ họa khác. Với PDF chỉ có hình ảnh toàn trang (bản quét), việc che hoạt động tương tự như với PDF dựa trên văn bản.