Ghép PDF Trực Tuyến Miễn Phí
Kết hợp nhiều tệp PDF thành một. Sắp xếp lại trang, xóa tệp và ghép ngay lập tức. Tệp của bạn không bao giờ rời khỏi thiết bị.
Hỗ trợ PDF · tối đa 50 MB mỗi tệp
Cách Hoạt Động
- Tải lên PDF: Thả hoặc chọn nhiều tệp PDF để ghép.
- Sắp xếp: Dùng nút lên/xuống để sắp xếp lại trang. Xóa các tệp không cần thiết.
- Ghép: Nhấp "Ghép PDF" để kết hợp tất cả các tệp thành một. Quá trình xử lý diễn ra ngay lập tức trong trình duyệt của bạn.
Tại Sao Nên Ghép PDF?
Ghép PDF rất cần thiết để sắp xếp tài liệu, tạo báo cáo từ nhiều nguồn, chuẩn bị hồ sơ nộp hoặc giảm lộn xộn tệp. Thay vì gửi nhiều tệp đính kèm hay tạo cấu trúc tệp phức tạp, hãy kết hợp tất cả vào một tệp PDF dễ chia sẻ. Lý tưởng cho hợp đồng, bài thuyết trình, hóa đơn và tài liệu.
Tính Năng
- Không giới hạn số tệp: Ghép bao nhiêu PDF tùy bạn cần.
- Sắp xếp lại trang: Sắp xếp tệp theo thứ tự bất kỳ trước khi ghép.
- Quyền riêng tư: Tất cả xử lý diễn ra cục bộ trong trình duyệt của bạn. Tệp không bao giờ được tải lên bất kỳ máy chủ nào.
- Nhanh: Ghép tức thì, không chờ đợi hay xếp hàng.
Câu Hỏi Thường Gặp
Tôi có thể sắp xếp lại tệp sau khi tải lên không?
Có. Mỗi tệp hiển thị nút lên/xuống để điều chỉnh thứ tự. Các tệp được ghép theo thứ tự xuất hiện trong danh sách.
Giới hạn kích thước tệp là bao nhiêu?
Mỗi PDF có thể lên đến 50 MB. Tổng kích thước tệp sau khi ghép phụ thuộc vào bộ nhớ khả dụng của trình duyệt, nhưng thông thường bạn có thể ghép các tệp tổng cộng vài trăm MB.
PDF của tôi có bị tải lên máy chủ không?
Không. Toàn bộ việc ghép diễn ra cục bộ trong trình duyệt của bạn bằng pdf-lib. PDF của bạn không bao giờ rời khỏi thiết bị, đảm bảo quyền riêng tư và bảo mật tuyệt đối.
Tôi có thể ghép PDF trên điện thoại di động không?
Có. Công cụ này hoạt động trên trình duyệt máy tính, máy tính bảng và điện thoại di động. Chỉ cần chạm để chọn tệp và ghép.
Nếu PDF bị hỏng thì sao?
Công cụ sẽ hiển thị lỗi đối với các tệp bị hỏng. Hãy thử xuất lại PDF từ nguồn gốc, hoặc dùng một công cụ sửa chữa PDF trực tuyến trước.
Lược sử PDF và thao tác gộp
Adobe công bố Portable Document Format vào năm 1993, định vị nó như phần mở rộng kỹ thuật số của giấy: một cách gửi một trang đã dàn trang từ máy tính này sang máy tính khác mà bên nhận không cần cài cùng phông chữ, cùng hệ điều hành hay cùng ứng dụng tạo ra nó. Phiên bản đầu tiên ra mắt ngày 15 tháng 6 cùng Acrobat 1.0, với giá 695 đô la Mỹ cho trình đọc và 2.500 đô la cho trình distiller. Việc tiếp nhận chậm chạp cho tới khi Adobe biến trình đọc thành miễn phí năm 1994 và Cơ quan Thuế Hoa Kỳ (IRS) chuẩn hoá PDF cho biểu mẫu thuế có thể điền vào cuối thập niên 1990, kéo định dạng này vào các quy trình hành chính trên khắp thế giới.
Đến năm 2008, đặc tả đã đủ ổn định để Adobe trao nó cho Tổ chức Tiêu chuẩn hoá Quốc tế, và ISO công bố nó dưới mã ISO 32000-1 vào tháng 7 năm đó. Bản hiện hành là ISO 32000-2:2020, và mọi công cụ PDF nghiêm túc ngày nay đều ngầm tuân theo tiêu chuẩn này. Suốt toàn bộ lịch sử này, gộp là một trong những phép biến đổi PDF được dùng nhiều nhất, chỉ đứng sau «xem» và «in» về tổng số người dùng. Khảo sát ngành AIIM năm 2021 ước tính rằng một lao động tri thức trung bình gộp từ hai đến năm PDF mỗi tuần, với phép gộp trung vị kết hợp ba đến bảy tệp nguồn.
Gộp còn cũ hơn cả PDF. Tệp PostScript đã được nối với nhau bằng pipe shell từ năm 1989, đôi khi đúng nghĩa là nối tệp này vào sau tệp kia rồi đánh số lại các dấu trang bằng tay. PDF khiến thao tác này đồng thời dễ hơn (vì định dạng tệp có truy cập ngẫu nhiên qua bảng tham chiếu chéo) và khó hơn (vì nội dung trang không nằm trong một luồng tuyến tính duy nhất). Mọi công cụ gộp PDF hiện đại, từ Acrobat trên máy đến công cụ trình duyệt này, đều đang giải cùng một bài toán nền: nhận nhiều cây trang và tạo ra một cây trang gộp trỏ tới các đối tượng nội dung gốc mà không làm gãy bất kỳ tham chiếu gián tiếp nào nối trang với phông chữ, hình ảnh và tài nguyên của nó.
«Gộp» thực sự làm gì bên trong tệp
Một PDF không phải một tài liệu đơn lẻ; nó là một cái cây. Gốc là catalog, trỏ tới một cây trang (pages tree) mà lá là các đối tượng-trang riêng lẻ. Mỗi đối tượng-trang giữ tham chiếu, chứ không phải bản thân tài nguyên: các phông chữ mà trang dùng sống dưới dạng đối tượng gián tiếp riêng trong thân tệp, hình ảnh, XObject biểu mẫu, từ điển trạng thái đồ hoạ và pattern cũng vậy. Từ điển tài nguyên của trang ánh xạ các tên ngắn (/F1, /Im2, /GS0) sang những số đối tượng gián tiếp ấy. Chính sự gián tiếp này là lý do gộp khả thi mà không cần sửa nội dung gốc của trang: bạn có thể dựng một đối tượng pages gốc mới, trỏ tới các lá lấy từ nhiều tài liệu nguồn.
Một phép gộp đúng không phải nối nhị phân. Thư viện đọc bảng tham chiếu chéo của từng tệp nguồn, phân tích mọi đối tượng gián tiếp vào bộ nhớ, rồi với mỗi trang được yêu cầu, đi qua đồ thị tài nguyên để sao chép mọi đối tượng được tham chiếu bắc cầu sang đầu ra. Các đối tượng sao chép nhận số đối tượng mới trong không gian đánh số của đích, và mọi tham chiếu bên trong chúng được viết lại tương ứng. Cuối cùng một cây trang mới được dựng, mà con của nó trỏ tới các lá trang đã sao theo thứ tự bạn yêu cầu, và một bảng tham chiếu chéo mới được phát ra. Không có nội dung nguồn nào bị giải nén, mã hoá lại hay raster hoá. Văn bản, hình ảnh và đồ hoạ vector trên trang nguồn được ghi nguyên xi vào đầu ra, đó là lý do gộp là vô tổn thất và kích thước tệp gộp về cơ bản bằng tổng các đầu vào.
Những quy trình thực tế thúc đẩy việc gộp
- Hợp đồng và hồ sơ pháp lý. Một hợp đồng đã ký hiếm khi là một tài liệu duy nhất. Thoả thuận khung, phụ lục, trang chữ ký và tài liệu bổ sung đều cần đi cùng nhau. Hệ thống nộp hồ sơ điện tử của toà án, trong đó có CM/ECF của các toà án liên bang Hoa Kỳ, yêu cầu rõ ràng nộp hồ sơ ở dạng PDF gộp đối với các đơn yêu cầu kèm chứng cứ.
- Báo cáo chi phí và hoàn ứng. Concur, Expensify và phần lớn hệ thống hoàn ứng của doanh nghiệp chỉ nhận một tệp PDF cho mỗi yêu cầu. Nhân viên quét hoặc tải về biên lai, gộp chúng lại rồi tải lên. Gộp là thứ keo dính thường ngày của mỗi chu kỳ chi phí hằng tháng.
- Giấy tiêu đề và trang bìa. Nhiếp ảnh gia, tư vấn viên và nhà thiết kế giữ một PDF tiêu đề một trang để chèn vào đầu mỗi đợt giao việc. Đó là cách rẻ nhất để áp một nhận diện thương hiệu nhất quán mà không phải raster hoá lại tác phẩm.
- Tài liệu khoá học và đề thi. Các trường đại học phát hành PDF gộp các tài liệu đọc hằng tuần. Hội đồng thi gộp tập câu hỏi với đáp án. Sinh viên lắp ráp danh mục bài tập. Đây là tình huống gộp có khối lượng lớn nhất tính theo con số tuyệt đối, với đỉnh tải học thuật rơi vào những tuần hạn nộp cuối học kỳ.
- Hồ sơ hành chính và nhập cư. USCIS, Home Office của Anh và phần lớn cơ quan nhập cư châu Âu yêu cầu hồ sơ bằng chứng dưới dạng một PDF duy nhất. Một bộ hồ sơ nhập tịch điển hình có thể ghép 20 đến 80 tài liệu quét riêng lẻ, mỗi tài liệu ở một định dạng nguồn khác nhau, thành một PDF nộp đi.
- Hồ sơ ảnh và portfolio. Phòng tranh, công ty đại diện và trường mỹ thuật thường yêu cầu một PDF gộp duy nhất, thường có giới hạn dung lượng tối đa. Sau bước gộp thường có bước nén để vừa với hạn mức.
Những cạm bẫy thường gặp và cách lách qua
- Các trường biểu mẫu bị chết. Từ điển biểu mẫu tương tác sống ở cấp tài liệu chứ không ở từng trang. Việc gộp sao chép các thành phần thị giác của widget biểu mẫu (hình chữ nhật, nhãn, dòng diện mạo) nhưng không mang theo các định nghĩa trường khiến chúng có thể tương tác. Biểu mẫu gộp trông đúng nhưng không nhận nhập liệu. Cách khắc phục: làm phẳng từng biểu mẫu trước bằng công cụ Làm phẳng PDF trực tuyến miễn phí, công cụ này biến widget thành nội dung trang thông thường, rồi mới gộp.
- Bookmark biến mất. Cây outline (mục lục bạn thấy ở thanh bên của Acrobat) là một cấu trúc cấp tài liệu. Không có thuật toán chung nào ghép các outline từ nhiều tài liệu nguồn thành một outline mạch lạc, vì vậy đa phần công cụ gộp chỉ chạy trên trình duyệt, kể cả cái này, đều bỏ chúng đi. Nếu bookmark quan trọng, hãy gộp trước rồi dựng lại outline bằng tay trong trình biên tập máy bàn.
- PDF đã mã hoá không nạp được. PDF có mật khẩu mở không thể phân tích cho tới khi mật khẩu được cung cấp. Công cụ này không hỗ trợ đầu vào đã mã hoá. Quy trình: dùng công cụ Mở khóa PDF miễn phí trực tuyến để gỡ bảo vệ trước, rồi gộp các bản đã mở khoá.
- Chữ ký bị vỡ. Chữ ký số trên một PDF là một mã băm mật mã của một dải byte chính xác trong tệp. Bất kỳ thay đổi nào với tệp, kể cả gộp với tệp khác, đều làm chữ ký mất hiệu lực. Kết quả gộp vẫn là một PDF hợp lệ, nhưng chỉ báo «Chữ ký hợp lệ» chuyển thành «Chữ ký không hợp lệ». Về mặt mật mã, đây là hành vi đúng, nhưng hiếm khi là điều bạn muốn. Cách khắc phục: giữ các PDF đã ký dưới dạng tệp riêng; bản đã ký cần được giữ nguyên.
- Tập con phông chữ bị trùng lặp. Khi cùng một phông chữ xuất hiện trong hai tài liệu nguồn, nó thường được nhúng dưới dạng hai tập con hơi khác nhau. Công cụ gộp không có cách tổng quát nào nhận biết chúng là tương đương, nên đầu ra mang theo cả hai bản. Vì thế tệp gộp lớn hơn một chút so với phép cộng đơn giản của các đầu vào. Cho đầu ra gộp đi qua công cụ Nén PDF trực tuyến miễn phí sẽ thu hồi được phần lớn lượng dư thừa đó.
Gộp trên trình duyệt so với gộp trên đám mây
Khác biệt chức năng lớn nhất giữa công cụ này và các công cụ gộp PDF trên đám mây đang thống trị kết quả tìm kiếm Google nằm ở chỗ phân tích diễn ra ở đâu. Smallpdf, ILovePDF, ứng dụng web của PDF24, gói miễn phí của Sejda và các công cụ trực tuyến của Adobe đều tải tệp nguồn của bạn lên máy chủ của họ, thực hiện gộp ở đó, rồi trả tệp gộp về dưới dạng tải xuống. Chính sách quyền riêng tư của họ tuyên bố rằng các tệp đã tải lên bị xoá trong vòng vài giờ. Dù vậy các tệp ấy vẫn đi qua mạng của nhà vận hành, tồn tại trên đĩa của họ trong cửa sổ xử lý, và đi qua bất kỳ nhật ký nào mà nhà vận hành duy trì để phát hiện lạm dụng.
Công cụ này không làm thế. Các tệp PDF của bạn được đọc vào tab trình duyệt qua File API tiêu chuẩn, được phân tích cũng trong tab đó bằng thư viện pdf-lib, rồi ghi trở lại đĩa của bạn qua API tải xuống tiêu chuẩn. Lưu lượng mạng duy nhất trong khi gộp là một lần tải pdf-lib từ CDN khi trang lần đầu mở. Bạn có thể kiểm chứng: mở công cụ dành cho nhà phát triển của trình duyệt ở tab Network, chạy một phép gộp, và quan sát rằng không có yêu cầu nào mang theo nội dung tệp được phát đi. Bất cứ thứ gì bí mật (HIPAA, GDPR, bí mật giữa luật sư và khách hàng, nghĩa vụ bảo mật) đều nên được gộp trong trình duyệt. Bất cứ thứ gì vượt vài trăm megabyte, cần OCR sau đó, hoặc cần kiểm soát truy cập theo vai, đều nên giao cho một công cụ phía máy chủ mà bạn đã chủ động chọn.
Một ghi chú về khả năng tiếp cận
Khả năng tiếp cận của PDF được quy định bởi ISO 14289 (PDF/UA-1) và bởi «PDF Techniques for WCAG 2.0» của W3C. Một PDF được gắn thẻ đúng cách chứa cây cấu trúc ánh xạ thứ tự đọc logic, tiêu đề, danh sách, ô bảng và văn bản thay thế của hình. Các trình đọc màn hình như JAWS, NVDA và VoiceOver dùng cây này để trình bày tài liệu theo thứ tự hợp lý thay vì thứ tự thị giác, vốn thường chạy theo cột hoặc với thanh bên. Cây cấu trúc là đối tượng cấp tài liệu, nên việc gộp hai PDF có thẻ trong công cụ này tạo ra đầu ra không có thẻ. Với hồ sơ cá nhân và bộ phiếu hoàn ứng, điều này không sao. Với tài liệu hướng tới người đọc khiếm thị dùng công khai, bạn sẽ muốn sửa chữa đầu ra gộp bằng trình hướng dẫn «Make Accessible» của Adobe Acrobat, hoặc khởi đầu từ những PDF quét đã phẳng, không còn siêu dữ liệu tiếp cận để mất.
Các câu hỏi thường gặp khác
Tôi có thể gộp hơn 50 MB PDF cùng lúc không?
Mỗi tệp có thể lên tới 50 MB, và giới hạn thực tế cho tổng dung lượng gộp là khoảng 300 MB trên trình duyệt máy bàn và khoảng 100 MB trên di động. Cả hai con số đều là hệ quả của bộ nhớ trình duyệt chứ không phải của bản thân định dạng PDF. ISO 32000-2 cho phép tệp lên tới 2^64 byte, nên PDF không phải nút thắt. Nút thắt là heap JavaScript, mà đa phần trình duyệt giới hạn ở 2 đến 4 GB cho mỗi tab. Nếu đầu vào gộp của bạn áp sát hoặc vượt mức đó, một công cụ máy bàn như Adobe Acrobat hay Preview của Apple sẽ xử lý tin cậy hơn.
Vì sao tệp gộp của tôi hơi lớn hơn tổng các đầu vào?
Phần lớn thời gian, tệp gộp về cơ bản chính là tổng đó, dao động vài phần trăm. Phần dư đến từ các tập con phông trùng lặp (cùng một phông được hai tài liệu nguồn nhúng xuất hiện hai lần trong đầu ra), tài nguyên hình ảnh trùng mà công cụ gộp không nhận ra là tương đương, và bảng tham chiếu chéo mới bao trùm tổng số đối tượng kết hợp. Đẩy đầu ra gộp qua công cụ PDF Compress thường thu hồi phần lớn lượng dư đó.
Tôi có thể gộp PDF có khổ trang khác nhau không?
Có. Mỗi trang của PDF mang theo media box riêng, hình chữ nhật định nghĩa vùng hiển thị. Một PDF gộp có thể chứa bất cứ tổ hợp khổ trang nào (A4, US Letter, A3, kích thước tuỳ biến) và đa phần trình đọc sẽ hiển thị từng trang ở khổ gốc. Bản thân tệp gộp không chọn một khổ trang «chiến thắng». Nếu bạn cần mọi trang trong đầu ra cùng khổ, đó là thao tác khác (đổi kích thước), và công cụ gộp không thực hiện.
Việc gộp có làm mất siêu dữ liệu của tôi không?
Từ điển thông tin tài liệu (tiêu đề, tác giả, chủ đề, từ khoá, trình tạo) được lấy từ tài liệu nguồn đầu tiên. Mọi siêu dữ liệu từ các nguồn sau bị bỏ. Luồng siêu dữ liệu XMP, nơi các PDF hiện đại lưu khối siêu dữ liệu có cấu trúc phong phú hơn, được pdf-lib dựng lại từ đầu. Nếu việc giữ một loại siêu dữ liệu cụ thể qua phép gộp quan trọng, hãy đặt chủ động ở tài liệu nguồn đầu tiên, hoặc dùng trình biên tập máy bàn áp dụng sau khi gộp.
Thứ tự tôi thả tệp vào có quan trọng không?
Có. Các tệp được gộp theo thứ tự xuất hiện trong danh sách. Trước khi bấm «Gộp PDF», bạn có thể sắp lại bằng nút lên xuống trên mỗi hàng tệp. Tệp đầu tiên trở thành các trang đầu của đầu ra, tệp thứ hai theo sau, và cứ thế. Siêu dữ liệu cũng lấy từ tệp đầu tiên, nên hãy đặt lên trên cùng tài liệu mà bạn muốn giữ tiêu đề và tác giả.