Chuyển PDF sang hình ảnh
Chuyển ngay các trang PDF thành hình ảnh PNG hoặc JPG. Tuỳ chỉnh tỉ lệ và chất lượng, sau đó tải toàn bộ trang dưới dạng ZIP hoặc từng ảnh riêng lẻ.
Hỗ trợ PDF · lên đến 100 MB
Cách hoạt động
- Tải lên PDF · Thả tệp PDF của bạn hoặc nhấp để duyệt thiết bị.
- Chọn cài đặt Xem các hình thu nhỏ của trang rồi chọn định dạng (PNG/JPG), tỉ lệ (1x đến 2x) và chất lượng JPG.
- Tải xuống hình ảnh · Tải xuống từng trang riêng lẻ hoặc tất cả cùng lúc dưới dạng ZIP.
Tại sao nên chuyển PDF sang hình ảnh?
Chuyển PDF sang hình ảnh hữu ích cho việc chia sẻ từng trang trên mạng xã hội, nhúng nội dung PDF vào tài liệu và bài thuyết trình, tạo hình thu nhỏ xem trước, hoặc trích xuất đồ họa để sử dụng trong thiết kế web. PNG bảo toàn chất lượng hoàn hảo, trong khi JPG cung cấp kích thước tệp nhỏ hơn lý tưởng cho các trang web.
Tính năng
- Nhiều định dạng · Xuất sang PNG (không mất dữ liệu) hoặc JPG (nhỏ hơn) để phù hợp với nhu cầu của bạn.
- Tỷ lệ linh hoạt · Chọn từ 1x đến 2x để điều chỉnh độ phân giải của hình ảnh đã xuất.
- Kiểm soát chất lượng Điều chỉnh chất lượng JPG từ 60 đến 100 phần trăm để cân bằng kích thước tệp và hình thức.
- Tải xuống hàng loạt · Tải xuống tất cả các trang dưới dạng một tệp ZIP hoặc từng trang riêng lẻ.
- Riêng tư hoàn toàn · Mọi xử lý đều diễn ra trong trình duyệt của bạn. PDF của bạn không bao giờ rời khỏi thiết bị.
- Nhanh · Chuyển đổi tức thì, không tải lên máy chủ, không chờ đợi.
Câu hỏi thường gặp
Sự khác biệt giữa PNG và JPG là gì?
PNG là không mất mát (không hao hụt chất lượng) và phù hợp hơn cho tài liệu có chữ hoặc sơ đồ. JPG được nén và cho tệp nhỏ hơn, lý tưởng cho PDF nhiều ảnh. JPG cho phép điều chỉnh chất lượng (60 đến 100 phần trăm); PNG luôn ở chất lượng đầy đủ.
Tôi nên chọn tỷ lệ nào?
1x hoạt động tốt cho việc xem trên màn hình. Sử dụng 1.5x cho màn hình HD hoặc in ấn cơ bản, và 2x cho in ấn chất lượng cao hoặc màn hình Retina. Tỷ lệ cao hơn có nghĩa là tệp lớn hơn.
Tôi có thể tải xuống chỉ một trang không?
Có. Sau khi chuyển đổi, mỗi bản xem trước có một nút tải xuống riêng cho trang đó. Bạn cũng có thể tải xuống tất cả các trang dưới dạng ZIP.
Tôi có thể xử lý PDF lớn cỡ nào?
Công cụ có thể xử lý các tệp PDF lên đến 100 MB. PDF lớn với nhiều trang có thể mất vài khoảnh khắc để xử lý tùy thuộc vào thiết bị của bạn.
PDF của tôi có được gửi đến máy chủ không?
Không. Tất cả việc chuyển đổi diễn ra cục bộ trong trình duyệt của bạn với PDF.js. PDF của bạn không bao giờ rời khỏi thiết bị, đảm bảo riêng tư và bảo mật.
Công cụ này có hoạt động trên di động không?
Có. Công cụ hoạt động trên tất cả các trình duyệt hiện đại bao gồm thiết bị iPhone, iPad và Android. Tỷ lệ 1x hoặc 1.5x sẽ hoạt động tốt hơn trên các thiết bị ít mạnh hơn.
«PDF sang hình ảnh» thực sự nghĩa là gì
PDF là một tài liệu vector. Văn bản trong PDF được lưu dưới dạng mã ký tự và tài nguyên phông chữ, không phải dưới dạng pixel. Đồ hoạ vector (đường, đường cong, vùng tô) được lưu thành các toán tử vẽ trong luồng nội dung, cũng không phải pixel. Chỉ các ảnh chụp được nhúng mới được lưu thành mảng pixel đã nén. Khi trình xem kết xuất PDF, nó đi qua luồng nội dung, vẽ chữ và đồ hoạ vector lên một bề mặt pixel ở độ phân giải đã chọn, rồi ghép các ảnh raster nhúng lên trên. Chuyển PDF sang hình ảnh nghĩa là chọn một độ phân giải, yêu cầu công cụ kết xuất tạo bề mặt pixel kích thước đó cho mỗi trang, và ghi bề mặt đó thành tệp PNG hoặc JPEG.
Đầu ra là một ảnh raster: lưới pixel cố định, không có dữ liệu chữ hay vector ở dưới. Chữ không còn chọn được, đồ hoạ vector không còn phóng to mà không bị răng cưa, và kích thước tệp hoàn toàn phụ thuộc vào độ phân giải và hiệu suất nén của định dạng. Đây là phép biến đổi một chiều: một khi đã raster hoá, không thể đưa tài liệu về dạng PDF vector nếu không qua một bước OCR hoặc vector hoá để suy ra cấu trúc từ pixel. Hãy dùng PDF sang hình ảnh khi bạn cần nội dung hình ảnh dưới dạng hình (cho mạng xã hội, slide, bài blog, đầu vào OCR) và chấp nhận rằng chữ chọn được và vector co giãn không có trong gói.
Công cụ này kết xuất như thế nào
Công cụ này dùng pdf.js của Mozilla, cũng chính là công cụ kết xuất PDF bằng JavaScript đang chạy trong trình xem PDF tích hợp của Firefox. Đường ống có bốn bước. Đầu tiên, PDF nguồn được đọc vào tab trình duyệt thông qua File API chuẩn; không có lưu lượng mạng nào phát sinh. Thứ hai, pdf.js phân tích bảng tham chiếu chéo của tài liệu và dựng mô hình trong bộ nhớ về các trang, phông chữ và tài nguyên nhúng. Thứ ba, với mỗi trang người dùng đã chọn, công cụ gọi page.getViewport({scale}) để tính kích thước pixel tại tỉ lệ đã chọn, cấp phát một canvas HTML5 có kích thước đó, rồi gọi page.render({canvasContext, viewport}) để vẽ trang lên canvas.
Thứ tư, phương thức toBlob() của canvas sinh ra một ảnh PNG hoặc JPEG, được trao dưới dạng tệp tải về hoặc đóng gói vào ZIP qua JSZip khi có nhiều trang. Toàn bộ đường ống chạy trong tab trình duyệt của bạn; không có gì được tải lên. Việc tải pdf.js và JSZip từ CDN khi mở trang lần đầu là lưu lượng mạng duy nhất; sau đó, mọi việc chuyển đổi đều cục bộ.
Tham số tỉ lệ và ý nghĩa quy đổi sang DPI
Tham số tỉ lệ điều khiển độ phân giải đầu ra. pdf.js đo các trang PDF ở thang cơ sở 1.0, tương ứng với 96 DPI (định nghĩa pixel CSS). Tỉ lệ 1.0 tạo ra canvas có kích thước vật lý đúng bằng PDF gốc trên màn hình 96 DPI. Tỉ lệ 2.0 nhân đôi cả chiều rộng lẫn chiều cao, cho canvas có số pixel gấp bốn lần. Một trang US-letter (8,5 x 11 inch) ở tỉ lệ 1.0 có kích thước 816 x 1056 pixel; ở tỉ lệ 2.0 là 1632 x 2112 pixel.
Đối chiếu với DPI in cũng rất thẳng: tỉ lệ 1.0 vào khoảng 96 DPI, tỉ lệ 1.5 là 144 DPI, tỉ lệ 2.0 là 192 DPI. Phần lớn quy trình rơi gọn vào các khoảng dưới đây:
- 72 đến 96 DPI (tỉ lệ 1x): chất lượng cho web và màn hình. Đủ dùng cho ảnh thu nhỏ, hình minh hoạ blog, ảnh xem trước trên mạng xã hội và tệp đính kèm email.
- 150 DPI (giữa 1x và 2x): chất lượng lưu trữ tiêu chuẩn. Phù hợp đọc trên màn hình, kho tài liệu, đầu vào OCR và phần lớn các bản in văn phòng.
- 192 DPI (tỉ lệ 2x): chất lượng màn hình retina. Chữ sắc trên màn hình laptop và điện thoại độ phân giải cao, vừa đủ cho in ấn thông thường.
- 300 DPI trở lên: chất lượng in chuyên nghiệp. Không có sẵn trực tiếp ở công cụ này; dùng công cụ máy bàn (Adobe Acrobat Pro, pdftoppm với
-r 300, hoặc ImageMagick với-density 300) cho đầu ra in cuối cùng.
Chọn định dạng: PNG hay JPG
PNG không mất mát. Mỗi pixel mà công cụ kết xuất sinh ra đều được mã hoá chính xác, không suy giảm chất lượng. Nén của PNG tương tự ZIP: rất hiệu quả với các ảnh có vùng phẳng lớn, mẫu lặp lại hoặc đường nét sắc; kém hiệu quả với ảnh chụp. PNG cũng hỗ trợ nền trong. JPEG có mất mát: phép nén loại bỏ các chi tiết tần số cao mà mắt người không nhận ra, cho tệp nhỏ hơn nhưng để lại các điểm méo nhìn thấy quanh các cạnh sắc và vùng tương phản cao. Thanh trượt chất lượng điều chỉnh sự đánh đổi này: 100 phần trăm cho ra đầu ra gần như không mất mát với kích thước gấp 3 đến 5 lần đầu ra 60 phần trăm; 60 phần trăm nhỏ hơn nhiều nhưng để lộ các quầng nhìn thấy quanh chữ.
Quy tắc quyết định cho gần như mọi PDF: nếu trang là chữ, sơ đồ, biểu đồ hoặc hình vẽ nét, hãy chọn PNG. Các cạnh sắc của chữ và vector tạo ra quầng méo trong JPEG, nhìn thấy được ngay cả ở chất lượng cao; còn nén không mất mát của PNG xử lý vùng phẳng (nền trắng, ô màu đặc) rất hiệu quả, nên phần phạt về kích thước nhỏ hơn quy tắc chung gợi ý. Nếu trang là ảnh chụp (trang tạp chí quét, album ảnh, tờ rơi nhiều ảnh sản phẩm lớn), dùng JPEG ở mức 85 đến 90 phần trăm chất lượng. Nếu tài liệu lẫn lộn cả hai, PNG thường là mặc định an toàn hơn, vì các điểm méo trên chữ rất dễ thấy còn trên ảnh thì khó nhận ra.
Những quy trình thực tế thúc đẩy việc chuyển PDF sang hình ảnh
- Mạng xã hội và xuất bản web. Chia sẻ PDF lên Twitter, LinkedIn hay một bài blog đòi hỏi chuyển ít nhất trang bìa hoặc các trang chính thành hình, vì các nền tảng đó không nhúng PDF như ảnh xem trước. Các đội tiếp thị biến báo cáo PDF, sách trắng và nghiên cứu trường hợp thành ảnh xem trước; nhà xuất bản chuyển bìa và một trang mẫu của ebook sang PNG cho trang sản phẩm. PNG ở tỉ lệ 1.5x đến 2x là lựa chọn quen thuộc.
- Bài thuyết trình và bộ slide. PowerPoint, Keynote và Google Slides có thể nhúng ảnh nhưng không thể nhúng trực tiếp các trang PDF. Bất cứ ai chuẩn bị slide cần đưa vào một hình, biểu đồ hay trích đoạn từ PDF đều sẽ chuyển trang tương ứng trước. PNG được ưu tiên vì hình đó thường chứa chữ hoặc nội dung vector mà JPEG sẽ làm hỏng.
- Đầu vào cho OCR. Một số chuỗi nhận dạng ký tự quang học hoạt động tốt hơn trên ảnh raster so với PDF đã có lớp chữ trích sẵn. Quy trình là raster hoá PDF ở 150 đến 300 DPI, chạy OCR trên những ảnh thu được, rồi dùng văn bản OCR trực tiếp hoặc đưa lại vào một PDF mới với văn bản OCR làm lớp ẩn.
- Toà án và bằng chứng pháp lý. Bằng chứng nộp ở những vùng tài phán mà hệ thống quản lý vụ án của toà chỉ chấp nhận định dạng ảnh đòi hỏi chuyển PDF sang ảnh trước khi tải lên. Mỗi trang thành một ảnh riêng, đặt tên theo số bằng chứng và số trang, gom lại thành ZIP để tải lên.
- Tiếp cận và lưu trữ. Một số kho lưu trữ thuộc tổ chức yêu cầu bản sao lưu trữ dài hạn của tài liệu được giữ thêm ở định dạng raster (PNG hoặc TIFF) cùng với PDF gốc, với suy nghĩ rằng định dạng PDF có thể đến lúc không đọc được nữa, còn ảnh raster thì luôn đọc được. Đây là chiến lược lưu trữ còn tranh cãi nhưng thực tế đã được áp dụng quy mô lớn.
- Tệp đính kèm email và chat. Một số ứng dụng email hoặc chat doanh nghiệp lọc bỏ hoặc chặn tệp PDF đính kèm vì lý do an ninh nhưng cho phép ảnh. Chuyển PDF sang PNG trước khi gửi là cách lách thông dụng.
Bẫy thường gặp và cách xử lý
- Kích thước tệp tăng theo bình phương của tỉ lệ. Tăng tỉ lệ lên gấp đôi nhân số pixel lên bốn lần, kéo theo kích thước tệp PNG tăng khoảng bốn lần và JPEG khoảng ba lần. Một PDF 20 trang ở tỉ lệ 2x PNG dễ dàng sinh ra một ZIP nặng 50 đến 100 MB. Giới hạn thực tế của kích thước PDF đầu vào tỉ lệ nghịch với độ phân giải đầu ra đã chọn. Nếu ZIP quá lớn, hãy hạ về tỉ lệ 1x hoặc 1.5x, hoặc chuyển sang JPEG.
- Chữ không còn chỉnh sửa được. Sau khi raster hoá, chữ là pixel. Sao chép-dán không còn hoạt động, trình đọc màn hình không còn đọc được nội dung, và tìm kiếm trong tài liệu cũng thất bại. Nếu sau vòng đi-về vẫn cần chữ chọn được, hãy chạy OCR trên các ảnh đầu ra, kèm theo tỉ lệ lỗi riêng của OCR.
- Mất nền trong khi dùng JPEG. PDF có thể chứa trang với nền trong (thường là lớp watermark hoặc đồ hoạ phủ). JPEG sẽ làm phẳng nền trong thành một màu nền đặc, thường là trắng. PNG giữ lại nền trong. Nếu tài liệu có nền trong quan trọng với đầu ra, hãy chọn PNG.
- Đồ hoạ vector vỡ pixel khi phóng to. PDF gốc có thể phóng to bao nhiêu cũng không mất sắc, vì công cụ kết xuất raster hoá lại ở từng mức phóng. Ảnh đầu ra cố định ở độ phân giải khi kết xuất; phóng quá 100 phần trăm sẽ thấy pixel chứ không phải đồ hoạ được tính lại. Với mọi quy trình mà người xem có thể phóng to (màn hình lớn, máy chiếu, in phóng), hãy chọn tỉ lệ cao nhất còn nằm vừa bộ nhớ.
- Khác biệt khử răng cưa giữa các trình duyệt. Các trình duyệt khác nhau áp dụng những chiến lược khử răng cưa cho chữ hơi khác nhau trong hiện thực canvas của mình. Cùng một PDF kết xuất ở tỉ lệ 2x trong Chrome, Firefox và Safari cho ra kết quả nhìn na ná nhưng không trùng từng pixel. Với phần lớn mục đích thì khác biệt này không thấy được; với các ứng dụng pháp y hoặc lưu trữ cần tái lập chính xác, kết xuất ở phía máy chủ bằng một bộ máy cố định (Ghostscript, pdftoppm) là lựa chọn tốt hơn.
- PDF đã mã hoá không phân tích được. PDF có mật khẩu mở thì pdf.js không đọc được cho tới khi mật khẩu được cung cấp. Hiện công cụ này không hiện hộp nhập mật khẩu. Quy trình là dùng công cụ Mở khóa PDF miễn phí trực tuyến để mở khoá trước, rồi mới đem bản đã mở khoá vào đây để chuyển đổi.
Vì sao đầu ra có kích thước như vậy
Kích thước tệp đầu ra phụ thuộc ba yếu tố: số trang, tỉ lệ đã chọn, và hiệu suất nén của định dạng. Với một trang PDF tiêu biểu gồm chữ và sơ đồ, PNG ở tỉ lệ 1.0 vào khoảng 50 đến 200 KB mỗi trang, PNG ở tỉ lệ 2.0 vào khoảng 200 đến 800 KB mỗi trang, JPEG chất lượng 85 phần trăm ở tỉ lệ 1.0 vào khoảng 30 đến 80 KB mỗi trang, và JPEG cùng chất lượng ở tỉ lệ 2.0 vào khoảng 100 đến 300 KB mỗi trang. Trang nhiều ảnh sinh tệp lớn hơn ở cả hai định dạng, với JPEG vẫn duy trì lợi thế gấp 3 đến 5 lần so với PNG. Một PDF 100 trang chuyển ở tỉ lệ 2x PNG có thể cho ra ZIP 20 đến 80 MB; cùng PDF đó ở tỉ lệ 1x JPEG 85 phần trăm cho ra ZIP 3 đến 8 MB. Phần lớn người dùng muốn một mức ở giữa, đó là lý do vì sao tỉ lệ 1.5x với JPEG 85 phần trăm trở thành mặc định hợp lý trên thực tế cho nhu cầu chung.
Chuyển đổi chỉ trong trình duyệt so với chuyển đổi trên đám mây
Các trình chuyển PDF sang ảnh trên đám mây chiếm các vị trí đầu trang kết quả tìm kiếm (Smallpdf, ILovePDF, Adobe Acrobat Online, PDF24, Sejda, PDF2Go) đều tải PDF gốc của bạn lên máy chủ của họ, chạy chuyển đổi qua các công cụ kết xuất phía máy chủ (thường là Ghostscript hoặc thư viện riêng) và trả về ZIP để tải xuống. Chính sách quyền riêng tư nói tệp đã tải lên sẽ bị xoá trong vài giờ, nhưng tệp đã đi qua mạng của nhà cung cấp, nằm trên đĩa của họ trong khoảng thời gian xử lý, và đi qua mọi nhật ký mà nhà cung cấp lưu lại để phát hiện lạm dụng. Gói miễn phí thường giới hạn số lần thao tác mỗi ngày; gói trả phí gỡ giới hạn đó.
Công cụ này không tải lên gì. PDF của bạn được đọc vào tab trình duyệt qua File API chuẩn, được pdf.js phân tích và kết xuất ngay trong cùng tab đó, và ZIP đầu ra được JSZip lắp ghép cục bộ trước khi lưu xuống đĩa qua API tải về tiêu chuẩn. Bạn có thể kiểm chứng: mở công cụ phát triển của trình duyệt sang thẻ Network, chạy một thao tác chuyển đổi và quan sát rằng không có yêu cầu nào mang theo nội dung tệp của bạn. Sự đánh đổi nằm ở khả năng kết xuất: pdf.js xử lý đúng đại đa số PDF thực tế, nhưng các bộ máy phía máy chủ có sẵn các thư viện thương mại trưởng thành xử lý tốt hơn một số trường hợp khó (mã hoá phông chữ lạ, nhóm trong suốt phức tạp, các tính năng PDF hiếm). Với 95 phần trăm PDF đầu vào, đầu ra có thể thay thế nhau; với 5 phần trăm còn lại, các dịch vụ đám mây có lợi thế.
Các câu hỏi thường gặp khác
Tôi có thể lấy đầu ra 300 DPI cho in không?
Không trực tiếp. Mức cao nhất của công cụ là tỉ lệ 2x, tương ứng khoảng 192 DPI. Để có đầu ra 300 DPI, lựa chọn đúng là dùng công cụ máy bàn (tính năng Export to Image của Adobe Acrobat Pro, pdftoppm với -r 300, hoặc ImageMagick với -density 300) hoặc một dịch vụ đám mây cho phép kết xuất với DPI tuỳ ý (Adobe Acrobat Online, gói trả phí của Smallpdf). Với hầu hết quy trình không đòi hỏi bản in cuối cùng nghiêm ngặt, tỉ lệ 2x là đủ: 192 DPI đã đủ sắc đến mức ở khoảng cách đọc thường, khác biệt với 300 DPI là không thấy được.
Tôi có thể chọn các trang cụ thể để chuyển không?
Không trực tiếp trong công cụ này. Hãy dùng công cụ Công cụ tách PDF miễn phí trước để trích các trang mong muốn, rồi đem PDF đã trích về đây chuyển. Việc chọn trang trong một bước duy nhất là tính năng đã lên kế hoạch; tạm thời, quy trình hai bước đã đáp ứng được nhu cầu.
Vì sao đầu ra trông khác Adobe Acrobat?
Công cụ này dùng pdf.js, bộ máy kết xuất JavaScript mà Firefox dùng cho trình xem PDF tích hợp. pdf.js xử lý 95 phần trăm hoặc hơn các PDF thực tế giống hệt Adobe Acrobat. Một vài phần trăm còn lại liên quan đến phông chữ lạ, nhóm trong suốt phức tạp, các tính năng PDF mới mà pdf.js chưa triển khai, hoặc các trường hợp riêng về quản lý màu. Với những tài liệu đó, Adobe Acrobat hoặc công cụ phía máy chủ cho ra đầu ra chính xác hơn. Với PDF hằng ngày, sự khác biệt là không nhìn thấy được.
Tôi có thể OCR các ảnh đầu ra không?
Không trực tiếp trong công cụ này. Ảnh đầu ra có thể đưa sang một công cụ OCR riêng (OCR của Adobe Acrobat, Tesseract, các dịch vụ OCR trực tuyến). Nhiều người làm đúng như vậy: chuyển PDF đã quét sang ảnh tại đây, chạy OCR ở chỗ khác, rồi dựng lại một PDF có thể tìm kiếm với văn bản OCR làm lớp ẩn. Để OCR hoạt động tốt, hãy kết xuất ở tỉ lệ 2x (càng gần 300 DPI, độ chính xác OCR càng cao).
Vì sao màu sắc hơi khác so với PDF?
Quản lý màu. PDF có thể đem theo hồ sơ màu ICC quy định cách các giá trị màu được chiếu sang đầu ra màn hình hay in. API canvas của trình duyệt chưa hiện thực đầy đủ quản lý màu ICC; bộ máy kết xuất hiểu các màu theo sRGB. Với hầu hết tài liệu thì không thấy được; với công việc nhạy cảm về màu (thiết kế đồ hoạ, danh mục ảnh, bản in thử), công cụ máy bàn có quản lý màu đúng đắn là lựa chọn phù hợp. Adobe Acrobat Pro và quy trình «Save for Web» của Adobe Photoshop xử lý hồ sơ ICC một cách đúng đắn.
Có chạy trên điện thoại và máy tính bảng không?
Có, trong phạm vi bộ nhớ trình duyệt di động cho phép. Giới hạn heap JavaScript trên điện thoại thường khoảng vài trăm megabyte mỗi tab, đủ cho phần lớn PDF nhưng có thể bị vượt với các tài liệu rất lớn ở tỉ lệ 2x. Như một chỉ dẫn thô: PDF dưới 50 MB chuyển đổi trơn tru trên điện thoại ở mọi tỉ lệ; PDF trên 100 MB có thể hết bộ nhớ ở tỉ lệ 2x và nên chuyển ở tỉ lệ 1x hoặc 1.5x, hoặc xử lý trên máy bàn. Mô hình xử lý theo từng trang khiến tab không nạp toàn bộ đầu ra cùng lúc, nên dung lượng bộ nhớ sử dụng tỉ lệ với kích thước một trang đã kết xuất, không phải toàn bộ tài liệu.