Ekstraktor Gambar PDF Gratis

Ekstrak semua gambar yang disematkan dari file PDF secara instan. Pratinjau gambar dengan dimensi, unduh satu per satu atau sebagai ZIP.

100% sisi klien · file Anda tidak pernah meninggalkan perangkat

Lepas file PDF di sini atau klik untuk menelusuri

Mendukung PDF · hingga 50 MB

Memproses: 0%

Cara Kerja

Unggah PDF: Lepas atau pilih file PDF untuk mengekstrak gambar darinya.
Ekstraksi Otomatis: Alat memindai semua halaman dan mengekstrak setiap objek gambar yang disematkan, menampilkannya dalam grid dengan informasi dimensi dan ukuran file.
Unduh Gambar: Klik gambar apa pun untuk mengunduhnya satu per satu, atau gunakan 'Unduh Semua sebagai ZIP' untuk mengunduh massal semua gambar yang diekstrak.

Mengapa Mengekstrak Gambar dari PDF?

Mengekstrak gambar dari PDF berguna untuk menggunakan kembali konten, menggunakan kembali grafik dalam presentasi atau situs web, mengarsipkan materi visual, atau berbagi gambar individual tanpa membagikan seluruh PDF. Ekstraksi gambar mempertahankan kualitas asli karena tidak ada pemrosesan ulang yang terjadi: hanya gambar yang disematkan yang diekspor apa adanya.

Fitur

Ekstraksi Lengkap: Mengekstrak semua objek gambar yang disematkan dari setiap halaman di PDF.
Kualitas Dipertahankan: Format gambar asli (PNG, JPG, TIFF, dll.) dan kualitas dipertahankan, tanpa pemrosesan ulang atau kompresi.
Pratinjau Gambar: Lihat semua gambar yang diekstrak dalam grid yang dapat digulir dengan informasi dimensi, format, dan ukuran file.
Unduh Individual atau Massal: Unduh setiap gambar secara terpisah atau unduh semua gambar sebagai arsip ZIP.
Tampilan Metadata: Setiap gambar menampilkan lebar, tinggi, format, dan perkiraan ukuran file untuk referensi yang mudah.
Privasi: Semua pemrosesan terjadi secara lokal di browser Anda. File tidak pernah diunggah ke server mana pun.
Cepat: Ekstraksi waktu nyata tanpa menunggu atau antrean.

Pertanyaan yang Sering Diajukan

Apakah kualitas gambar dipertahankan selama ekstraksi?

Ya. Alat mengekstrak gambar dalam format aslinya tanpa pemrosesan ulang atau kompresi ulang. Kualitasnya persis seperti saat disematkan di PDF.

Format gambar apa yang dapat diekstrak?

Alat mengekstrak gambar dalam format sematan aslinya: PNG, JPG, TIFF, GIF, JPEG2000, dan format umum lainnya. File yang diekstrak mempertahankan format dan kualitas aslinya.

Bisakah saya melihat dimensi gambar sebelum mengunduh?

Ya. Setiap gambar dalam grid pratinjau menampilkan lebar dan tingginya dalam piksel, beserta format file dan perkiraan ukuran file. Ini membantu Anda mengidentifikasi dan memilih gambar yang akan diunduh.

Bisakah saya mengunduh gambar satu per satu?

Ya. Klik tombol unduh pada gambar apa pun untuk mengunduhnya segera. Atau gunakan 'Unduh Semua sebagai ZIP' untuk mengunduh semua gambar yang diekstrak dalam satu arsip.

Apakah mengekstrak gambar yang digunakan sebagai latar belakang atau dekorasi?

Ya. Alat mengekstrak semua objek gambar yang disematkan dalam PDF, termasuk gambar yang digunakan sebagai latar belakang, dekorasi, atau grafik yang disematkan di semua halaman.

Apakah PDF saya dikirim ke server?

Tidak. Semua ekstraksi dilakukan secara lokal di browser Anda dengan PDF.js. PDF Anda tidak pernah meninggalkan perangkat, menjamin privasi dan keamanan.

Apa batas ukuran file?

PDF hingga 50 MB didukung. Kecepatan ekstraksi tergantung pada jumlah halaman dan jumlah gambar yang disematkan. PDF besar dengan banyak gambar mungkin memerlukan waktu beberapa saat untuk diproses.

Bisakah saya mengekstrak gambar di ponsel?

Ya. Alat ini bekerja di browser desktop, tablet, dan ponsel. Cukup ketuk untuk memilih PDF dan semua gambar akan diekstrak dan ditampilkan untuk diunduh.

Apa arti "mengekstrak gambar dari PDF" sebenarnya

Ungkapan sehari-hari "mengekstrak gambar dari PDF" itu ambigu, dan ambiguitas itu menentukan apa yang sebenarnya alat ini berikan. Dua operasi yang benar-benar berbeda bersembunyi di balik kata-kata yang sama. Yang pertama adalah mengekstrak objek gambar yang tertanam: menelusuri dokumen, mengidentifikasi setiap XObject Gambar (atau gambar inline) yang ditempatkan penulis ke dalam berkas, dan menulis kembali masing-masing sebagai PNG mandiri. Keluarannya adalah apa yang sungguh-sungguh ditaruh penulis ke dalam berkas, pada resolusi yang dia gunakan. Yang kedua adalah merender halaman menjadi gambar: meraster tiap halaman PDF menjadi satu gambar pada DPI pilihan, menangkap teks, bentuk vektor, dan gambar bersama-sama sebagai piksel yang sudah didatarkan. Keluarannya adalah gambar dari halaman, bukan gambar yang ada di dalam halaman.

Alat ini melakukan jenis pertama. Untuk dokumen 10 halaman dengan tiga foto tertanam di halaman 2 dan 7, alat ini menghasilkan tiga berkas gambar, bukan sepuluh gambar halaman. Jika Anda menginginkan jenis kedua, yaitu render halaman sebagai gambar, gunakan alat Konversi PDF ke Gambar. Membedakan kedua operasi ini adalah sumber kebingungan paling sering ketika pengguna pertama kali datang: layanan "PDF ke JPG" biasanya melakukan jenis kedua, dan banyak pengguna sampai di sana padahal menginginkan yang pertama. Jumlah keluaran adalah penanda: ekstraksi mengembalikan jumlah gambar yang tertanam; rendering halaman mengembalikan jumlah halaman.

Cara alat ini bekerja

Alat ini menjalankan PDF.js, perender PDF berbasis JavaScript murni dari Mozilla, mesin yang sama yang memberdayakan pratinjau PDF bawaan Firefox. Ketika Anda memilih sebuah PDF, File API peramban menyerahkan byte-nya langsung ke PDF.js tanpa perjalanan bolak-balik jaringan. PDF.js menguraikan tabel referensi silang, trailer, dan katalog dokumen di dalam Web Worker agar thread utama tetap responsif. Untuk tiap halaman, alat meminta daftar operator dan menelusuri setiap panggilan paintImageXObject dan paintInlineImageXObject. Untuk tiap operator gambar, alat menyelesaikan XObject Gambar yang sebenarnya lewat cache objek PDF.js, men-decode-nya sesuai filter dan ruang warnanya, menggambar bitmap-nya ke canvas di luar layar, lalu mengekspor canvas tersebut sebagai PNG.

Lebar, tinggi, dan ukuran berkas perkiraan dicatat untuk tampilan galeri. Saat Anda mengklik "Unduh Semua sebagai ZIP", JSZip membungkus setiap gambar yang diekstrak ke dalam satu arsip di memori, dan jangkar unduhan peramban memicu penyimpanan. Tidak satu pun bagian proses ini membuat permintaan jaringan. Anda dapat memverifikasi langsung: buka alat pengembang peramban di panel Jaringan sebelum memilih PDF, jalankan ekstraksi, dan amati bahwa tidak ada apa pun yang meninggalkan mesin Anda. Mesin PDF.js dan pustaka JSZip diunduh sekali pada kunjungan pertama dan disimpan di cache peramban, sehingga kunjungan berikutnya memuat seketika dan bekerja sepenuhnya offline.

Bagaimana PDF menyimpan gambar

Berkas PDF adalah pohon objek. Pohon halaman merujuk ke objek halaman; setiap objek halaman merujuk ke aliran konten (content stream) dan kamus sumber daya (resource dictionary). Entri XObject dari kamus sumber daya memetakan nama-nama singkat (seperti Im1, Im2) ke aliran XObject Gambar. Aliran konten menggambar mereka dengan operator Do: urutan seperti q 200 0 0 150 50 300 cm /Im1 Do Q berarti "atur transformasi, gambar gambar bernama Im1 dari sumber daya, pulihkan transformasi". Tiap XObject Gambar membawa Width dan Height (dimensi piksel), ColorSpace (cara menafsirkan tiap komponen), BitsPerComponent (1, 2, 4, 8, atau 16), dan Filter (rantai kodek yang memampatkan byte).

Bagi sebuah ekstraktor, bidang Filter adalah yang paling penting karena menentukan apakah byte dapat ditulis langsung atau harus didekode dulu. Enam filter muncul dalam praktik. DCTDecode menyimpan byte sebagai berkas JPEG utuh, siap ditulis dengan ekstensi .jpg; ini sekitar 60 sampai 70 persen gambar di PDF berwarna. JPXDecode adalah JPEG2000, jarang pada dokumen konsumen tetapi ada pada pipeline pencetakan kelas atas. CCITTFaxDecode adalah kompresi faks Grup 3 atau Grup 4 untuk pindaian hitam-putih satu bit, lazim di arsip bisnis hasil pindai. JBIG2Decode adalah penerus yang lebih efisien yang dipakai oleh "Reduce File Size" Acrobat dan ABBYY FineReader. FlateDecode adalah data piksel mentah terkompresi zlib, umum pada grafik, tangkapan layar, dan PDF dari perkakas authoring berorientasi web. RunLengthDecode adalah RLE sederhana yang kebanyakan dipakai pada PDF yang lebih tua atau dibuat tangan.

Gambar inline, kasus yang mudah terlewat

Spesifikasi PDF memungkinkan gambar kecil ditanam langsung ke dalam aliran konten halaman, di antara operator BI (begin image), ID (image data), dan EI (end image), tanpa menjadi XObject bernama. Ini optimasi awal 1990-an untuk grafis sangat kecil seperti logo, ikon, dan penanda butir, ditujukan untuk menghindari biaya objek terpisah bagi gambar berukuran beberapa ratus byte. Selain itu, formatnya identik dengan XObject Gambar: bidang filter, ruang warna, dan dimensi yang sama, tertulis dalam bentuk ringkas.

Banyak alat "ekstrak gambar" sepenuhnya melewatkan gambar inline karena mereka hanya menelusuri tabel XObject di kamus sumber daya dan berhenti di sana. Alat ini menelusuri daftar operator halaman dan menangkapnya lewat paintInlineImageXObject. Implikasi praktisnya: PDF yang punya logo perusahaan di header (biasanya inline) dan PDF dari perkakas authoring lama yang memakai gambar inline untuk ikon akan mengembalikan lebih banyak gambar daripada yang disarankan oleh penelusuran XObject naif. Kalau Anda membandingkan jumlah ekstraksi dengan alat lain, ini salah satu alasan perbedaannya. Alasan lain yang dibahas di bawah adalah inklusi grafik dekoratif, mask stensil, dan tanda air yang dibuang oleh sebagian alat secara default.

Mask lembut, stensil, dan transparansi

Transparansi gambar dalam PDF jarang dikodekan di dalam gambar itu sendiri. Sebaliknya, halaman mengomposisikan gambar berwarna dengan "mask lembut" satu kanal yang terpisah (entri SMask dalam kamus XObject). Hasil yang terlihat di pembaca adalah komposisinya; gambar warna yang diekstrak sendirian bersifat opak. Untuk gambar hasil ekstraksi yang dimaksudkan untuk pemakaian ulang secara visual, ini bisa menimbulkan kejutan: sebuah logo yang diekstrak dari PDF yang menggunakan SMask oleh penulisnya bisa muncul sebagai persegi panjang opak alih-alih PNG berlatar transparan. Perilaku saat ini adalah mengekstrak XObject Gambar warna tanpa merekonstruksi SMask, yang cocok dengan perilaku pdfimages -png di baris perintah dan dengan perilaku setiap layanan ekstraksi cloud yang kami uji.

Konsep terkait adalah penanda ImageMask. Ketika ImageMask bernilai true, byte-nya bukan data piksel; mereka adalah stensil satu bit yang menentukan di mana warna isian saat ini diterapkan. Mengekstrak ImageMask secara terpisah menghasilkan siluet hitam-putih, bukan gambar yang dapat dipakai. Alat melaporkan mereka di galeri demi kelengkapan, tetapi manfaatnya kecil kecuali Anda secara khusus tertarik pada siluet tersebut. Urutkan berdasarkan dimensi dan abaikan stensil kecil bila mereka memenuhi tampilan. Merekonstruksi mask lembut menjadi PNG ber-alfa adalah fitur dalam daftar keinginan, tetapi saat ini diserahkan ke perkakas desktop, karena kadang-kadang destruktif: rekonstruksi membakar warna latar belakang ke dalam hasilnya, yang mungkin Anda inginkan atau tidak.

Ruang warna dan dampaknya pada keluaran

Sebagian besar PDF pada 2026 memakai DeviceRGB (mirip sRGB) atau DeviceCMYK. PDF.js men-decode keduanya secara transparan, mengonversi CMYK ke RGB sebelum menggambar ke canvas. Karena itu PNG hasil ekstraksi selalu RGB, sekalipun sumbernya CMYK. Untuk pemakaian ulang murni visual, ini benar: gambar CMYK ditujukan untuk pencetakan dan tidak akan tampil benar di situs tanpa konversi. Untuk reproduksi cetak, konversi ini bersifat perkiraan karena canvas tujuan tidak punya profil cetak yang terlampir. Pengguna yang membidik cetak sebaiknya menyimpan PDF asli dan tidak melalui ekstraksi sebagai jalur bolak-balik; kesetiaan warna akan lebih baik bila pipeline cetak membaca gambar CMYK secara langsung.

Profil warna ICCBased yang menempel di gambar PDF dihormati oleh PDF.js saat decoding, sehingga PNG hasil ekstraksi mendekati tampilan yang dimaksudkan dalam kondisi tampilan standar. Ruang warna terindeks (gambar palet, kasus 256 warna khas dari impor GIF lama) di-de-indeks selama ekstraksi, menghasilkan PNG warna penuh alih-alih berbasis palet. Ini perilaku yang benar untuk pemakaian ulang visual, tetapi berarti ukuran berkas PNG hasil ekstraksi dapat lebih besar daripada ukuran berkas gambar terindeks aslinya di dalam PDF. Trade-off ini tidak terhindarkan dalam pipeline berbasis canvas, dan kami memilih kesetiaan di atas kerampingan; pengguna yang ingin berkas sekecil mungkin dapat melewatkan keluaran ke Kompresor Gambar Gratis Online setelahnya.

Alur kerja nyata yang mendorong ekstraksi gambar

Menggunakan ulang grafik untuk slide atau web. Seorang desainer atau pemasar menerima hasil kerja klien sebagai PDF dan membutuhkan foto dan diagramnya untuk slide presentasi, perombakan situs web, atau unggahan media sosial. Klik kanan "simpan gambar" di Acrobat bekerja satu gambar sekali pakai; untuk laporan 60 halaman dengan 40 gambar, itu adalah setengah jam klik dibanding sekali tarik-lepas ke tab peramban dan satu unduhan ZIP.
Membangun katalog gambar. Seorang arsiparis, pustakawan, atau auditor konten memiliki korpus PDF dan butuh mengeluarkan gambar untuk dikatalogkan, ditulisi teks alternatif, atau dibangun indeks pencarian visualnya. Ekstraksi batch diikuti unduh ZIP adalah alur standar; mengintegrasikan dengan skrip yang menelusuri folder di desktop menjadi mudah setelah sisi peramban membuktikan ekstraksi mengembalikan apa yang diharapkan.
Portofolio fotografi yang dikirim sebagai PDF. Fotografer kadang-kadang menyerahkan pekerjaan klien sebagai galeri PDF alih-alih berkas-berkas individual, terutama untuk sesi potret dan liputan acara. Klien menginginkan berkas individual. Ekstraksi mengembalikannya pada resolusi yang ditanamkan, yang biasanya adalah resolusi yang dipilih fotografer untuk versi cetaknya.
Menyelamatkan gambar dari PDF bermasalah. Sebuah PDF tidak merender dengan benar di pembaca atau berperilaku tak menentu, tetapi struktur dasarnya cukup utuh sehingga PDF.js bisa menguraikan kamus sumber dayanya. Ekstraksi menyelamatkan gambar tertanam bahkan ketika dokumen berperilaku buruk di sisi lain. Skenario penyelamatan yang umum untuk berkas yang rusak saat transit atau tersimpan dengan tanda tangan tak konsisten.
Tinjauan forensik dan hukum. Peninjau yang menyiapkan discovery atau katalog bukti membutuhkan setiap gambar dari kumpulan dokumen dapat terdaftar dan diekspor. Jaminan "semua gambar tertanam" itu penting: kehilangan satu pun adalah masalah. Ekstraksi berbasis daftar operator (bukan hanya tabel XObject) adalah pendekatan yang tepat karena menangkap gambar inline yang sebagian pipeline diam-diam jatuhkan.
Pra-pemrosesan OCR. Sebagian pipeline OCR bekerja lebih baik pada gambar hasil ekstraksi daripada pada halaman yang sudah dirender, terutama jika gambar sumber adalah pindaian resolusi tinggi yang tertanam pada tata letak halaman dengan resolusi lebih rendah. Ekstraksi pada resolusi asli mempertahankan detail yang bisa di-OCR yang akan hilang jika halaman dirender pada 150 atau 300 DPI.
Penelitian akademik dan jurnalistik. Bagan, foto, dan diagram dalam PDF dikeluarkan untuk kutipan penggunaan wajar, pemeriksaan fakta terhadap sumber asli, atau perbandingan antar dokumen. Para peneliti juga sering menginginkan resolusi asli gambar yang tertanam untuk mendeteksi manipulasi atau artefak kompresi yang akan tertutupi oleh rendering halaman.

Jebakan umum dan artinya

"Alat mengekstrak lebih banyak gambar daripada yang saya harapkan." PDF sering mengandung gambar yang tidak terlihat secara langsung: latar dekoratif yang berulang di banyak halaman, tanda air, ornamen header dan footer, mask transparansi (yang secara teknis adalah XObject Gambar), dan grafik inline mungil seperti kotak centang. Ekstraksi lengkap mengembalikan semuanya. Urutkan galeri berdasarkan dimensi dan abaikan thumbnail kecil jika yang Anda inginkan hanya foto utama.
"Alat mengekstrak lebih sedikit gambar daripada yang saya harapkan." Paling sering, konten yang "hilang" sebenarnya bukan gambar melainkan ilustrasi vektor: ekspor Adobe Illustrator yang ditanam sebagai operator gambar alih-alih sebagai raster. Konten vektor bukan XObject Gambar dan tidak bisa diekstrak sebagai gambar. Satu-satunya cara untuk menangkapnya sebagai raster adalah merender halaman menggunakan alat Konversi PDF ke Gambar. Kasus lainnya adalah teks yang tampak seperti gambar (judul bergaya yang dirender dengan font); teks pun bukan gambar.
"Gambar hasil ekstraksi opak, padahal versi di dokumen berlatar transparan." Dokumen menggunakan SMask terpisah untuk transparansi; XObject berwarna saja bersifat opak. Rekonstruksi mask lembut ke dalam keluaran dilepaskan ke perkakas desktop karena terkadang destruktif (membakar warna latar ke dalam gambar). Untuk sekarang, sunting PNG-nya di perkakas yang mendukung penghapusan latar otomatis, atau ambil mask lembut secara terpisah dari galeri jika Anda memerlukan bentuk alfa.
"Beberapa gambar terlihat beresolusi rendah." PDF sering melakukan downsampling pada gambar saat penanaman demi menjaga ukuran berkas tetap terkendali. Foto selebar 4000 piksel yang diimpor ke dokumen lalu dilewatkan "Reduce File Size" Acrobat bisa berakhir tersimpan pada lebar 800 piksel. Ekstraksi mengembalikan resolusi yang tersimpan, bukan aslinya. Berkas dengan resolusi kamera asli hanya bisa dipulihkan dari sumber, bukan dari PDF.
"Dua gambar hasil ekstraksi tampak seperti ubin dari satu gambar yang lebih besar." Sebagian generator PDF memotong gambar besar menjadi kisi-kisi ubin, terutama bila sumbernya melewati ambang ukuran halaman. Ubinnya muncul sebagai XObject terpisah; menyusun ulang gambar utuh menuntut Anda menggabungkannya kembali di perkakas desktop yang mengetahui tata letak halaman. Pada 2026 hal ini jarang terjadi karena pustaka PDF modern tidak lagi melakukan tiling secara default, tetapi dokumen lama kadang masih menampakkannya.
"PDF-nya 100 halaman tetapi hanya beberapa gambar yang terekstrak." Banyak PDF seluruhnya tersusun dari teks dan konten vektor. Dokumen teks murni mengandung nol gambar tertanam, berapa pun jumlah halamannya. Bila Anda menginginkan setiap halaman sebagai gambar, gunakan alat Konversi PDF ke Gambar saja, yang merender setiap halaman menjadi satu PNG atau JPG dan menangkap teks dan vektor sekaligus.
"Gambar CMYK warnanya salah setelah ekstraksi." Dalam arti ketat tidak; ekstraksi mengonversi CMYK ke RGB untuk tampilan layar, dan tampilan di layar bersifat perkiraan karena tujuannya tanpa profil cetak. Untuk reproduksi yang setia kepada cetakan, jangan menempuh jalur bolak-balik via ekstraksi PNG. Simpan PDF asli dan gunakan alur cetak yang membaca CMYK langsung.

Ekstraksi peramban saja versus cloud

Layanan ekstraksi gambar berbasis cloud yang memenuhi hasil pencarian teratas (Smallpdf, ILovePDF, PDF24 web, Sejda, CleverPDF) semuanya mengunggah PDF ke server mereka, men-decode di sisi server, dan mengirim ZIP kembali ke peramban Anda. Kebijakan privasi mereka biasanya berkomitmen untuk menghapus dalam satu jam dan menggunakan TLS saat transit, dan tekanan reputasi komersial pada operator besar memang nyata. Tak satu pun hal itu mengubah fakta struktural sederhana bahwa dokumen Anda dan setiap gambar di dalamnya sempat singgah di penyimpanan orang lain dan melewati perangkat lunak mereka. Untuk materi sensitif (rekam medis, mutasi keuangan, draf internal, apa pun yang dilindungi NDA), sikap terbaik adalah jangan biarkan berkas keluar dari perangkat sejak awal.

Alat ini berjalan sepenuhnya di tab peramban. PDF.js menguraikan PDF secara lokal, men-decode gambar secara lokal, menulisnya ke canvas lokal, dan memicu unduhan lokal. Tidak ada permintaan jaringan yang dipicu setelah pemuatan halaman awal. Buktinya tersedia di peramban mana pun: buka panel Jaringan di alat pengembang sebelum mengklik ekstrak, jalankan ekstraksi, lalu amati bahwa tidak ada permintaan apa pun yang dipicu dengan berkas atau konten gambar Anda. Biaya pemrosesan di peramban adalah PDF yang sangat besar (ratusan megabyte) lebih lambat daripada di server cepat, tetapi sikap privasi berbeda secara kategoris. Batas 50 MB di alat ini dipasang untuk melindungi perangkat seluler dari kehabisan heap, bukan karena arsitekturnya tidak mampu menangani berkas yang lebih besar di peramban desktop.

Pertanyaan yang lebih sering diajukan

Apa bedanya ini dengan "PDF ke JPG" atau "PDF ke gambar"?

Dua operasi yang benar-benar berbeda. "PDF ke gambar" meraster tiap halaman menjadi satu gambar, menangkap teks, vektor, dan gambar sebagai piksel datar; keluarannya adalah gambar halaman. "Ekstrak gambar" mengeluarkan objek gambar individu yang ditanam penulis ke dalam berkas; keluarannya adalah gambar yang ada di dalam halaman. Untuk laporan 10 halaman dengan tiga foto di halaman 2 dan 7, "PDF ke gambar" mengembalikan sepuluh berkas (satu per halaman); "Ekstrak gambar" mengembalikan tiga (foto-foto itu). Gunakan alat Konversi PDF ke Gambar untuk jenis pertama.

Kenapa gambar hasil ekstraksi berbentuk PNG padahal aslinya JPEG?

Pipeline saat ini melewatkan setiap gambar lewat canvas HTML, menghasilkan bitmap yang sudah didekode, lalu menyandi ulang bitmap tersebut sebagai PNG untuk mempertahankan transparansi bila ada. PNG bersifat lossless: kerugian kuantisasi JPEG sudah membatu di bitmap dan dipertahankan persis, tanpa putaran kuantisasi kedua. Berkas PNG keluaran lebih besar daripada byte JPEG aslinya, tetapi mutunya tidak menurun. Mode di masa depan yang menulis byte JPEG mentah langsung (setara pdfimages -j) ada di daftar keinginan; keuntungannya adalah berkas yang lebih kecil, bukan mutu lebih tinggi.

Apakah alat menemukan semua gambar, termasuk yang digunakan sebagai latar atau inline?

Ya. Alat menelusuri daftar operator halaman dan menyelesaikan baik XObject Gambar bernama (operator gambar Do) maupun gambar inline yang ditanam langsung di aliran konten di antara operator BI, ID, dan EI. Banyak alat ekstraksi melewatkan gambar inline karena mereka hanya menelusuri tabel XObject; alat ini tidak. Mask stensil (ImageMask bernilai true) juga dilaporkan, walaupun mereka lebih merupakan siluet daripada gambar dan hanya berguna dalam kasus terbatas.

Berapa besar PDF yang bisa saya proses?

Sampai 50 MB pada implementasi saat ini. Batas itu ditentukan oleh tekanan memori peramban di perangkat seluler: PDF besar menahan dokumen yang sudah diuraikan dan gambar yang sudah didekode sekaligus di memori, dan melampaui heap yang tersedia di perangkat akan membuat OS menutup tab. Peramban desktop biasanya dapat menangani jauh lebih banyak; batas atas ini sengaja konservatif demi keamanan. Untuk dokumen sangat besar, pdfimages -all dari poppler-utils di desktop adalah alat yang tepat.

Apakah ekstraksi mengubah hak cipta gambarnya?

Tidak. Gambar yang tertanam di PDF tetap mempertahankan hak yang dimiliki penulis dokumen, fotografer, atau pemegang lisensi. Mengekstrak gambar dari PDF yang Anda akses secara legal secara mekanis setara dengan mengambil tangkapan layarnya; apa yang Anda lakukan terhadap berkas hasil ekstraksi tunduk pada aturan hak cipta yang sama seperti sumbernya. Penggunaan untuk referensi pribadi biasanya tidak menjadi soal; redistribusi atau pemakaian komersial bergantung pada ketentuan lisensi sumbernya.

Apakah ada padanan desktop atau baris perintah?

Ada, dua yang kokoh. pdfimages dari poppler-utils adalah padanan terdekat: pdfimages -all input.pdf prefix- mengekstrak tiap gambar dalam pengkodean asli bila memungkinkan. Pasang dengan brew install poppler di macOS, apt install poppler-utils di Debian atau Ubuntu, atau unduh biner Windows dari situs proyek. Yang lain adalah mutool extract dari MuPDF, yang mengekstrak gambar dan font bersamaan. Keduanya lokal, gratis, dan dirawat dengan baik.