Estrattore gratuito di immagini da PDF
Estrai istantaneamente tutte le immagini incorporate dai file PDF. Visualizza in anteprima le immagini con le loro dimensioni e scaricale singolarmente o in ZIP.
Supporta PDF · fino a 50 MB
Come funziona
- Carica PDFSeleziona o trascina il tuo file PDF nel browser. Nessun caricamento sul server.
- Estrazione automaticaLo strumento analizza il PDF ed estrae tutte le immagini incorporate con le loro dimensioni.
- Scarica immaginiScarica le immagini singolarmente o raggruppale in un archivio ZIP.
Perché estrarre immagini dai PDF?
Estrarre immagini dai PDF è utile per riutilizzare i contenuti, riciclare grafica per nuovi documenti o archiviare risorse visive importanti. Le immagini vengono estratte nella qualità originale, consentendone il riutilizzo senza perdite.
Caratteristiche
- Estrazione completaEstrae tutte le immagini incorporate dal PDF, comprese foto, loghi e illustrazioni.
- Qualità preservataLe immagini vengono estratte nella risoluzione e qualità originali senza ricompressione.
- Anteprima immaginiVisualizza in anteprima ogni immagine con le sue dimensioni prima del download.
- Download individuale o in bloccoScarica le immagini una per una o tutte insieme in un singolo archivio ZIP.
- Visualizzazione dei metadatiVisualizza dimensioni, formato e peso di ogni immagine estratta.
- PrivacyL'estrazione avviene interamente nel tuo browser. Nessun file viene caricato sul server.
- VeloceEstrai tutte le immagini in pochi secondi grazie all'elaborazione locale in JavaScript.
Domande frequenti
La qualità delle immagini sarà preservata?
Sì. Le immagini vengono estratte nella stessa qualità e risoluzione con cui sono incorporate nel PDF, senza ricompressione.
Quali formati di immagine vengono estratti?
Lo strumento estrae le immagini nel loro formato nativo memorizzato nel PDF, tipicamente JPEG o PNG a seconda del documento originale.
Posso vedere le dimensioni prima del download?
Sì. Ogni immagine viene mostrata in anteprima con le sue dimensioni esatte in pixel, permettendoti di scegliere quelle che ti servono.
Posso scaricare le immagini singolarmente?
Sì. Clicca sull'immagine che vuoi scaricare o usa il pulsante ZIP per ottenerle tutte in una volta.
Sono inclusi sfondi e decorazioni?
Vengono estratte tutte le immagini effettivamente incorporate nel PDF, compresi sfondi, decorazioni e loghi.
I miei PDF vengono caricati su un server?
No. Tutta l'estrazione avviene localmente nel tuo browser tramite PDF.js. I tuoi PDF non lasciano mai il tuo dispositivo, garantendo piena privacy e sicurezza.
Qual è la dimensione massima del file?
Il limite è di 50 MB per PDF, che copre la maggior parte dei documenti. Per file più grandi, prova prima a dividere il PDF.
Funziona su mobile?
Sì. Lo strumento funziona sui moderni browser mobili, anche se i file più grandi potrebbero essere elaborati più lentamente.
Cosa significa davvero «estrarre immagini da un PDF»
L'espressione di tutti i giorni «estrarre immagini da un PDF» è ambigua, e l'ambiguità conta per ciò che lo strumento consegna. Due operazioni davvero distinte vivono dietro le stesse parole. La prima consiste nell'estrarre gli oggetti immagine incorporati: scorrere il documento, identificare ogni XObject Immagine (o immagine in linea) che l'autore ha collocato nel file e riscriverla come PNG indipendente. L'output è ciò che l'autore del documento ha effettivamente messo nel file, alla risoluzione in cui lo ha messo. La seconda consiste nel rendere le pagine come immagini: rasterizzare ogni pagina del PDF in una sola figura a una scelta DPI, catturando testo, forme vettoriali e immagini insieme come pixel appiattiti. L'output è un'immagine della pagina, non l'immagine dentro la pagina.
Questo strumento fa il primo tipo. Per un documento di 10 pagine con tre fotografie incorporate fra le pagine 2 e 7, produce tre file immagine, non dieci immagini di pagina. Se vuoi il secondo tipo, il rendering di pagina come immagine, usa lo strumento PDF a Immagine. Distinguere le due operazioni è il punto di confusione più comune quando gli utenti arrivano per la prima volta: i servizi «PDF in JPG» fanno di solito il secondo tipo, e molti utenti li trovano quando volevano il primo. Il conteggio degli output è la spia: l'estrazione restituisce il numero di immagini incorporate; il rendering di pagina restituisce il numero di pagine.
Come funziona questo strumento
Lo strumento esegue PDF.js, il renderer PDF in JavaScript puro di Mozilla, lo stesso motore che alimenta l'anteprima PDF integrata di Firefox. Quando selezioni un PDF, la File API del browser consegna i byte a PDF.js senza alcun andata e ritorno di rete. PDF.js analizza la tabella di riferimenti incrociati, il trailer e il catalogo del documento all'interno di un Web Worker, in modo che il thread principale resti reattivo. Per ogni pagina, lo strumento richiede l'elenco degli operatori e scorre ogni chiamata paintImageXObject e paintInlineImageXObject. Per ogni operatore di immagine risolve l'XObject Immagine reale tramite la cache di oggetti di PDF.js, lo decodifica secondo il suo filtro e spazio di colore, disegna la bitmap su un canvas fuori schermo ed esporta il canvas come PNG.
Larghezza, altezza e dimensione approssimativa del file vengono registrate per la vista a galleria. Quando fai clic su «Scarica tutto come ZIP», JSZip raggruppa ogni immagine estratta in un singolo archivio in memoria, e l'ancora di download del browser avvia il salvataggio. Nessuna parte di questo processo effettua una richiesta di rete. Puoi verificarlo direttamente: apri gli strumenti per sviluppatori del browser sul pannello Rete prima di selezionare un PDF, esegui l'estrazione e osserva che nulla lascia la tua macchina. Il motore PDF.js e la libreria JSZip vengono scaricati una sola volta alla prima visita e messi in cache dal browser, quindi le visite successive caricano istantaneamente e funzionano interamente offline.
Come i PDF conservano le immagini
Un file PDF è un albero di oggetti. L'albero delle pagine fa riferimento a oggetti pagina; ogni oggetto pagina fa riferimento a un flusso di contenuto e a un dizionario di risorse. La voce XObject del dizionario di risorse associa nomi brevi (come Im1, Im2) a flussi XObject Immagine. Il flusso di contenuto le dipinge con l'operatore Do: una sequenza come q 200 0 0 150 50 300 cm /Im1 Do Q significa «imposta la trasformazione, dipingi l'immagine chiamata Im1 dalle risorse, ripristina la trasformazione». Ogni XObject Immagine porta con sé Width e Height (dimensioni in pixel), ColorSpace (come interpretare ogni componente), BitsPerComponent (1, 2, 4, 8 o 16) e Filter (la catena di codec che comprime i byte).
Per un estrattore il campo Filter è il più importante, perché determina se i byte possono essere scritti direttamente o devono prima essere decodificati. In pratica compaiono sei filtri. DCTDecode conserva i byte come un file JPEG completo, pronto da scrivere con estensione .jpg; rappresenta circa il 60-70 percento delle immagini nei PDF a colori. JPXDecode è JPEG2000, raro nei documenti per il grande pubblico ma presente nelle pipeline di stampa di fascia alta. CCITTFaxDecode è la compressione fax Gruppo 3 o Gruppo 4 per scansioni in bianco e nero a un bit, frequente negli archivi aziendali digitalizzati. JBIG2Decode è il successore più efficiente usato dal passaggio «Riduci dimensioni file» di Acrobat e da ABBYY FineReader. FlateDecode è dato pixel grezzo compresso con zlib, comune in grafica, schermate e PDF generati da strumenti di autoria orientati al web. RunLengthDecode è un semplice RLE usato soprattutto in PDF più vecchi o costruiti a mano.
Immagini in linea, il caso facile da perdere
La specifica PDF permette di incorporare piccole immagini direttamente nel flusso di contenuto di una pagina, fra gli operatori BI (begin image), ID (image data) ed EI (end image), senza che diventino un XObject con nome. Era un'ottimizzazione dei primi anni 1990 per grafica minuta come loghi, icone ed elenchi puntati, pensata per evitare il costo di un oggetto separato per un'immagine da poche centinaia di byte. Per il resto il formato è identico a un XObject Immagine: gli stessi campi di filtro, spazio di colore e dimensione, scritti in forma compatta.
Molti strumenti di «estrazione immagini» mancano completamente le immagini in linea perché percorrono solo la tabella XObject del dizionario di risorse e si fermano lì. Questo strumento percorre l'elenco degli operatori di pagina e le intercetta tramite paintInlineImageXObject. La conseguenza pratica: i PDF con loghi aziendali nell'intestazione (spesso in linea) e i PDF generati da strumenti di autoria più vecchi che usano immagini in linea per le icone restituiscono più immagini di quanto una semplice scansione XObject suggerirebbe. Se stai confrontando i conteggi di estrazione con un altro strumento, è uno dei motivi delle differenze. Gli altri motivi, trattati più avanti, sono l'inclusione di grafica decorativa, maschere stencil e filigrane che alcuni strumenti filtrano per impostazione predefinita.
Maschere morbide, stencil e trasparenza
La trasparenza di immagine in PDF è raramente codificata all'interno dell'immagine stessa. Invece, la pagina compone un'immagine a colori con una «maschera morbida» monocanale separata (la voce SMask nel dizionario XObject). Il risultato visibile in un lettore è la composizione; l'immagine a colori estratta da sola è opaca. Per immagini estratte destinate al riutilizzo visivo, ciò può produrre sorprese: un logo estratto da un PDF in cui l'autore ha usato una SMask può apparire come un rettangolo opaco invece che come un PNG con sfondo trasparente. Il comportamento attuale è estrarre l'XObject Immagine a colori senza ricomporre la SMask, in linea con il comportamento di pdfimages -png da riga di comando e con quello di ogni servizio di estrazione cloud che abbiamo provato.
Un concetto correlato è il flag ImageMask. Quando ImageMask è true, i byte non sono dati pixel; sono uno stencil a un bit che definisce dove va applicato il colore di riempimento corrente. Estrarre un ImageMask isolatamente produce una silhouette in bianco e nero invece di un'immagine utilizzabile. Lo strumento li riporta nella galleria per completezza, ma la loro utilità è ridotta a meno che tu non sia specificamente interessato alla silhouette. Ordina per dimensioni e ignora gli stencil piccoli se ingombrano la vista. La ricomposizione delle maschere morbide in PNG con canale alfa è una funzione in lista dei desideri ma attualmente lasciata agli strumenti desktop, perché a volte è distruttiva: la ricomposizione cuoce il colore di sfondo dentro il risultato, cosa che può essere o non essere quello che vuoi.
Spazi di colore e loro effetto sull'output
Nel 2026 la maggior parte dei PDF usa DeviceRGB (simile a sRGB) o DeviceCMYK. PDF.js decodifica entrambi in modo trasparente, convertendo CMYK in RGB prima di dipingere sul canvas. Il PNG estratto è perciò sempre RGB, anche quando la sorgente era CMYK. Per il riutilizzo puramente visivo è corretto: un'immagine CMYK è destinata alla stampa e non si visualizzerebbe correttamente su un sito senza conversione. Per la riproduzione a stampa la conversione è approssimata, perché il canvas di destinazione non ha un profilo di stampa associato. Gli utenti che mirano alla stampa dovrebbero conservare il PDF originale ed evitare il giro per l'estrazione; la fedeltà cromatica sarà migliore se la pipeline di stampa legge l'immagine CMYK direttamente.
I profili di colore ICCBased allegati alle immagini PDF vengono rispettati da PDF.js durante la decodifica, quindi il PNG estratto approssima l'aspetto previsto in condizioni di visione standard. Gli spazi di colore indicizzati (immagini palette, il tipico caso a 256 colori ereditato dalle importazioni GIF) vengono de-indicizzati in fase di estrazione, producendo un PNG a colori pieni invece che basato su palette. È il comportamento giusto per il riutilizzo visivo, ma significa che la dimensione del file di un PNG estratto può essere maggiore della dimensione dell'immagine indicizzata originale all'interno del PDF. Il compromesso è inevitabile nella pipeline basata su canvas, e preferiamo la fedeltà alla compattezza; chi vuole i file più piccoli possibili può poi passare l'output dal Compressore di Immagini.
Flussi di lavoro reali che motivano l'estrazione di immagini
- Riutilizzare grafica per slide o web. Un designer o un responsabile marketing riceve la consegna di un cliente come PDF e gli servono le fotografie e i diagrammi per una presentazione, una rifacitura di sito o un post sui social. Il clic destro «Salva immagine» di Acrobat funziona una immagine per volta; per un report di 60 pagine con 40 immagini sono mezz'ora di clic contro un singolo trascinamento in una scheda del browser e un solo download ZIP.
- Costruire un catalogo di immagini. Un archivista, bibliotecario o auditor di contenuti dispone di un corpus di PDF e deve estrarre le immagini per catalogarle, scrivere testi alternativi o costruire un indice di ricerca visivo. L'estrazione in lotti seguita dal download ZIP è il flusso standard; integrare uno script che attraversa cartelle sul desktop è facile quando il lato browser ha già dimostrato che l'estrazione restituisce ciò che ci si aspetta.
- Portfolio fotografici consegnati come PDF. I fotografi talvolta consegnano il lavoro al cliente come galleria PDF invece che come file singoli, in particolare nelle sessioni ritratto e nei reportage di eventi. Il cliente vuole i file singoli. L'estrazione li restituisce alla risoluzione incorporata, che di solito è la risoluzione che il fotografo ha scelto per la versione a stampa.
- Recuperare immagini da un PDF problematico. Un PDF non si visualizza correttamente in un lettore o si comporta in modo anomalo, ma la struttura sottostante è abbastanza intatta da permettere a PDF.js di analizzare i dizionari di risorse. L'estrazione recupera le immagini incorporate anche quando il documento per il resto si comporta male. Scenario di salvataggio frequente per file corrotti in transito o salvati con firme incoerenti.
- Revisione forense e legale. I revisori che preparano una discovery o un catalogo probatorio hanno bisogno che ogni immagine di un insieme di documenti sia elencata ed esportabile. La garanzia «tutte le immagini incorporate» conta: perderne una è un problema. L'estrazione basata sull'elenco di operatori (invece che solo sulla tabella XObject) è l'approccio giusto, perché cattura immagini in linea che alcune pipeline lasciano cadere silenziosamente.
- Pre-elaborazione OCR. Alcune pipeline OCR lavorano meglio su immagini estratte che su pagine renderizzate, in particolare quando le immagini di origine sono scansioni ad alta risoluzione incorporate in un layout di pagina a risoluzione inferiore. L'estrazione alla risoluzione nativa preserva il dettaglio OCRizzabile che il rendering di pagina a 150 o 300 DPI perderebbe.
- Ricerca accademica e giornalistica. Grafici, fotografie e diagrammi nei PDF vengono estratti per citazioni in fair use, verifica dei fatti rispetto alle fonti originali o confronto tra documenti. I ricercatori vogliono spesso anche la risoluzione nativa dell'immagine incorporata per individuare manipolazioni o artefatti di compressione che il rendering di pagina maschererebbe.
Insidie comuni e cosa significano
- «Lo strumento ha estratto più immagini di quante mi aspettassi.» I PDF contengono spesso immagini che non vedi direttamente: sfondi decorativi ripetuti su più pagine, filigrane, ornamenti di intestazione e piè di pagina, maschere di trasparenza (che tecnicamente sono XObject Immagine) e minuscole grafiche in linea come caselle di selezione. Un'estrazione completa le restituisce tutte. Ordina la galleria per dimensioni e ignora le miniature piccole se volevi soltanto le fotografie principali.
- «Lo strumento ha estratto meno immagini di quante mi aspettassi.» Nella maggior parte dei casi il contenuto «mancante» non era un'immagine bensì un'illustrazione vettoriale: un export di Adobe Illustrator incorporato come operatori di disegno invece che come raster. Il contenuto vettoriale non è un XObject Immagine e non è estraibile come immagine. L'unico modo per catturarlo come raster è rendere la pagina con lo strumento PDF a Immagine. L'altro caso è del testo che sembra un'immagine (un titolo stilizzato reso con un font); anche il testo non è un'immagine.
- «L'immagine estratta è opaca ma la versione nel documento ha lo sfondo trasparente.» Il documento usa una SMask separata per la trasparenza; il solo XObject a colori è opaco. La ricomposizione delle maschere morbide nell'output è lasciata agli strumenti desktop perché a volte è distruttiva (cuoce il colore di sfondo dentro l'immagine). Per ora, modifica il PNG in uno strumento che supporti la rimozione automatica dello sfondo, oppure preleva separatamente la maschera morbida dalla galleria se ti serve la forma alfa.
- «Alcune immagini sembrano a bassa risoluzione.» I PDF spesso sottocampionano le immagini al momento dell'incorporazione per tenere gestibile la dimensione del file. Una fotografia di 4000 pixel di larghezza importata in un documento e poi passata per «Riduci dimensioni file» di Acrobat può finire memorizzata a 800 pixel di larghezza. L'estrazione restituisce la risoluzione memorizzata, non quella originale. Il file alla risoluzione originale della fotocamera può essere recuperato solo dalla fonte, non dal PDF.
- «Due immagini estratte sembrano tasselli di un'immagine più grande.» Alcuni generatori di PDF tagliano le immagini grandi in una griglia di tasselli, in particolare quando la sorgente supera una soglia di dimensione di pagina. I tasselli appaiono come XObject separati; ricostruire l'immagine intera richiede di riassemblarli in uno strumento desktop con conoscenza del layout di pagina. È raro nel 2026, dato che le librerie PDF moderne non fanno più tiling per impostazione predefinita, ma documenti più vecchi lo mostrano ancora occasionalmente.
- «Il PDF ha 100 pagine ma sono state estratte solo poche immagini.» Molti PDF sono interamente composti di testo e contenuto vettoriale. Un documento puramente testuale contiene zero immagini incorporate, indipendentemente dal numero di pagine. Se volevi ogni pagina come immagine, usa lo strumento PDF a Immagine, che rende ogni pagina come un singolo PNG o JPG catturando testo e vettori insieme.
- «L'immagine CMYK ha colori sbagliati dopo l'estrazione.» In senso stretto no; l'estrazione converte CMYK in RGB per la visualizzazione a schermo, e la resa a schermo è approssimata perché la destinazione non ha un profilo di stampa. Per una riproduzione fedele alla stampa, non fare il giro dall'estrazione PNG. Conserva il PDF originale e usa un flusso di stampa che legga il CMYK direttamente.
Estrazione solo nel browser contro estrazione in cloud
I servizi cloud di estrazione immagini che dominano i risultati di ricerca (Smallpdf, ILovePDF, PDF24 web, Sejda, CleverPDF) caricano tutti il PDF sui loro server, decodificano lato server e restituiscono uno ZIP al tuo browser. Le loro informative sulla privacy in genere si impegnano alla cancellazione entro un'ora e a TLS in transito, e la pressione di reputazione commerciale sui grandi operatori è reale. Nulla di tutto questo cambia il semplice fatto strutturale che il tuo documento, e ogni immagine al suo interno, è rimasto brevemente sull'archiviazione di qualcun altro ed è passato per il loro software. Per materiale sensibile (cartelle cliniche, estratti finanziari, bozze interne, qualsiasi cosa coperta da NDA) la postura migliore è non far uscire affatto il file dal dispositivo.
Questo strumento gira interamente nella scheda del browser. PDF.js analizza il PDF in locale, decodifica le immagini in locale, le scrive su un canvas locale e avvia un download locale. Nessuna richiesta di rete parte dopo il caricamento iniziale della pagina. La prova è disponibile in qualunque browser: apri il pannello Rete degli strumenti per sviluppatori prima di fare clic su estrai, esegui l'estrazione e osserva che nessuna richiesta parte con il tuo file o con il contenuto delle tue immagini. Il costo dell'elaborazione nel browser è che i PDF molto grandi (centinaia di megabyte) sono più lenti di quanto sarebbero su un server veloce, ma la postura di privacy è categoricamente diversa. Il limite di 50 MB in questo strumento è impostato per proteggere i dispositivi mobili dall'esaurimento di memoria, non perché l'architettura non possa gestire file più grandi nei browser desktop.
Altre domande frequenti
In cosa è diverso da «PDF in JPG» o «PDF in immagine»?
Due operazioni davvero diverse. «PDF in immagine» rasterizza ogni pagina in una sola figura catturando testo, vettori e immagini come pixel appiattiti; l'output è un'immagine della pagina. «Estrai immagini» estrae i singoli oggetti immagine che l'autore ha incorporato nel file; l'output è l'immagine dentro la pagina. Per un report di 10 pagine con tre fotografie fra le pagine 2 e 7, «PDF in immagine» restituisce dieci file (uno per pagina); «Estrai immagini» ne restituisce tre (le fotografie). Per il primo tipo usa lo strumento PDF a Immagine.
Perché le immagini estratte sono PNG quando le originali erano JPEG?
La pipeline attuale passa ogni immagine attraverso un canvas HTML, ottenendo una bitmap decodificata, e poi ricodifica quella bitmap come PNG per preservare la trasparenza dove presente. PNG è senza perdite: le perdite di quantizzazione del JPEG sono già impresse nella bitmap e vengono preservate esattamente, senza un secondo giro di quantizzazione. I file PNG di output sono più grandi dei byte JPEG originali, ma la qualità non degrada. Una futura modalità che scriva direttamente i byte JPEG grezzi (equivalente a pdfimages -j) è in lista dei desideri; il guadagno è in file più piccoli, non in qualità superiore.
Lo strumento trova tutte le immagini, comprese quelle usate come sfondo o in linea?
Sì. Lo strumento scorre l'elenco degli operatori di pagina e risolve sia gli XObject Immagine nominati (operatore di pittura Do) sia le immagini in linea incorporate direttamente nel flusso di contenuto fra gli operatori BI, ID ed EI. Molti strumenti di estrazione mancano le immagini in linea perché percorrono solo la tabella XObject; questo no. Anche le maschere stencil (ImageMask true) sono riportate, sebbene siano silhouette più che immagini e siano utili solo in casi limitati.
Quanto grande può essere il PDF?
Fino a 50 MB nell'implementazione attuale. Il limite è dato dalla pressione di memoria del browser sui dispositivi mobili: i PDF grandi tengono in memoria sia il documento analizzato sia le immagini decodificate, e superare l'heap disponibile del dispositivo provoca la chiusura della scheda da parte del sistema. I browser desktop in genere ne reggono molti di più; il tetto è prudenziale per sicurezza. Per documenti molto grandi, lo strumento desktop pdfimages -all di poppler-utils è quello giusto.
L'estrazione cambia il copyright delle immagini?
No. Le immagini incorporate in un PDF mantengono i diritti che spettano all'autore del documento, al fotografo o al titolare della licenza. Estrarre un'immagine da un PDF a cui hai accesso legale è meccanicamente equivalente a farne uno screenshot; ciò che fai con il file estratto è regolato dalle stesse norme di copyright della fonte. L'uso come riferimento personale è in genere non controverso; la ridistribuzione o l'uso commerciale dipendono dai termini di licenza della fonte.
C'è un equivalente desktop o da riga di comando?
Sì, due solidi. pdfimages di poppler-utils è l'equivalente più vicino: pdfimages -all input.pdf prefix- estrae ogni immagine nella sua codifica originale quando possibile. Installalo con brew install poppler su macOS, apt install poppler-utils su Debian o Ubuntu, oppure scarica i binari Windows dal sito del progetto. L'altro è mutool extract di MuPDF, che estrae immagini e font insieme. Entrambi sono locali, gratuiti e ben mantenuti.