Extrator gratuito de imagens de PDF
Extraia instantaneamente todas as imagens incorporadas em arquivos PDF. Visualize as imagens com suas dimensões e baixe-as individualmente ou em ZIP.
Suporta PDF · até 50 MB
Como funciona
- Carregar PDFSelecione ou solte seu arquivo PDF no navegador. Sem uploads para servidor.
- Extração automáticaA ferramenta analisa o PDF e extrai todas as imagens incorporadas com suas dimensões.
- Baixar imagensBaixe as imagens individualmente ou agrupe-as em um arquivo ZIP.
Por que extrair imagens de PDFs?
Extrair imagens de PDFs é útil para reaproveitar conteúdo, reutilizar gráficos para novos documentos ou arquivar recursos visuais importantes. As imagens são extraídas em sua qualidade original, permitindo reusá-las sem perdas.
Recursos
- Extração completaExtrai todas as imagens incorporadas no PDF, incluindo fotos, logotipos e ilustrações.
- Qualidade preservadaAs imagens são extraídas em sua resolução e qualidade originais, sem recompressão.
- Pré-visualização de imagensVisualize cada imagem com suas dimensões antes de fazer o download.
- Download individual ou em loteBaixe as imagens uma a uma ou todas em um único arquivo ZIP.
- Exibição de metadadosVeja as dimensões, o formato e o tamanho de cada imagem extraída.
- PrivacidadeA extração acontece totalmente no seu navegador. Nenhum arquivo é enviado a servidores.
- RápidoExtraia todas as imagens em segundos com processamento local em JavaScript.
Perguntas frequentes
A qualidade das imagens será preservada?
Sim. As imagens são extraídas com a mesma qualidade e resolução com que estão incorporadas no PDF, sem recompressão.
Quais formatos de imagem são extraídos?
A ferramenta extrai as imagens em seu formato nativo armazenado dentro do PDF, normalmente JPEG ou PNG, conforme o documento original.
Posso ver as dimensões antes do download?
Sim. Cada imagem é exibida em pré-visualização com suas dimensões exatas em pixels, permitindo escolher as que você precisa.
Posso baixar as imagens individualmente?
Sim. Clique na imagem que deseja baixar ou use o botão ZIP para obter todas de uma vez.
Os fundos e decorações são incluídos?
Todas as imagens realmente incorporadas ao PDF são extraídas, incluindo fundos, decorações e logotipos.
Meus PDFs são enviados para um servidor?
Não. Toda a extração acontece localmente no seu navegador com o PDF.js. Seus PDFs nunca saem do seu dispositivo, garantindo privacidade e segurança totais.
Qual é o tamanho máximo do arquivo?
O limite é de 50 MB por PDF, o que cobre a maioria dos documentos. Para arquivos maiores, tente dividir o PDF primeiro.
Funciona em celular?
Sim. A ferramenta funciona em navegadores móveis modernos, embora arquivos maiores possam ser processados mais lentamente.
O que "extrair imagens de um PDF" realmente significa
A expressão cotidiana "extrair imagens de um PDF" é ambígua, e essa ambiguidade importa para o que a ferramenta efetivamente entrega. Duas operações genuinamente distintas vivem por trás das mesmas palavras. A primeira consiste em extrair os objetos de imagem incorporados: percorrer o documento, identificar cada XObject Imagem (ou imagem inline) que o autor colocou no arquivo, e escrever cada uma de volta como um PNG independente. A saída é o que o autor do documento de fato colocou no arquivo, na resolução em que colocou. A segunda consiste em renderizar páginas como imagens: rasterizar cada página do PDF em uma única figura num DPI escolhido, capturando texto, formas vetoriais e imagens juntos como pixels achatados. A saída é uma imagem da página, não a imagem dentro da página.
Esta ferramenta faz o primeiro tipo. Para um documento de 10 páginas com três fotografias incorporadas nas páginas 2 e 7, ela produz três arquivos de imagem, não dez imagens de página. Se você quer o segundo tipo, a renderização de página como imagem, use a ferramenta PDF para Imagem. Distinguir as duas operações é o ponto de confusão mais comum quando os usuários chegam pela primeira vez: serviços de "PDF para JPG" geralmente fazem o segundo tipo, e muitos usuários os encontram quando queriam o primeiro. A contagem de saída revela: a extração devolve o número de imagens incorporadas; a renderização de páginas devolve o número de páginas.
Como esta ferramenta funciona
A ferramenta executa o PDF.js, o renderizador de PDF em JavaScript puro da Mozilla, o mesmo motor que alimenta a pré-visualização integrada de PDF do Firefox. Quando você seleciona um PDF, a File API do navegador entrega os bytes ao PDF.js sem nenhuma ida e volta de rede. O PDF.js analisa a tabela de referência cruzada, o trailer e o catálogo do documento dentro de um Web Worker para que a thread principal continue responsiva. Para cada página, a ferramenta solicita a lista de operadores e percorre cada chamada paintImageXObject e paintInlineImageXObject. Para cada operador de imagem, ela resolve o XObject Imagem real através do cache de objetos do PDF.js, decodifica-o segundo seu filtro e espaço de cor, desenha o bitmap em um canvas fora da tela e exporta o canvas como PNG.
Largura, altura e tamanho aproximado do arquivo são registrados para a visualização em galeria. Quando você clica em "Baixar tudo como ZIP", o JSZip agrupa todas as imagens extraídas em um único arquivo em memória, e a âncora de download do navegador dispara o salvamento. Nenhuma parte deste processo faz uma requisição de rede. Você pode verificar diretamente: abra as ferramentas de desenvolvedor do navegador no painel Rede antes de selecionar um PDF, execute a extração e observe que nada sai da sua máquina. O motor PDF.js e a biblioteca JSZip são baixados uma única vez na primeira visita e armazenados em cache pelo navegador, de modo que visitas posteriores carregam instantaneamente e funcionam totalmente offline.
Como os PDF guardam imagens
Um arquivo PDF é uma árvore de objetos. A árvore de páginas referencia objetos página; cada objeto página referencia um fluxo de conteúdo e um dicionário de recursos. A entrada XObject do dicionário de recursos associa nomes curtos (como Im1, Im2) a fluxos XObject Imagem. O fluxo de conteúdo as desenha com o operador Do: uma sequência como q 200 0 0 150 50 300 cm /Im1 Do Q significa "define a transformação, desenha a imagem chamada Im1 a partir dos recursos, restaura a transformação". Cada XObject Imagem carrega Width e Height (dimensões em pixels), ColorSpace (como interpretar cada componente), BitsPerComponent (1, 2, 4, 8 ou 16) e Filter (a cadeia de codecs que comprime os bytes).
O campo Filter é o mais importante para um extrator, porque determina se os bytes podem ser escritos diretamente ou precisam ser decodificados primeiro. Seis filtros aparecem na prática. DCTDecode guarda os bytes como um arquivo JPEG completo, pronto para escrever com a extensão .jpg; isso é cerca de 60 a 70 por cento das imagens em PDF coloridos. JPXDecode é JPEG2000, raro em documentos de consumo mas presente em pipelines de impressão de alta gama. CCITTFaxDecode é a compressão fax Grupo 3 ou Grupo 4 para varreduras em preto e branco de um bit, comum em arquivos comerciais digitalizados. JBIG2Decode é o sucessor mais eficiente usado pelo "Reduzir Tamanho do Arquivo" do Acrobat e pelo ABBYY FineReader. FlateDecode são dados de pixel brutos comprimidos por zlib, comum em gráficos, capturas de tela e PDF de ferramentas de autoria voltadas para a web. RunLengthDecode é um RLE simples usado sobretudo em PDF mais antigos ou construídos à mão.
Imagens inline, o caso fácil de não perceber
A especificação PDF permite que imagens pequenas sejam incorporadas diretamente no fluxo de conteúdo de uma página, entre os operadores BI (begin image), ID (image data) e EI (end image), sem se tornarem um XObject nomeado. Foi uma otimização do início dos anos 1990 para gráficos muito pequenos como logotipos, ícones e marcadores, destinada a evitar o custo de um objeto separado para uma imagem de algumas centenas de bytes. O formato é por outro lado idêntico a um XObject Imagem: os mesmos campos de filtro, espaço de cor e dimensões, escritos em forma compacta.
Muitas ferramentas de "extração de imagens" perdem completamente as imagens inline porque percorrem a tabela XObject do dicionário de recursos e param ali. Esta ferramenta percorre a lista de operadores da página e as captura via paintInlineImageXObject. A consequência prática: PDF com logotipos corporativos no cabeçalho (comumente inline) e PDF de ferramentas de autoria mais antigas que usam imagens inline para ícones devolvem mais imagens do que uma varredura ingênua de XObjects sugeriria. Se você está comparando contagens de extração com outra ferramenta, este é um dos motivos das diferenças. As outras razões, cobertas mais abaixo, são a inclusão de gráficos decorativos, máscaras de estêncil e marcas d'água que algumas ferramentas filtram por padrão.
Máscaras suaves, estêncis e transparência
A transparência de imagem em PDF raramente é codificada dentro da própria imagem. Em vez disso, a página compõe uma imagem colorida com uma "máscara suave" de canal único separada (a entrada SMask do dicionário XObject). O resultado visível em um leitor é a composição; a imagem colorida extraída sozinha é opaca. Para imagens extraídas destinadas à reutilização visual, isso pode produzir surpresas: um logotipo extraído de um PDF onde o autor usou um SMask pode aparecer como um retângulo opaco em vez de um PNG de fundo transparente. O comportamento atual é extrair o XObject Imagem colorido sem recompor o SMask, o que coincide com o comportamento de pdfimages -png na linha de comando e com o comportamento de todos os serviços de extração em nuvem que testamos.
Um conceito relacionado é a flag ImageMask. Quando ImageMask é true, os bytes não são dados de pixels; são um estêncil de um bit que define onde a cor de preenchimento atual é aplicada. Extrair um ImageMask isoladamente produz uma silhueta em preto e branco em vez de uma figura utilizável. A ferramenta os reporta na galeria por completude, mas a utilidade deles é pequena a menos que você esteja especificamente interessado na silhueta. Ordene por dimensões e ignore estêncis pequenos se eles poluírem a visualização. Recompor máscaras suaves em PNG com canal alfa é uma funcionalidade na lista de desejos mas atualmente deixada para ferramentas de desktop, porque às vezes é destrutiva: recompor cozinha a cor de fundo dentro do resultado, o que pode ou não ser o que você quer.
Espaços de cor e seu efeito na saída
A maioria dos PDF em 2026 usa DeviceRGB (semelhante a sRGB) ou DeviceCMYK. O PDF.js decodifica ambos de forma transparente, convertendo CMYK em RGB antes de pintar no canvas. O PNG extraído é, portanto, sempre RGB, mesmo quando a fonte era CMYK. Para reutilização puramente visual isso está correto: uma imagem CMYK é destinada à impressão e não seria exibida corretamente em um site sem conversão. Para reprodução impressa, a conversão é aproximada porque o canvas de destino não tem um perfil de impressão anexado. Usuários voltados à impressão devem manter o PDF original e não fazer uma ida e volta pela extração; a fidelidade cromática será melhor quando o pipeline de impressão ler a imagem CMYK diretamente.
Perfis de cor ICCBased anexados a imagens PDF são respeitados pelo PDF.js durante a decodificação, então o PNG extraído aproxima a aparência prevista sob condições padrão de visualização. Espaços de cor indexados (imagens em paleta, o caso típico de 256 cores herdado de importações GIF) são desindexados durante a extração, produzindo um PNG em cores completas em vez de um baseado em paleta. Esse é o comportamento correto para reutilização visual, mas significa que o tamanho do arquivo de um PNG extraído pode ser maior que o tamanho da imagem indexada original dentro do PDF. O compromisso é inevitável no pipeline baseado em canvas, e preferimos fidelidade a compactação; usuários que querem os menores arquivos possíveis podem passar a saída pelo Compressor de Imagens depois.
Fluxos reais que motivam a extração de imagens
- Reaproveitar gráficos para slides ou web. Um designer ou profissional de marketing recebe a entrega de um cliente como PDF e precisa das fotografias e diagramas para uma apresentação, uma reformulação de site ou um post de rede social. O clique direito "salvar imagem" do Acrobat funciona uma imagem por vez; para um relatório de 60 páginas com 40 imagens, isso é meia hora de cliques contra um único arrastar e soltar em uma aba do navegador e um download ZIP único.
- Construir um catálogo de imagens. Um arquivista, bibliotecário ou auditor de conteúdo tem um corpus de PDF e precisa extrair as imagens para catalogar, escrever textos alternativos ou construir um índice de busca visual. A extração em lote seguida de download ZIP é o fluxo padrão; integrar com um script que percorre pastas no desktop é fácil quando o lado do navegador já provou que a extração devolve o que se espera.
- Portfólios fotográficos entregues como PDF. Fotógrafos ocasionalmente entregam trabalhos de cliente como uma galeria PDF em vez de arquivos individuais, sobretudo em sessões de retrato e cobertura de eventos. O cliente quer os arquivos individuais. A extração devolve-os na resolução incorporada, que normalmente é a resolução que o fotógrafo escolheu para a versão impressa.
- Recuperar imagens de um PDF problemático. Um PDF não renderiza corretamente em um leitor, ou se comporta de forma errática, mas a estrutura subjacente está íntegra o suficiente para que o PDF.js consiga analisar os dicionários de recursos. A extração recupera as imagens incorporadas mesmo quando o documento se comporta mal nos demais aspectos. É um cenário comum de resgate para arquivos corrompidos em trânsito ou salvos com assinaturas incoerentes.
- Revisão forense e jurídica. Revisores preparando descoberta de provas ou catalogação probatória precisam que cada imagem de um conjunto de documentos esteja listada e exportável. A garantia de "todas as imagens incorporadas" importa: perder uma é problema. Extração baseada na lista de operadores (em vez de apenas na tabela XObject) é a abordagem correta, pois captura imagens inline que alguns pipelines deixam passar silenciosamente.
- Pré-processamento de OCR. Alguns pipelines de OCR funcionam melhor com imagens extraídas do que com páginas renderizadas, sobretudo quando as imagens de origem são varreduras de alta resolução incorporadas em um layout de página de menor resolução. A extração na resolução nativa preserva o detalhe OCRizável que a renderização de página a 150 ou 300 DPI perderia.
- Pesquisa acadêmica e jornalística. Gráficos, fotografias e diagramas em PDF são extraídos para citação em uso justo, verificação de fatos contra as fontes originais ou comparação entre documentos. Pesquisadores também costumam querer a resolução nativa da imagem incorporada para detectar manipulação ou artefatos de compressão que a renderização de página obscureceria.
Armadilhas comuns e o que significam
- "A ferramenta extraiu mais imagens do que eu esperava." PDF frequentemente contêm imagens que você não vê diretamente: fundos decorativos repetidos em várias páginas, marcas d'água, ornamentos de cabeçalho e rodapé, máscaras de transparência (que tecnicamente são XObjects Imagem) e gráficos inline minúsculos como caixas de seleção. Uma extração completa devolve todos eles. Ordene a galeria por dimensões e ignore as miniaturas pequenas se tudo o que você queria eram as fotografias principais.
- "A ferramenta extraiu menos imagens do que eu esperava." Na maioria das vezes, o conteúdo "faltante" não era uma imagem, mas uma ilustração vetorial: uma exportação do Adobe Illustrator incorporada como operadores de desenho em vez de como raster. Conteúdo vetorial não é um XObject Imagem e não é extraível como imagem. A única forma de capturá-lo como raster é renderizar a página usando a ferramenta PDF para Imagem. O outro caso é texto que parece imagem (um título estilizado renderizado com uma fonte); texto também não é imagem.
- "A imagem extraída é opaca, mas a versão no documento tem fundo transparente." O documento usa um SMask separado para transparência; o XObject colorido sozinho é opaco. A recomposição de máscaras suaves na saída fica a cargo das ferramentas de desktop porque às vezes é destrutiva (cozinha a cor de fundo dentro da imagem). Por enquanto, edite o PNG em uma ferramenta que suporte remoção automática de fundo, ou retire a máscara suave separadamente da galeria se você precisar da forma alfa.
- "Algumas imagens parecem de baixa resolução." Os PDF frequentemente reduzem a amostragem das imagens no momento da incorporação para manter o tamanho do arquivo gerenciável. Uma fotografia de 4000 pixels de largura importada para um documento e depois passada pelo "Reduzir Tamanho do Arquivo" do Acrobat pode acabar armazenada com 800 pixels de largura. A extração devolve a resolução armazenada, não a original. O arquivo na resolução original da câmara só pode ser recuperado a partir da fonte, não do PDF.
- "Duas imagens extraídas parecem peças de uma imagem maior." Alguns geradores de PDF fatiam imagens grandes em uma grade de peças, sobretudo quando a origem excede um limiar de tamanho de página. As peças aparecem como XObjects separados; reconstruir a imagem inteira exige remontá-las em uma ferramenta de desktop com conhecimento do layout da página. É raro em 2026, já que bibliotecas PDF modernas não fazem mais essa fatiação por padrão, mas documentos antigos ainda exibem isso ocasionalmente.
- "O PDF tem 100 páginas, mas só foram extraídas algumas imagens." Muitos PDF são inteiramente compostos por texto e conteúdo vetorial. Um documento puramente textual contém zero imagens incorporadas, independentemente do número de páginas. Se você queria cada página como imagem, use a ferramenta PDF para Imagem em vez disso, que renderiza cada página em um único PNG ou JPG capturando texto e vetores juntos.
- "A imagem CMYK ficou com as cores erradas depois da extração." Não em sentido estrito; a extração converte CMYK em RGB para exibição em tela, e a representação na tela é aproximada porque o destino não tem perfil de impressão. Para reprodução fiel à impressão, não faça ida e volta pela extração PNG. Mantenha o PDF original e use um fluxo de impressão que leia CMYK diretamente.
Extração apenas no navegador versus na nuvem
Os serviços de extração de imagens em nuvem que ocupam o topo dos resultados de busca (Smallpdf, ILovePDF, PDF24 web, Sejda, CleverPDF) todos enviam o PDF para seus servidores, decodificam no lado do servidor e devolvem um ZIP para o seu navegador. Suas políticas de privacidade costumam comprometer-se com a exclusão em uma hora e com TLS em trânsito, e a pressão de reputação comercial sobre os operadores maiores é real. Nada disso muda o simples fato estrutural de que seu documento, e cada imagem dentro dele, residiu brevemente no armazenamento de outra pessoa e passou pelo software dela. Para material sensível (prontuários médicos, extratos financeiros, rascunhos internos, qualquer coisa coberta por acordo de confidencialidade), a melhor postura é nunca deixar o arquivo sair do dispositivo, para começar.
Esta ferramenta funciona inteiramente na aba do navegador. O PDF.js analisa o PDF localmente, decodifica as imagens localmente, escreve-as em um canvas local e dispara um download local. Nenhuma requisição de rede dispara depois do carregamento inicial da página. A prova está disponível em qualquer navegador: abra o painel Rede das ferramentas de desenvolvedor antes de clicar em extrair, execute a extração e observe que nenhuma requisição dispara com o seu arquivo ou o conteúdo das suas imagens. O custo do processamento no navegador é que PDF muito grandes (centenas de megabytes) são mais lentos do que seriam em um servidor rápido, mas a postura de privacidade é categoricamente diferente. O limite de 50 MB nesta ferramenta foi definido para proteger dispositivos móveis de ficar sem heap, não porque a arquitetura não consiga lidar com arquivos maiores em navegadores de desktop.
Mais perguntas frequentes
Como isto difere de "PDF para JPG" ou "PDF para imagem"?
Duas operações genuinamente diferentes. "PDF para imagem" rasteriza cada página em uma única figura, capturando texto, vetores e imagens como pixels achatados; a saída é uma imagem da página. "Extrair imagens" retira os objetos de imagem individuais que o autor incorporou no arquivo; a saída é a imagem dentro da página. Para um relatório de 10 páginas com três fotografias nas páginas 2 e 7, "PDF para imagem" devolve dez arquivos (um por página); "Extrair imagens" devolve três (as fotografias). Use a ferramenta PDF para Imagem para o primeiro tipo.
Por que as imagens extraídas são PNG quando as originais eram JPEG?
O pipeline atual passa cada imagem por um canvas HTML, o que produz um bitmap decodificado, e depois recodifica esse bitmap como PNG para preservar a transparência quando presente. O PNG é sem perdas: as perdas de quantização do JPEG já estão assentadas no bitmap e são preservadas exatamente, sem uma segunda rodada de quantização. Os arquivos PNG de saída são maiores que os bytes JPEG originais, mas a qualidade não é degradada. Um modo futuro que escreva diretamente os bytes JPEG brutos (correspondente a pdfimages -j) está na lista de desejos; o ganho ali é arquivos menores, não maior qualidade.
A ferramenta encontra todas as imagens, incluindo as usadas como fundo ou inline?
Sim. A ferramenta percorre a lista de operadores da página e resolve tanto os XObjects Imagem nomeados (operador de pintura Do) quanto as imagens inline incorporadas diretamente no fluxo de conteúdo entre os operadores BI, ID e EI. Muitas ferramentas de extração perdem as imagens inline porque só percorrem a tabela XObject; esta não. Máscaras de estêncil (ImageMask true) também são reportadas, embora sejam silhuetas em vez de imagens e só sejam úteis em casos restritos.
Qual o tamanho máximo de PDF que posso processar?
Até 50 MB na implementação atual. O limite é definido pela pressão de memória do navegador em dispositivos móveis: PDF grandes mantêm em memória ao mesmo tempo o documento analisado e as imagens decodificadas, e ultrapassar o heap disponível do dispositivo faz o sistema operacional encerrar a aba. Navegadores de desktop normalmente conseguem lidar com bem mais; o teto é conservador por segurança. Para documentos muito grandes, o pdfimages -all de desktop do poppler-utils é a ferramenta certa.
A extração altera os direitos autorais das imagens?
Não. Imagens incorporadas em um PDF mantêm os direitos que pertencerem ao autor do documento, ao fotógrafo ou ao titular da licença. Extrair uma imagem de um PDF ao qual você tem acesso legal é mecanicamente equivalente a tirar uma captura de tela dela; o que você faz com o arquivo extraído é regido pelas mesmas regras de direitos autorais da fonte. Uso para referência pessoal costuma não ser controverso; redistribuição ou uso comercial depende dos termos de licença da fonte.
Existe um equivalente em desktop ou linha de comando?
Sim, dois sólidos. pdfimages do poppler-utils é o equivalente mais próximo: pdfimages -all input.pdf prefix- extrai cada imagem em sua codificação original quando possível. Instale com brew install poppler no macOS, apt install poppler-utils no Debian ou Ubuntu, ou baixe os binários do Windows no site do projeto. O outro é mutool extract do MuPDF, que extrai imagens e fontes juntas. Ambos são locais, gratuitos e bem mantidos.