Extrator gratuito de imagens de PDF

Extraia instantaneamente todas as imagens incorporadas em arquivos PDF. Visualize as imagens com suas dimensões e baixe-as individualmente ou em ZIP.

Seus arquivos nunca saem do seu dispositivo
Solte o arquivo PDF aqui ou clique para navegar

Suporta PDF · até 50 MB

Processando: 0 %

Como funciona

  1. Carregar PDFSelecione ou solte seu arquivo PDF no navegador. Sem uploads para servidor.
  2. Extração automáticaA ferramenta analisa o PDF e extrai todas as imagens incorporadas com suas dimensões.
  3. Baixar imagensBaixe as imagens individualmente ou agrupe-as em um arquivo ZIP.

Por que extrair imagens de PDFs?

Extrair imagens de PDFs é útil para reaproveitar conteúdo, reutilizar gráficos para novos documentos ou arquivar recursos visuais importantes. As imagens são extraídas em sua qualidade original, permitindo reusá-las sem perdas.

Recursos

Perguntas frequentes

A qualidade das imagens será preservada?

Sim. As imagens são extraídas com a mesma qualidade e resolução com que estão incorporadas no PDF, sem recompressão.

Quais formatos de imagem são extraídos?

A ferramenta extrai as imagens em seu formato nativo armazenado dentro do PDF, normalmente JPEG ou PNG, conforme o documento original.

Posso ver as dimensões antes do download?

Sim. Cada imagem é exibida em pré-visualização com suas dimensões exatas em pixels, permitindo escolher as que você precisa.

Posso baixar as imagens individualmente?

Sim. Clique na imagem que deseja baixar ou use o botão ZIP para obter todas de uma vez.

Os fundos e decorações são incluídos?

Todas as imagens realmente incorporadas ao PDF são extraídas, incluindo fundos, decorações e logotipos.

Meus PDFs são enviados para um servidor?

Não. Toda a extração acontece localmente no seu navegador com o PDF.js. Seus PDFs nunca saem do seu dispositivo, garantindo privacidade e segurança totais.

Qual é o tamanho máximo do arquivo?

O limite é de 50 MB por PDF, o que cobre a maioria dos documentos. Para arquivos maiores, tente dividir o PDF primeiro.

Funciona em celular?

Sim. A ferramenta funciona em navegadores móveis modernos, embora arquivos maiores possam ser processados mais lentamente.

O que "extrair imagens de um PDF" realmente significa

A expressão cotidiana "extrair imagens de um PDF" é ambígua, e essa ambiguidade importa para o que a ferramenta efetivamente entrega. Duas operações genuinamente distintas vivem por trás das mesmas palavras. A primeira consiste em extrair os objetos de imagem incorporados: percorrer o documento, identificar cada XObject Imagem (ou imagem inline) que o autor colocou no arquivo, e escrever cada uma de volta como um PNG independente. A saída é o que o autor do documento de fato colocou no arquivo, na resolução em que colocou. A segunda consiste em renderizar páginas como imagens: rasterizar cada página do PDF em uma única figura num DPI escolhido, capturando texto, formas vetoriais e imagens juntos como pixels achatados. A saída é uma imagem da página, não a imagem dentro da página.

Esta ferramenta faz o primeiro tipo. Para um documento de 10 páginas com três fotografias incorporadas nas páginas 2 e 7, ela produz três arquivos de imagem, não dez imagens de página. Se você quer o segundo tipo, a renderização de página como imagem, use a ferramenta PDF para Imagem. Distinguir as duas operações é o ponto de confusão mais comum quando os usuários chegam pela primeira vez: serviços de "PDF para JPG" geralmente fazem o segundo tipo, e muitos usuários os encontram quando queriam o primeiro. A contagem de saída revela: a extração devolve o número de imagens incorporadas; a renderização de páginas devolve o número de páginas.

Como esta ferramenta funciona

A ferramenta executa o PDF.js, o renderizador de PDF em JavaScript puro da Mozilla, o mesmo motor que alimenta a pré-visualização integrada de PDF do Firefox. Quando você seleciona um PDF, a File API do navegador entrega os bytes ao PDF.js sem nenhuma ida e volta de rede. O PDF.js analisa a tabela de referência cruzada, o trailer e o catálogo do documento dentro de um Web Worker para que a thread principal continue responsiva. Para cada página, a ferramenta solicita a lista de operadores e percorre cada chamada paintImageXObject e paintInlineImageXObject. Para cada operador de imagem, ela resolve o XObject Imagem real através do cache de objetos do PDF.js, decodifica-o segundo seu filtro e espaço de cor, desenha o bitmap em um canvas fora da tela e exporta o canvas como PNG.

Largura, altura e tamanho aproximado do arquivo são registrados para a visualização em galeria. Quando você clica em "Baixar tudo como ZIP", o JSZip agrupa todas as imagens extraídas em um único arquivo em memória, e a âncora de download do navegador dispara o salvamento. Nenhuma parte deste processo faz uma requisição de rede. Você pode verificar diretamente: abra as ferramentas de desenvolvedor do navegador no painel Rede antes de selecionar um PDF, execute a extração e observe que nada sai da sua máquina. O motor PDF.js e a biblioteca JSZip são baixados uma única vez na primeira visita e armazenados em cache pelo navegador, de modo que visitas posteriores carregam instantaneamente e funcionam totalmente offline.

Como os PDF guardam imagens

Um arquivo PDF é uma árvore de objetos. A árvore de páginas referencia objetos página; cada objeto página referencia um fluxo de conteúdo e um dicionário de recursos. A entrada XObject do dicionário de recursos associa nomes curtos (como Im1, Im2) a fluxos XObject Imagem. O fluxo de conteúdo as desenha com o operador Do: uma sequência como q 200 0 0 150 50 300 cm /Im1 Do Q significa "define a transformação, desenha a imagem chamada Im1 a partir dos recursos, restaura a transformação". Cada XObject Imagem carrega Width e Height (dimensões em pixels), ColorSpace (como interpretar cada componente), BitsPerComponent (1, 2, 4, 8 ou 16) e Filter (a cadeia de codecs que comprime os bytes).

O campo Filter é o mais importante para um extrator, porque determina se os bytes podem ser escritos diretamente ou precisam ser decodificados primeiro. Seis filtros aparecem na prática. DCTDecode guarda os bytes como um arquivo JPEG completo, pronto para escrever com a extensão .jpg; isso é cerca de 60 a 70 por cento das imagens em PDF coloridos. JPXDecode é JPEG2000, raro em documentos de consumo mas presente em pipelines de impressão de alta gama. CCITTFaxDecode é a compressão fax Grupo 3 ou Grupo 4 para varreduras em preto e branco de um bit, comum em arquivos comerciais digitalizados. JBIG2Decode é o sucessor mais eficiente usado pelo "Reduzir Tamanho do Arquivo" do Acrobat e pelo ABBYY FineReader. FlateDecode são dados de pixel brutos comprimidos por zlib, comum em gráficos, capturas de tela e PDF de ferramentas de autoria voltadas para a web. RunLengthDecode é um RLE simples usado sobretudo em PDF mais antigos ou construídos à mão.

Imagens inline, o caso fácil de não perceber

A especificação PDF permite que imagens pequenas sejam incorporadas diretamente no fluxo de conteúdo de uma página, entre os operadores BI (begin image), ID (image data) e EI (end image), sem se tornarem um XObject nomeado. Foi uma otimização do início dos anos 1990 para gráficos muito pequenos como logotipos, ícones e marcadores, destinada a evitar o custo de um objeto separado para uma imagem de algumas centenas de bytes. O formato é por outro lado idêntico a um XObject Imagem: os mesmos campos de filtro, espaço de cor e dimensões, escritos em forma compacta.

Muitas ferramentas de "extração de imagens" perdem completamente as imagens inline porque percorrem a tabela XObject do dicionário de recursos e param ali. Esta ferramenta percorre a lista de operadores da página e as captura via paintInlineImageXObject. A consequência prática: PDF com logotipos corporativos no cabeçalho (comumente inline) e PDF de ferramentas de autoria mais antigas que usam imagens inline para ícones devolvem mais imagens do que uma varredura ingênua de XObjects sugeriria. Se você está comparando contagens de extração com outra ferramenta, este é um dos motivos das diferenças. As outras razões, cobertas mais abaixo, são a inclusão de gráficos decorativos, máscaras de estêncil e marcas d'água que algumas ferramentas filtram por padrão.

Máscaras suaves, estêncis e transparência

A transparência de imagem em PDF raramente é codificada dentro da própria imagem. Em vez disso, a página compõe uma imagem colorida com uma "máscara suave" de canal único separada (a entrada SMask do dicionário XObject). O resultado visível em um leitor é a composição; a imagem colorida extraída sozinha é opaca. Para imagens extraídas destinadas à reutilização visual, isso pode produzir surpresas: um logotipo extraído de um PDF onde o autor usou um SMask pode aparecer como um retângulo opaco em vez de um PNG de fundo transparente. O comportamento atual é extrair o XObject Imagem colorido sem recompor o SMask, o que coincide com o comportamento de pdfimages -png na linha de comando e com o comportamento de todos os serviços de extração em nuvem que testamos.

Um conceito relacionado é a flag ImageMask. Quando ImageMask é true, os bytes não são dados de pixels; são um estêncil de um bit que define onde a cor de preenchimento atual é aplicada. Extrair um ImageMask isoladamente produz uma silhueta em preto e branco em vez de uma figura utilizável. A ferramenta os reporta na galeria por completude, mas a utilidade deles é pequena a menos que você esteja especificamente interessado na silhueta. Ordene por dimensões e ignore estêncis pequenos se eles poluírem a visualização. Recompor máscaras suaves em PNG com canal alfa é uma funcionalidade na lista de desejos mas atualmente deixada para ferramentas de desktop, porque às vezes é destrutiva: recompor cozinha a cor de fundo dentro do resultado, o que pode ou não ser o que você quer.

Espaços de cor e seu efeito na saída

A maioria dos PDF em 2026 usa DeviceRGB (semelhante a sRGB) ou DeviceCMYK. O PDF.js decodifica ambos de forma transparente, convertendo CMYK em RGB antes de pintar no canvas. O PNG extraído é, portanto, sempre RGB, mesmo quando a fonte era CMYK. Para reutilização puramente visual isso está correto: uma imagem CMYK é destinada à impressão e não seria exibida corretamente em um site sem conversão. Para reprodução impressa, a conversão é aproximada porque o canvas de destino não tem um perfil de impressão anexado. Usuários voltados à impressão devem manter o PDF original e não fazer uma ida e volta pela extração; a fidelidade cromática será melhor quando o pipeline de impressão ler a imagem CMYK diretamente.

Perfis de cor ICCBased anexados a imagens PDF são respeitados pelo PDF.js durante a decodificação, então o PNG extraído aproxima a aparência prevista sob condições padrão de visualização. Espaços de cor indexados (imagens em paleta, o caso típico de 256 cores herdado de importações GIF) são desindexados durante a extração, produzindo um PNG em cores completas em vez de um baseado em paleta. Esse é o comportamento correto para reutilização visual, mas significa que o tamanho do arquivo de um PNG extraído pode ser maior que o tamanho da imagem indexada original dentro do PDF. O compromisso é inevitável no pipeline baseado em canvas, e preferimos fidelidade a compactação; usuários que querem os menores arquivos possíveis podem passar a saída pelo Compressor de Imagens depois.

Fluxos reais que motivam a extração de imagens

Armadilhas comuns e o que significam

Extração apenas no navegador versus na nuvem

Os serviços de extração de imagens em nuvem que ocupam o topo dos resultados de busca (Smallpdf, ILovePDF, PDF24 web, Sejda, CleverPDF) todos enviam o PDF para seus servidores, decodificam no lado do servidor e devolvem um ZIP para o seu navegador. Suas políticas de privacidade costumam comprometer-se com a exclusão em uma hora e com TLS em trânsito, e a pressão de reputação comercial sobre os operadores maiores é real. Nada disso muda o simples fato estrutural de que seu documento, e cada imagem dentro dele, residiu brevemente no armazenamento de outra pessoa e passou pelo software dela. Para material sensível (prontuários médicos, extratos financeiros, rascunhos internos, qualquer coisa coberta por acordo de confidencialidade), a melhor postura é nunca deixar o arquivo sair do dispositivo, para começar.

Esta ferramenta funciona inteiramente na aba do navegador. O PDF.js analisa o PDF localmente, decodifica as imagens localmente, escreve-as em um canvas local e dispara um download local. Nenhuma requisição de rede dispara depois do carregamento inicial da página. A prova está disponível em qualquer navegador: abra o painel Rede das ferramentas de desenvolvedor antes de clicar em extrair, execute a extração e observe que nenhuma requisição dispara com o seu arquivo ou o conteúdo das suas imagens. O custo do processamento no navegador é que PDF muito grandes (centenas de megabytes) são mais lentos do que seriam em um servidor rápido, mas a postura de privacidade é categoricamente diferente. O limite de 50 MB nesta ferramenta foi definido para proteger dispositivos móveis de ficar sem heap, não porque a arquitetura não consiga lidar com arquivos maiores em navegadores de desktop.

Mais perguntas frequentes

Como isto difere de "PDF para JPG" ou "PDF para imagem"?

Duas operações genuinamente diferentes. "PDF para imagem" rasteriza cada página em uma única figura, capturando texto, vetores e imagens como pixels achatados; a saída é uma imagem da página. "Extrair imagens" retira os objetos de imagem individuais que o autor incorporou no arquivo; a saída é a imagem dentro da página. Para um relatório de 10 páginas com três fotografias nas páginas 2 e 7, "PDF para imagem" devolve dez arquivos (um por página); "Extrair imagens" devolve três (as fotografias). Use a ferramenta PDF para Imagem para o primeiro tipo.

Por que as imagens extraídas são PNG quando as originais eram JPEG?

O pipeline atual passa cada imagem por um canvas HTML, o que produz um bitmap decodificado, e depois recodifica esse bitmap como PNG para preservar a transparência quando presente. O PNG é sem perdas: as perdas de quantização do JPEG já estão assentadas no bitmap e são preservadas exatamente, sem uma segunda rodada de quantização. Os arquivos PNG de saída são maiores que os bytes JPEG originais, mas a qualidade não é degradada. Um modo futuro que escreva diretamente os bytes JPEG brutos (correspondente a pdfimages -j) está na lista de desejos; o ganho ali é arquivos menores, não maior qualidade.

A ferramenta encontra todas as imagens, incluindo as usadas como fundo ou inline?

Sim. A ferramenta percorre a lista de operadores da página e resolve tanto os XObjects Imagem nomeados (operador de pintura Do) quanto as imagens inline incorporadas diretamente no fluxo de conteúdo entre os operadores BI, ID e EI. Muitas ferramentas de extração perdem as imagens inline porque só percorrem a tabela XObject; esta não. Máscaras de estêncil (ImageMask true) também são reportadas, embora sejam silhuetas em vez de imagens e só sejam úteis em casos restritos.

Qual o tamanho máximo de PDF que posso processar?

Até 50 MB na implementação atual. O limite é definido pela pressão de memória do navegador em dispositivos móveis: PDF grandes mantêm em memória ao mesmo tempo o documento analisado e as imagens decodificadas, e ultrapassar o heap disponível do dispositivo faz o sistema operacional encerrar a aba. Navegadores de desktop normalmente conseguem lidar com bem mais; o teto é conservador por segurança. Para documentos muito grandes, o pdfimages -all de desktop do poppler-utils é a ferramenta certa.

A extração altera os direitos autorais das imagens?

Não. Imagens incorporadas em um PDF mantêm os direitos que pertencerem ao autor do documento, ao fotógrafo ou ao titular da licença. Extrair uma imagem de um PDF ao qual você tem acesso legal é mecanicamente equivalente a tirar uma captura de tela dela; o que você faz com o arquivo extraído é regido pelas mesmas regras de direitos autorais da fonte. Uso para referência pessoal costuma não ser controverso; redistribuição ou uso comercial depende dos termos de licença da fonte.

Existe um equivalente em desktop ou linha de comando?

Sim, dois sólidos. pdfimages do poppler-utils é o equivalente mais próximo: pdfimages -all input.pdf prefix- extrai cada imagem em sua codificação original quando possível. Instale com brew install poppler no macOS, apt install poppler-utils no Debian ou Ubuntu, ou baixe os binários do Windows no site do projeto. O outro é mutool extract do MuPDF, que extrai imagens e fontes juntas. Ambos são locais, gratuitos e bem mantidos.

Ferramentas relacionadas