Extracción de imágenes de PDF en línea gratuita

Extrae al instante todas las imágenes integradas en tus archivos PDF. Previsualízalas con sus dimensiones, descárgalas individualmente o en archivo ZIP.

Tus archivos nunca salen de tu dispositivo
Suelta el archivo PDF aquí o haz clic para examinar

Admite PDF · hasta 50 MB

Procesando: 0 %

Cómo funciona

  1. Subir PDFSelecciona o suelta tu archivo PDF en el navegador. Sin subidas al servidor.
  2. Extracción automáticaLa herramienta analiza el PDF y extrae todas las imágenes incrustadas con sus dimensiones.
  3. Descargar imágenesDescarga las imágenes individualmente o agrúpalas en un archivo ZIP.

¿Por qué extraer imágenes de PDF?

Extraer imágenes de PDF es útil para reutilizar contenido, reciclar gráficos para nuevos documentos o archivar recursos visuales importantes. Las imágenes se extraen en su calidad original, lo que permite reutilizarlas sin pérdida.

Características

Preguntas frecuentes

¿Se conservará la calidad de las imágenes?

Sí. Las imágenes se extraen con la misma calidad y resolución con la que están incrustadas en el PDF, sin recompresión.

¿Qué formatos de imagen se extraen?

La herramienta extrae las imágenes en su formato nativo almacenado dentro del PDF, normalmente JPEG o PNG según el documento original.

¿Puedo ver las dimensiones antes de descargar?

Sí. Cada imagen se previsualiza con sus dimensiones exactas en píxeles, lo que te permite elegir las que necesitas.

¿Puedo descargar imágenes individualmente?

Sí. Haz clic en la imagen que quieras descargar o usa el botón ZIP para obtenerlas todas a la vez.

¿Se incluyen fondos y decoraciones?

Se extraen todas las imágenes realmente incrustadas en el PDF, incluidos fondos, decoraciones y logotipos.

¿Mis PDF se suben a un servidor?

No. Toda la extracción ocurre localmente en tu navegador con PDF.js. Tus PDF nunca salen de tu dispositivo, garantizando privacidad y seguridad totales.

¿Cuál es el tamaño máximo del archivo?

El límite es de 50 MB por PDF, lo que cubre la mayoría de documentos. Para archivos más grandes, intenta dividir el PDF primero.

¿Funciona en móviles?

Sí. La herramienta funciona en navegadores móviles modernos, aunque los archivos más grandes pueden procesarse más lentamente.

Qué significa realmente «extraer imágenes de un PDF»

La frase cotidiana «extraer imágenes de un PDF» es ambigua, y la ambigüedad importa para lo que la herramienta entrega. Dos operaciones genuinamente distintas viven detrás de las mismas palabras. La primera consiste en extraer los objetos de imagen incrustados: recorrer el documento, identificar cada XObject Imagen (o imagen en línea) que el autor colocó en el archivo y reescribir cada uno como un PNG independiente. La salida es lo que el autor del documento colocó efectivamente en el archivo, a la resolución a la que lo colocó. La segunda consiste en renderizar las páginas como imágenes: rasterizar cada página del PDF a una sola imagen a un DPI elegido, capturando texto, formas vectoriales e imágenes juntas como píxeles aplanados. La salida es una imagen de la página, no la imagen dentro de la página.

Esta herramienta hace el primer tipo. Para un documento de 10 páginas con tres fotografías incrustadas entre las páginas 2 y 7, produce tres archivos de imagen, no diez imágenes de página. Si quiere el segundo tipo, el renderizado de página como imagen, utilice la herramienta PDF a Imagen. Distinguir las dos operaciones es el punto de confusión más común cuando los usuarios llegan por primera vez: los servicios «PDF a JPG» suelen hacer el segundo tipo, y muchos usuarios los encuentran cuando querían el primero. El número de archivos de salida lo delata: una extracción devuelve el número de imágenes incrustadas; un renderizado de página devuelve el número de páginas.

Cómo funciona esta herramienta

La herramienta utiliza PDF.js, el motor de renderizado PDF en JavaScript puro de Mozilla, el mismo motor que impulsa la vista previa PDF integrada de Firefox. Cuando selecciona un PDF, la API File del navegador entrega los bytes a PDF.js sin ningún viaje de ida y vuelta a la red. PDF.js analiza la tabla de referencias cruzadas, el trailer y el catálogo del documento dentro de un Web Worker para que el hilo principal siga siendo receptivo. Para cada página, la herramienta solicita la lista de operadores y recorre cada llamada paintImageXObject y paintInlineImageXObject. Para cada operador de imagen, resuelve el XObject Imagen real a través de la caché de objetos de PDF.js, lo decodifica según su filtro y espacio de color, dibuja el mapa de bits en un canvas fuera de pantalla y exporta el canvas como PNG.

El ancho, el alto y el tamaño aproximado del archivo se registran para la vista de galería. Cuando hace clic en «Descargar todo como ZIP», JSZip agrupa todas las imágenes extraídas en un único archivo en memoria, y el ancla de descarga del navegador activa el guardado. Ninguna parte de este proceso realiza una petición de red. Puede verificarlo directamente: abra las herramientas de desarrollador del navegador en el panel Red antes de seleccionar un PDF, ejecute la extracción y observe que nada sale de su máquina. El motor PDF.js y la biblioteca JSZip se descargan una sola vez en la primera visita y son almacenados en caché por el navegador, por lo que las visitas posteriores cargan al instante y funcionan totalmente sin conexión.

Cómo almacenan imágenes los PDF

Un archivo PDF es un árbol de objetos. El árbol de páginas referencia objetos página; cada objeto página referencia un flujo de contenido y un diccionario de recursos. La entrada XObject del diccionario de recursos asocia nombres cortos (como Im1, Im2) a flujos XObject Imagen. El flujo de contenido los pinta con el operador Do: una secuencia como q 200 0 0 150 50 300 cm /Im1 Do Q significa «establece la transformación, pinta la imagen llamada Im1 desde los recursos, restaura la transformación». Cada XObject Imagen lleva Width y Height (dimensiones en píxeles), ColorSpace (cómo interpretar cada componente), BitsPerComponent (1, 2, 4, 8 o 16) y Filter (la cadena de códecs que comprime los bytes).

El campo Filter es el más importante para un extractor, porque determina si los bytes pueden escribirse directamente o deben decodificarse primero. Seis filtros aparecen en la práctica. DCTDecode almacena los bytes como un archivo JPEG completo, listo para escribir con una extensión .jpg; esto es aproximadamente entre el 60 y el 70 por ciento de las imágenes en PDF en color. JPXDecode es JPEG2000, raro en documentos de consumo pero presente en pipelines de impresión de gama alta. CCITTFaxDecode es la compresión fax Grupo 3 o Grupo 4 para escaneos en blanco y negro de un bit, común en archivos comerciales escaneados. JBIG2Decode es el sucesor más eficiente utilizado por «Reducir tamaño del archivo» de Acrobat y por ABBYY FineReader. FlateDecode son datos de píxeles en bruto comprimidos con zlib, común en gráficos, capturas de pantalla y PDF de herramientas de autoría orientadas a la web. RunLengthDecode es un RLE simple usado sobre todo en PDF más antiguos o construidos a mano.

Imágenes en línea, el caso fácil de pasar por alto

La especificación PDF permite que pequeñas imágenes se incrusten directamente en el flujo de contenido de una página, entre los operadores BI (begin image), ID (image data) y EI (end image), sin convertirse en un XObject con nombre. Fue una optimización de principios de los años 1990 para gráficos diminutos como logotipos, iconos y viñetas, destinada a evitar el coste de un objeto separado para una imagen de unos cientos de bytes. El formato es por lo demás idéntico a un XObject Imagen: los mismos campos de filtro, espacio de color y dimensiones, escritos en forma compacta.

Muchas herramientas de «extracción de imágenes» pierden completamente las imágenes en línea porque recorren la tabla XObject del diccionario de recursos y se detienen ahí. Esta herramienta recorre la lista de operadores de la página y las recoge a través de paintInlineImageXObject. La consecuencia práctica: los PDF con logotipos corporativos en el encabezado (comúnmente en línea) y los PDF de herramientas de autoría más antiguas que usan imágenes en línea para los iconos devuelven más imágenes de las que sugeriría un recorrido ingenuo de XObjects. Si está comparando el conteo de extracciones con otra herramienta, esta es una de las razones de las diferencias. Las otras razones, cubiertas más abajo, son la inclusión de gráficos decorativos, máscaras de plantilla y marcas de agua que algunas herramientas filtran por defecto.

Máscaras suaves, plantillas y transparencia

La transparencia de imagen en PDF rara vez se codifica dentro de la imagen misma. En su lugar, la página compone una imagen en color con una «máscara suave» de un solo canal separada (la entrada SMask del diccionario XObject). El resultado visible en un lector es la composición; la imagen en color extraída sola es opaca. Para imágenes extraídas destinadas a reutilización visual, esto puede producir sorpresas: un logotipo extraído de un PDF donde el autor usó un SMask puede aparecer como un rectángulo opaco en lugar de un PNG con fondo transparente. El comportamiento actual es extraer el XObject Imagen en color sin recomponer el SMask, lo que coincide con el comportamiento de pdfimages -png en la línea de comandos y con el comportamiento de todos los servicios de extracción en la nube que probamos.

Un concepto relacionado es la bandera ImageMask. Cuando ImageMask es true, los bytes no son datos de píxeles; son una plantilla de un bit que define dónde se aplica el color de relleno actual. Extraer un ImageMask de manera aislada produce una silueta en blanco y negro en lugar de una imagen utilizable. La herramienta los reporta en la galería por completitud, pero su utilidad es pequeña a menos que esté específicamente interesado en la silueta. Ordene por dimensiones e ignore las plantillas pequeñas si saturan la vista. La recomposición de máscaras suaves en PNG con canal alfa es una función en la lista de deseos pero actualmente reservada a herramientas de escritorio, porque a veces es destructiva: recomponer cuece el color de fondo en el resultado, lo que puede o no ser lo que quiere.

Espacios de color y su efecto en la salida

La mayoría de los PDF en 2026 utilizan DeviceRGB (similar a sRGB) o DeviceCMYK. PDF.js decodifica ambos de forma transparente, convirtiendo CMYK a RGB antes de pintar en el canvas. El PNG extraído es por tanto siempre RGB, incluso cuando la fuente era CMYK. Para reutilización puramente visual esto es correcto: una imagen CMYK está destinada a la impresión y no se mostraría correctamente en un sitio web sin conversión. Para reproducción impresa, la conversión es aproximada porque el canvas de destino no tiene un perfil de impresión adjunto. Los usuarios que apuntan a impresión deberían conservar el PDF original y no hacer un viaje de ida y vuelta por la extracción; la fidelidad cromática será mejor cuando el pipeline de impresión lea la imagen CMYK directamente.

Los perfiles de color ICCBased adjuntos a las imágenes PDF son respetados por PDF.js durante la decodificación, por lo que el PNG extraído aproxima la apariencia prevista bajo condiciones de visualización estándar. Los espacios de color indexados (imágenes de paleta, el caso típico de 256 colores heredado de importaciones GIF) son desindexados durante la extracción, produciendo un PNG en color completo en lugar de uno basado en paleta. Este es el comportamiento correcto para reutilización visual pero significa que el tamaño de archivo de un PNG extraído puede ser mayor que el tamaño de archivo de la imagen indexada original dentro del PDF. El compromiso es inevitable en el pipeline basado en canvas, y preferimos la fidelidad a la compacidad; los usuarios que quieran los archivos más pequeños posibles pueden pasar la salida por el Compresor de Imágenes después.

Casos de uso reales que motivan la extracción de imágenes

Trampas habituales y qué significan

Extracción solo en el navegador frente a la nube

Los servicios de extracción de imágenes en la nube que llenan la parte superior de los resultados de búsqueda (Smallpdf, ILovePDF, PDF24 web, Sejda, CleverPDF) todos suben el PDF a sus servidores, decodifican en el lado del servidor y devuelven un ZIP a su navegador. Sus políticas de privacidad suelen comprometerse a borrar en menos de una hora y a usar TLS en tránsito, y la presión de reputación comercial sobre los grandes operadores es real. Nada de eso cambia el simple hecho estructural de que su documento, y cada imagen dentro de él, residieron brevemente en el almacenamiento de otra persona y pasaron por su software. Para material sensible (historiales médicos, extractos financieros, borradores internos, cualquier cosa cubierta por un acuerdo de confidencialidad), la mejor postura es no dejar nunca que el archivo salga del dispositivo en primer lugar.

Esta herramienta funciona enteramente en la pestaña del navegador. PDF.js analiza el PDF localmente, decodifica las imágenes localmente, las escribe en un canvas local y activa una descarga local. Ninguna petición de red se dispara después de la carga inicial de la página. La prueba está disponible en cualquier navegador: abra el panel Red de las herramientas de desarrollador antes de hacer clic en extraer, ejecute la extracción y observe que no se dispara ninguna petición con su archivo o el contenido de sus imágenes. El coste del procesamiento en el navegador es que los PDF muy grandes (cientos de megabytes) son más lentos de lo que serían en un servidor rápido, pero la postura de privacidad es categóricamente distinta. El límite de 50 MB en esta herramienta está establecido para proteger los dispositivos móviles de quedarse sin memoria, no porque la arquitectura no pueda manejar archivos más grandes en navegadores de escritorio.

Más preguntas frecuentes

¿En qué se diferencia esto de «PDF a JPG» o «PDF a imagen»?

Dos operaciones genuinamente diferentes. «PDF a imagen» rasteriza cada página a una sola imagen, capturando texto, vectores e imágenes como píxeles aplanados; la salida es una imagen de la página. «Extraer imágenes» saca los objetos de imagen individuales que el autor incrustó en el archivo; la salida es la imagen dentro de la página. Para un informe de 10 páginas con tres fotografías entre las páginas 2 y 7, «PDF a imagen» devuelve diez archivos (uno por página); «Extraer imágenes» devuelve tres (las fotografías). Utilice la herramienta PDF a Imagen para el primer tipo.

¿Por qué las imágenes extraídas son PNG cuando las originales eran JPEG?

El pipeline actual hace pasar cada imagen por un canvas HTML, lo que produce un mapa de bits decodificado, y luego recodifica ese mapa de bits como PNG para preservar la transparencia donde está presente. El PNG es sin pérdida: las pérdidas de cuantificación del JPEG ya están horneadas en el mapa de bits y se preservan exactamente, sin una segunda ronda de cuantificación. Los archivos PNG de salida son más grandes que los bytes JPEG originales, pero la calidad no se degrada. Un modo futuro que escriba directamente los bytes JPEG en bruto (correspondiente a pdfimages -j) está en la lista de deseos; la ganancia ahí son archivos más pequeños, no mayor calidad.

¿Encuentra la herramienta todas las imágenes, incluidas las usadas como fondo o en línea?

Sí. La herramienta recorre la lista de operadores de la página y resuelve tanto los XObjects Imagen con nombre (operador de pintura Do) como las imágenes en línea incrustadas directamente en el flujo de contenido entre los operadores BI, ID y EI. Muchas herramientas de extracción pierden las imágenes en línea porque solo recorren la tabla XObject; esta no. Las máscaras de plantilla (ImageMask true) también se reportan, aunque son siluetas más que imágenes y solo son útiles en casos restringidos.

¿Qué tamaño de PDF puedo procesar?

Hasta 50 MB en la implementación actual. El límite lo establece la presión de memoria del navegador en dispositivos móviles: los PDF grandes mantienen en memoria a la vez el documento analizado y las imágenes decodificadas, y superar el montón disponible del dispositivo hará que el sistema operativo cierre la pestaña. Los navegadores de escritorio normalmente pueden manejar considerablemente más; el tope es conservador por seguridad. Para documentos muy grandes, el pdfimages -all de escritorio de poppler-utils es la herramienta adecuada.

¿Cambia la extracción los derechos de autor de las imágenes?

No. Las imágenes incrustadas en un PDF conservan los derechos que pertenezcan al autor del documento, al fotógrafo o al titular de la licencia. Extraer una imagen de un PDF al que tiene acceso legal es mecánicamente equivalente a hacer una captura de pantalla; lo que haga con el archivo extraído se rige por las mismas reglas de derechos de autor que la fuente. El uso como referencia personal suele ser poco controvertido; la redistribución o el uso comercial dependen de los términos de licencia de la fuente.

¿Existe un equivalente en línea de comandos o de escritorio?

Sí, dos sólidos. pdfimages de poppler-utils es el equivalente más cercano: pdfimages -all input.pdf prefix- extrae cada imagen en su codificación original cuando es posible. Instálelo con brew install poppler en macOS, apt install poppler-utils en Debian o Ubuntu, o descargue los binarios de Windows desde el sitio del proyecto. El otro es mutool extract de MuPDF, que extrae imágenes y fuentes juntas. Ambos son locales, gratuitos y están bien mantenidos.

Herramientas relacionadas