Extracción de imágenes de PDF en línea gratuita
Extrae al instante todas las imágenes integradas en tus archivos PDF. Previsualízalas con sus dimensiones, descárgalas individualmente o en archivo ZIP.
Admite PDF · hasta 50 MB
Cómo funciona
- Subir PDFSelecciona o suelta tu archivo PDF en el navegador. Sin subidas al servidor.
- Extracción automáticaLa herramienta analiza el PDF y extrae todas las imágenes incrustadas con sus dimensiones.
- Descargar imágenesDescarga las imágenes individualmente o agrúpalas en un archivo ZIP.
¿Por qué extraer imágenes de PDF?
Extraer imágenes de PDF es útil para reutilizar contenido, reciclar gráficos para nuevos documentos o archivar recursos visuales importantes. Las imágenes se extraen en su calidad original, lo que permite reutilizarlas sin pérdida.
Características
- Extracción completaExtrae todas las imágenes incrustadas del PDF, incluidas fotos, logotipos e ilustraciones.
- Calidad preservadaLas imágenes se extraen con su resolución y calidad originales sin recompresión.
- Vista previa de imágenesPrevisualiza cada imagen con sus dimensiones antes de descargarla.
- Descarga individual o masivaDescarga las imágenes una por una o todas en un solo archivo ZIP.
- Visualización de metadatosConsulta las dimensiones, formato y tamaño de cada imagen extraída.
- PrivacidadLa extracción se realiza completamente en tu navegador. No se sube ningún archivo al servidor.
- RápidoExtrae todas las imágenes en segundos con procesamiento local en JavaScript.
Preguntas frecuentes
¿Se conservará la calidad de las imágenes?
Sí. Las imágenes se extraen con la misma calidad y resolución con la que están incrustadas en el PDF, sin recompresión.
¿Qué formatos de imagen se extraen?
La herramienta extrae las imágenes en su formato nativo almacenado dentro del PDF, normalmente JPEG o PNG según el documento original.
¿Puedo ver las dimensiones antes de descargar?
Sí. Cada imagen se previsualiza con sus dimensiones exactas en píxeles, lo que te permite elegir las que necesitas.
¿Puedo descargar imágenes individualmente?
Sí. Haz clic en la imagen que quieras descargar o usa el botón ZIP para obtenerlas todas a la vez.
¿Se incluyen fondos y decoraciones?
Se extraen todas las imágenes realmente incrustadas en el PDF, incluidos fondos, decoraciones y logotipos.
¿Mis PDF se suben a un servidor?
No. Toda la extracción ocurre localmente en tu navegador con PDF.js. Tus PDF nunca salen de tu dispositivo, garantizando privacidad y seguridad totales.
¿Cuál es el tamaño máximo del archivo?
El límite es de 50 MB por PDF, lo que cubre la mayoría de documentos. Para archivos más grandes, intenta dividir el PDF primero.
¿Funciona en móviles?
Sí. La herramienta funciona en navegadores móviles modernos, aunque los archivos más grandes pueden procesarse más lentamente.
Qué significa realmente «extraer imágenes de un PDF»
La frase cotidiana «extraer imágenes de un PDF» es ambigua, y la ambigüedad importa para lo que la herramienta entrega. Dos operaciones genuinamente distintas viven detrás de las mismas palabras. La primera consiste en extraer los objetos de imagen incrustados: recorrer el documento, identificar cada XObject Imagen (o imagen en línea) que el autor colocó en el archivo y reescribir cada uno como un PNG independiente. La salida es lo que el autor del documento colocó efectivamente en el archivo, a la resolución a la que lo colocó. La segunda consiste en renderizar las páginas como imágenes: rasterizar cada página del PDF a una sola imagen a un DPI elegido, capturando texto, formas vectoriales e imágenes juntas como píxeles aplanados. La salida es una imagen de la página, no la imagen dentro de la página.
Esta herramienta hace el primer tipo. Para un documento de 10 páginas con tres fotografías incrustadas entre las páginas 2 y 7, produce tres archivos de imagen, no diez imágenes de página. Si quiere el segundo tipo, el renderizado de página como imagen, utilice la herramienta PDF a Imagen. Distinguir las dos operaciones es el punto de confusión más común cuando los usuarios llegan por primera vez: los servicios «PDF a JPG» suelen hacer el segundo tipo, y muchos usuarios los encuentran cuando querían el primero. El número de archivos de salida lo delata: una extracción devuelve el número de imágenes incrustadas; un renderizado de página devuelve el número de páginas.
Cómo funciona esta herramienta
La herramienta utiliza PDF.js, el motor de renderizado PDF en JavaScript puro de Mozilla, el mismo motor que impulsa la vista previa PDF integrada de Firefox. Cuando selecciona un PDF, la API File del navegador entrega los bytes a PDF.js sin ningún viaje de ida y vuelta a la red. PDF.js analiza la tabla de referencias cruzadas, el trailer y el catálogo del documento dentro de un Web Worker para que el hilo principal siga siendo receptivo. Para cada página, la herramienta solicita la lista de operadores y recorre cada llamada paintImageXObject y paintInlineImageXObject. Para cada operador de imagen, resuelve el XObject Imagen real a través de la caché de objetos de PDF.js, lo decodifica según su filtro y espacio de color, dibuja el mapa de bits en un canvas fuera de pantalla y exporta el canvas como PNG.
El ancho, el alto y el tamaño aproximado del archivo se registran para la vista de galería. Cuando hace clic en «Descargar todo como ZIP», JSZip agrupa todas las imágenes extraídas en un único archivo en memoria, y el ancla de descarga del navegador activa el guardado. Ninguna parte de este proceso realiza una petición de red. Puede verificarlo directamente: abra las herramientas de desarrollador del navegador en el panel Red antes de seleccionar un PDF, ejecute la extracción y observe que nada sale de su máquina. El motor PDF.js y la biblioteca JSZip se descargan una sola vez en la primera visita y son almacenados en caché por el navegador, por lo que las visitas posteriores cargan al instante y funcionan totalmente sin conexión.
Cómo almacenan imágenes los PDF
Un archivo PDF es un árbol de objetos. El árbol de páginas referencia objetos página; cada objeto página referencia un flujo de contenido y un diccionario de recursos. La entrada XObject del diccionario de recursos asocia nombres cortos (como Im1, Im2) a flujos XObject Imagen. El flujo de contenido los pinta con el operador Do: una secuencia como q 200 0 0 150 50 300 cm /Im1 Do Q significa «establece la transformación, pinta la imagen llamada Im1 desde los recursos, restaura la transformación». Cada XObject Imagen lleva Width y Height (dimensiones en píxeles), ColorSpace (cómo interpretar cada componente), BitsPerComponent (1, 2, 4, 8 o 16) y Filter (la cadena de códecs que comprime los bytes).
El campo Filter es el más importante para un extractor, porque determina si los bytes pueden escribirse directamente o deben decodificarse primero. Seis filtros aparecen en la práctica. DCTDecode almacena los bytes como un archivo JPEG completo, listo para escribir con una extensión .jpg; esto es aproximadamente entre el 60 y el 70 por ciento de las imágenes en PDF en color. JPXDecode es JPEG2000, raro en documentos de consumo pero presente en pipelines de impresión de gama alta. CCITTFaxDecode es la compresión fax Grupo 3 o Grupo 4 para escaneos en blanco y negro de un bit, común en archivos comerciales escaneados. JBIG2Decode es el sucesor más eficiente utilizado por «Reducir tamaño del archivo» de Acrobat y por ABBYY FineReader. FlateDecode son datos de píxeles en bruto comprimidos con zlib, común en gráficos, capturas de pantalla y PDF de herramientas de autoría orientadas a la web. RunLengthDecode es un RLE simple usado sobre todo en PDF más antiguos o construidos a mano.
Imágenes en línea, el caso fácil de pasar por alto
La especificación PDF permite que pequeñas imágenes se incrusten directamente en el flujo de contenido de una página, entre los operadores BI (begin image), ID (image data) y EI (end image), sin convertirse en un XObject con nombre. Fue una optimización de principios de los años 1990 para gráficos diminutos como logotipos, iconos y viñetas, destinada a evitar el coste de un objeto separado para una imagen de unos cientos de bytes. El formato es por lo demás idéntico a un XObject Imagen: los mismos campos de filtro, espacio de color y dimensiones, escritos en forma compacta.
Muchas herramientas de «extracción de imágenes» pierden completamente las imágenes en línea porque recorren la tabla XObject del diccionario de recursos y se detienen ahí. Esta herramienta recorre la lista de operadores de la página y las recoge a través de paintInlineImageXObject. La consecuencia práctica: los PDF con logotipos corporativos en el encabezado (comúnmente en línea) y los PDF de herramientas de autoría más antiguas que usan imágenes en línea para los iconos devuelven más imágenes de las que sugeriría un recorrido ingenuo de XObjects. Si está comparando el conteo de extracciones con otra herramienta, esta es una de las razones de las diferencias. Las otras razones, cubiertas más abajo, son la inclusión de gráficos decorativos, máscaras de plantilla y marcas de agua que algunas herramientas filtran por defecto.
Máscaras suaves, plantillas y transparencia
La transparencia de imagen en PDF rara vez se codifica dentro de la imagen misma. En su lugar, la página compone una imagen en color con una «máscara suave» de un solo canal separada (la entrada SMask del diccionario XObject). El resultado visible en un lector es la composición; la imagen en color extraída sola es opaca. Para imágenes extraídas destinadas a reutilización visual, esto puede producir sorpresas: un logotipo extraído de un PDF donde el autor usó un SMask puede aparecer como un rectángulo opaco en lugar de un PNG con fondo transparente. El comportamiento actual es extraer el XObject Imagen en color sin recomponer el SMask, lo que coincide con el comportamiento de pdfimages -png en la línea de comandos y con el comportamiento de todos los servicios de extracción en la nube que probamos.
Un concepto relacionado es la bandera ImageMask. Cuando ImageMask es true, los bytes no son datos de píxeles; son una plantilla de un bit que define dónde se aplica el color de relleno actual. Extraer un ImageMask de manera aislada produce una silueta en blanco y negro en lugar de una imagen utilizable. La herramienta los reporta en la galería por completitud, pero su utilidad es pequeña a menos que esté específicamente interesado en la silueta. Ordene por dimensiones e ignore las plantillas pequeñas si saturan la vista. La recomposición de máscaras suaves en PNG con canal alfa es una función en la lista de deseos pero actualmente reservada a herramientas de escritorio, porque a veces es destructiva: recomponer cuece el color de fondo en el resultado, lo que puede o no ser lo que quiere.
Espacios de color y su efecto en la salida
La mayoría de los PDF en 2026 utilizan DeviceRGB (similar a sRGB) o DeviceCMYK. PDF.js decodifica ambos de forma transparente, convirtiendo CMYK a RGB antes de pintar en el canvas. El PNG extraído es por tanto siempre RGB, incluso cuando la fuente era CMYK. Para reutilización puramente visual esto es correcto: una imagen CMYK está destinada a la impresión y no se mostraría correctamente en un sitio web sin conversión. Para reproducción impresa, la conversión es aproximada porque el canvas de destino no tiene un perfil de impresión adjunto. Los usuarios que apuntan a impresión deberían conservar el PDF original y no hacer un viaje de ida y vuelta por la extracción; la fidelidad cromática será mejor cuando el pipeline de impresión lea la imagen CMYK directamente.
Los perfiles de color ICCBased adjuntos a las imágenes PDF son respetados por PDF.js durante la decodificación, por lo que el PNG extraído aproxima la apariencia prevista bajo condiciones de visualización estándar. Los espacios de color indexados (imágenes de paleta, el caso típico de 256 colores heredado de importaciones GIF) son desindexados durante la extracción, produciendo un PNG en color completo en lugar de uno basado en paleta. Este es el comportamiento correcto para reutilización visual pero significa que el tamaño de archivo de un PNG extraído puede ser mayor que el tamaño de archivo de la imagen indexada original dentro del PDF. El compromiso es inevitable en el pipeline basado en canvas, y preferimos la fidelidad a la compacidad; los usuarios que quieran los archivos más pequeños posibles pueden pasar la salida por el Compresor de Imágenes después.
Casos de uso reales que motivan la extracción de imágenes
- Reutilizar gráficos para diapositivas o web. Un diseñador o responsable de marketing recibe el entregable de un cliente como PDF y necesita las fotografías y diagramas para una presentación, una renovación de sitio web o una publicación en redes sociales. El clic derecho «guardar imagen» de Acrobat funciona una imagen a la vez; para un informe de 60 páginas con 40 imágenes, eso supone media hora de clics frente a un solo arrastrar y soltar en una pestaña del navegador y una sola descarga ZIP.
- Construir un catálogo de imágenes. Un archivero, un bibliotecario o un auditor de contenido tiene un corpus de PDF y necesita sacar las imágenes para catalogarlas, redactar textos alternativos o construir un índice de búsqueda visual. La extracción por lotes seguida de descarga ZIP es el flujo estándar; integrar un script que recorra carpetas en el escritorio es fácil cuando el lado del navegador ya ha demostrado que la extracción devuelve lo que se espera.
- Portafolios fotográficos entregados como PDF. Los fotógrafos a veces entregan trabajo de cliente como galería PDF en lugar de archivos individuales, especialmente para sesiones de retrato y cobertura de eventos. El cliente quiere los archivos individuales. La extracción los devuelve a la resolución incrustada, que suele ser la resolución que el fotógrafo eligió para la versión impresa.
- Recuperar imágenes de un PDF problemático. Un PDF no se renderiza correctamente en un lector, o se comporta de manera errática, pero la estructura subyacente está lo bastante intacta para que PDF.js pueda analizar los diccionarios de recursos. La extracción recupera las imágenes incrustadas incluso cuando el documento se comporta mal por lo demás. Es un escenario común de rescate para archivos corrompidos en tránsito o guardados con firmas incoherentes.
- Revisión forense y legal. Los revisores que preparan un proceso de descubrimiento o un catálogo de pruebas necesitan que cada imagen de un conjunto de documentos esté listada y sea exportable. La garantía de «todas las imágenes incrustadas» importa: perder una es un problema. La extracción basada en la lista de operadores (en lugar de solo en la tabla XObject) es el enfoque correcto porque captura las imágenes en línea que algunos pipelines descartan silenciosamente.
- Preprocesamiento OCR. Algunos pipelines OCR funcionan mejor con imágenes extraídas que con páginas renderizadas, especialmente cuando las imágenes fuente son escaneos de alta resolución incrustados en un diseño de página de menor resolución. La extracción a la resolución nativa preserva el detalle OCRizable que el renderizado de página a 150 o 300 DPI perdería.
- Investigación académica y periodística. Gráficos, fotografías y diagramas en PDF se extraen para citas de uso legítimo, verificación de hechos frente a las fuentes originales o comparación entre documentos. Los investigadores también suelen querer la resolución nativa de la imagen incrustada para detectar manipulación o artefactos de compresión que el renderizado de página oscurecería.
Trampas habituales y qué significan
- «La herramienta extrajo más imágenes de las que esperaba». Los PDF a menudo contienen imágenes que usted no ve directamente: fondos decorativos repetidos en varias páginas, marcas de agua, ornamentos de encabezado y pie de página, máscaras de transparencia (que técnicamente son XObjects Imagen) y gráficos en línea diminutos como casillas de verificación. Una extracción completa los devuelve todos. Ordene la galería por dimensiones e ignore las miniaturas pequeñas si lo único que quería eran las fotografías principales.
- «La herramienta extrajo menos imágenes de las que esperaba». Lo más frecuente es que el contenido «faltante» no fuera una imagen sino una ilustración vectorial: una exportación de Adobe Illustrator incrustada como operadores de dibujo en lugar de como ráster. El contenido vectorial no es un XObject Imagen y no se puede extraer como imagen. La única forma de capturarlo como ráster es renderizar la página con la herramienta PDF a Imagen. El otro caso es texto que parece una imagen (un título estilizado renderizado con una fuente); el texto tampoco es una imagen.
- «La imagen extraída es opaca pero la versión del documento tiene fondo transparente». El documento usa un SMask separado para la transparencia; el XObject en color por sí solo es opaco. La recomposición de máscaras suaves en la salida se deja a las herramientas de escritorio porque a veces es destructiva (cuece el color de fondo dentro de la imagen). Por ahora, edite el PNG en una herramienta que admita la eliminación automática del fondo, o saque la máscara suave por separado de la galería si necesita la forma alfa.
- «Algunas imágenes parecen de baja resolución». Los PDF a menudo submuestrean las imágenes en el momento de la incrustación para mantener manejable el tamaño del archivo. Una fotografía de 4000 píxeles de ancho importada a un documento y luego pasada por «Reducir tamaño del archivo» de Acrobat puede acabar almacenada a 800 píxeles de ancho. La extracción devuelve la resolución almacenada, no la original. El archivo a la resolución original de la cámara solo se puede recuperar desde la fuente, no desde el PDF.
- «Dos imágenes extraídas parecen mosaicos de una imagen mayor». Algunos generadores de PDF cortan las imágenes grandes en una cuadrícula de mosaicos, especialmente cuando la fuente supera un umbral de tamaño de página. Los mosaicos aparecen como XObjects separados; reconstruir la imagen completa exige reensamblarlos en una herramienta de escritorio con conocimiento del diseño de la página. Es poco común en 2026, ya que las bibliotecas PDF modernas no usan mosaicos por defecto, pero los documentos más antiguos todavía lo muestran ocasionalmente.
- «El PDF tiene 100 páginas pero solo se extrajeron unas pocas imágenes». Muchos PDF están compuestos enteramente por texto y contenido vectorial. Un documento puramente textual contiene cero imágenes incrustadas, independientemente del número de páginas. Si quería cada página como imagen, utilice en su lugar la herramienta PDF a Imagen, que renderiza cada página a un único PNG o JPG capturando texto y vectores juntos.
- «La imagen CMYK tiene colores incorrectos tras la extracción». No realmente, en sentido estricto; la extracción convierte CMYK a RGB para la visualización en pantalla, y la representación en pantalla es aproximada porque el destino no tiene perfil de impresión. Para una reproducción fiel a la impresión, no haga un viaje de ida y vuelta por la extracción PNG. Conserve el PDF original y utilice un flujo de impresión que lea CMYK directamente.
Extracción solo en el navegador frente a la nube
Los servicios de extracción de imágenes en la nube que llenan la parte superior de los resultados de búsqueda (Smallpdf, ILovePDF, PDF24 web, Sejda, CleverPDF) todos suben el PDF a sus servidores, decodifican en el lado del servidor y devuelven un ZIP a su navegador. Sus políticas de privacidad suelen comprometerse a borrar en menos de una hora y a usar TLS en tránsito, y la presión de reputación comercial sobre los grandes operadores es real. Nada de eso cambia el simple hecho estructural de que su documento, y cada imagen dentro de él, residieron brevemente en el almacenamiento de otra persona y pasaron por su software. Para material sensible (historiales médicos, extractos financieros, borradores internos, cualquier cosa cubierta por un acuerdo de confidencialidad), la mejor postura es no dejar nunca que el archivo salga del dispositivo en primer lugar.
Esta herramienta funciona enteramente en la pestaña del navegador. PDF.js analiza el PDF localmente, decodifica las imágenes localmente, las escribe en un canvas local y activa una descarga local. Ninguna petición de red se dispara después de la carga inicial de la página. La prueba está disponible en cualquier navegador: abra el panel Red de las herramientas de desarrollador antes de hacer clic en extraer, ejecute la extracción y observe que no se dispara ninguna petición con su archivo o el contenido de sus imágenes. El coste del procesamiento en el navegador es que los PDF muy grandes (cientos de megabytes) son más lentos de lo que serían en un servidor rápido, pero la postura de privacidad es categóricamente distinta. El límite de 50 MB en esta herramienta está establecido para proteger los dispositivos móviles de quedarse sin memoria, no porque la arquitectura no pueda manejar archivos más grandes en navegadores de escritorio.
Más preguntas frecuentes
¿En qué se diferencia esto de «PDF a JPG» o «PDF a imagen»?
Dos operaciones genuinamente diferentes. «PDF a imagen» rasteriza cada página a una sola imagen, capturando texto, vectores e imágenes como píxeles aplanados; la salida es una imagen de la página. «Extraer imágenes» saca los objetos de imagen individuales que el autor incrustó en el archivo; la salida es la imagen dentro de la página. Para un informe de 10 páginas con tres fotografías entre las páginas 2 y 7, «PDF a imagen» devuelve diez archivos (uno por página); «Extraer imágenes» devuelve tres (las fotografías). Utilice la herramienta PDF a Imagen para el primer tipo.
¿Por qué las imágenes extraídas son PNG cuando las originales eran JPEG?
El pipeline actual hace pasar cada imagen por un canvas HTML, lo que produce un mapa de bits decodificado, y luego recodifica ese mapa de bits como PNG para preservar la transparencia donde está presente. El PNG es sin pérdida: las pérdidas de cuantificación del JPEG ya están horneadas en el mapa de bits y se preservan exactamente, sin una segunda ronda de cuantificación. Los archivos PNG de salida son más grandes que los bytes JPEG originales, pero la calidad no se degrada. Un modo futuro que escriba directamente los bytes JPEG en bruto (correspondiente a pdfimages -j) está en la lista de deseos; la ganancia ahí son archivos más pequeños, no mayor calidad.
¿Encuentra la herramienta todas las imágenes, incluidas las usadas como fondo o en línea?
Sí. La herramienta recorre la lista de operadores de la página y resuelve tanto los XObjects Imagen con nombre (operador de pintura Do) como las imágenes en línea incrustadas directamente en el flujo de contenido entre los operadores BI, ID y EI. Muchas herramientas de extracción pierden las imágenes en línea porque solo recorren la tabla XObject; esta no. Las máscaras de plantilla (ImageMask true) también se reportan, aunque son siluetas más que imágenes y solo son útiles en casos restringidos.
¿Qué tamaño de PDF puedo procesar?
Hasta 50 MB en la implementación actual. El límite lo establece la presión de memoria del navegador en dispositivos móviles: los PDF grandes mantienen en memoria a la vez el documento analizado y las imágenes decodificadas, y superar el montón disponible del dispositivo hará que el sistema operativo cierre la pestaña. Los navegadores de escritorio normalmente pueden manejar considerablemente más; el tope es conservador por seguridad. Para documentos muy grandes, el pdfimages -all de escritorio de poppler-utils es la herramienta adecuada.
¿Cambia la extracción los derechos de autor de las imágenes?
No. Las imágenes incrustadas en un PDF conservan los derechos que pertenezcan al autor del documento, al fotógrafo o al titular de la licencia. Extraer una imagen de un PDF al que tiene acceso legal es mecánicamente equivalente a hacer una captura de pantalla; lo que haga con el archivo extraído se rige por las mismas reglas de derechos de autor que la fuente. El uso como referencia personal suele ser poco controvertido; la redistribución o el uso comercial dependen de los términos de licencia de la fuente.
¿Existe un equivalente en línea de comandos o de escritorio?
Sí, dos sólidos. pdfimages de poppler-utils es el equivalente más cercano: pdfimages -all input.pdf prefix- extrae cada imagen en su codificación original cuando es posible. Instálelo con brew install poppler en macOS, apt install poppler-utils en Debian o Ubuntu, o descargue los binarios de Windows desde el sitio del proyecto. El otro es mutool extract de MuPDF, que extrae imágenes y fuentes juntas. Ambos son locales, gratuitos y están bien mantenidos.