Extraction d'images de PDF en ligne, gratuite
Extrayez instantanément toutes les images intégrées dans vos fichiers PDF. Prévisualisez-les avec leurs dimensions, téléchargez-les individuellement ou en archive ZIP.
Prend en charge PDF · jusqu'à 50 Mo
Comment ça marche
- Importer le PDF : Déposez ou sélectionnez un fichier PDF pour en extraire les images.
- Extraction automatique : L'outil analyse toutes les pages et extrait chaque image intégrée, puis les affiche dans une grille avec leurs dimensions et leur taille.
- Télécharger les images : Cliquez sur une image pour la télécharger individuellement, ou utilisez « Télécharger tout en ZIP » pour récupérer l'ensemble des images extraites.
Pourquoi extraire les images d'un PDF ?
Extraire les images d'un PDF est utile pour réutiliser du contenu, récupérer des graphiques pour des présentations ou des sites web, archiver des documents visuels ou partager des images isolées sans transmettre le PDF entier. L'extraction préserve la qualité d'origine : aucun retraitement n'intervient, seules les images intégrées sont exportées telles quelles.
Fonctionnalités
- Extraction complète : Extrait tous les objets image intégrés dans chaque page du PDF.
- Qualité préservée : Les formats d'origine (PNG, JPG, TIFF, etc.) et la qualité sont conservés, aucun retraitement ni compression.
- Prévisualisation des images : Visualisez toutes les images extraites dans une grille défilante, avec leurs dimensions, leur format et leur taille.
- Téléchargement individuel ou groupé : Téléchargez chaque image séparément ou toutes les images dans une archive ZIP.
- Affichage des métadonnées : Chaque image indique sa largeur, sa hauteur, son format et sa taille approximative.
- Confidentialité : Tout le traitement se fait localement dans votre navigateur. Aucun fichier n'est envoyé à un serveur.
- Rapide : Extraction en temps réel, sans attente ni file.
Questions fréquentes
La qualité des images est-elle préservée lors de l'extraction ?
Oui. L'outil extrait les images dans leur format d'origine, sans retraitement ni recompression. La qualité est exactement celle intégrée dans le PDF.
Quels formats d'image peuvent être extraits ?
L'outil extrait les images dans leurs formats d'origine intégrés : PNG, JPG, TIFF, GIF, JPEG2000 et d'autres formats courants. Les fichiers extraits conservent leur format et leur qualité d'origine.
Puis-je voir les dimensions des images avant de les télécharger ?
Oui. Chaque image de la grille de prévisualisation affiche sa largeur et sa hauteur en pixels, ainsi que son format et sa taille approximative. Cela vous aide à identifier et à choisir les images à télécharger.
Puis-je télécharger les images individuellement ?
Oui. Cliquez sur le bouton de téléchargement d'une image pour la récupérer immédiatement. Vous pouvez aussi utiliser « Télécharger tout en ZIP » pour récupérer l'ensemble des images extraites dans une seule archive.
L'outil extrait-il les images utilisées comme arrière-plans ou décorations ?
Oui. L'outil extrait tous les objets image intégrés dans le PDF, y compris les images utilisées comme arrière-plans, décorations ou illustrations, sur l'ensemble des pages.
Mes PDF sont-ils envoyés à un serveur ?
Non. Toute l’extraction se fait localement dans votre navigateur avec PDF.js. Vos PDF ne quittent jamais votre appareil, garantissant confidentialité et sécurité.
Quelle est la limite de taille de fichier ?
Les PDF jusqu'à 50 Mo sont pris en charge. La vitesse d'extraction dépend du nombre de pages et d'images intégrées. Les PDF volumineux contenant beaucoup d'images peuvent prendre quelques instants à traiter.
Puis-je extraire des images sur mobile ?
Oui. Cet outil fonctionne sur les navigateurs de bureau, tablette et mobile. Appuyez simplement pour sélectionner un PDF : toutes les images seront extraites et affichées pour le téléchargement.
Ce que signifie réellement « extraire les images d'un PDF »
L'expression courante « extraire les images d'un PDF » est ambiguë, et cette ambiguïté a une incidence sur ce que l'outil livre. Deux opérations véritablement différentes se cachent derrière les mêmes mots. La première consiste à extraire les objets d'image incorporés : parcourir le document, identifier chaque XObject Image (ou image en ligne) que l'auteur a placé dans le fichier, et réécrire chacune en tant que PNG autonome. La sortie est ce que l'auteur du document a effectivement placé dans le fichier, à la résolution à laquelle il l'a placé. La seconde consiste à rendre les pages sous forme d'images : rasteriser chaque page PDF en une seule image à une résolution choisie, en capturant texte, formes vectorielles et images ensemble sous forme de pixels aplatis. La sortie est une image de la page, pas l'image qui se trouve dans la page.
Cet outil fait le premier travail. Pour un document de 10 pages avec trois photographies incorporées sur les pages 2 et 7, il produit trois fichiers image, pas dix images de page. Si vous voulez le second type, le rendu de la page comme image, utilisez l'outil PDF vers Image. Distinguer les deux opérations est le point de confusion le plus fréquent quand les utilisateurs arrivent : les services « PDF en JPG » font généralement le second type, et beaucoup d'utilisateurs les trouvent quand ils voulaient le premier. Le nombre de fichiers de sortie est le révélateur : une extraction renvoie le nombre d'images incorporées ; un rendu de page renvoie le nombre de pages.
Comment fonctionne cet outil
L'outil utilise PDF.js, le moteur de rendu PDF en JavaScript pur de Mozilla, le même moteur qui propulse l'aperçu PDF intégré de Firefox. Quand vous sélectionnez un PDF, l'API File du navigateur transmet les octets à PDF.js sans aucun aller-retour réseau. PDF.js analyse la table de références croisées, le trailer et le catalogue du document à l'intérieur d'un Web Worker pour que le thread principal reste réactif. Pour chaque page, l'outil demande la liste d'opérateurs et parcourt chaque appel paintImageXObject et paintInlineImageXObject. Pour chaque opérateur d'image, il résout le véritable XObject Image via le cache d'objets de PDF.js, le décode selon son filtre et son espace de couleur, dessine le bitmap sur un canvas hors-écran et exporte le canvas sous forme de PNG.
Largeur, hauteur et taille de fichier approximative sont enregistrées pour la vue galerie. Quand vous cliquez sur « Télécharger tout en ZIP », JSZip regroupe toutes les images extraites dans une seule archive en mémoire, et l'ancre de téléchargement du navigateur déclenche la sauvegarde. Aucune partie de ce processus ne fait de requête réseau. Vous pouvez le vérifier directement : ouvrez les outils de développement du navigateur sur l'onglet Réseau avant de sélectionner un PDF, lancez l'extraction, et observez que rien ne quitte votre machine. Le moteur PDF.js et la bibliothèque JSZip sont téléchargés une fois lors de la première visite et mis en cache par le navigateur, donc les visites suivantes se chargent instantanément et fonctionnent entièrement hors ligne.
Comment les PDF stockent les images
Un fichier PDF est un arbre d'objets. L'arbre des pages référence des objets page ; chaque objet page référence un flux de contenu et un dictionnaire de ressources. L'entrée XObject du dictionnaire de ressources associe des noms courts (comme Im1, Im2) à des flux XObject Image. Le flux de contenu les peint avec l'opérateur Do : une séquence comme q 200 0 0 150 50 300 cm /Im1 Do Q signifie « définir la transformation, peindre l'image nommée Im1 à partir des ressources, restaurer la transformation ». Chaque XObject Image porte Width et Height (dimensions en pixels), ColorSpace (comment interpréter chaque composant), BitsPerComponent (1, 2, 4, 8 ou 16) et Filter (la chaîne de codecs qui compresse les octets).
Le champ Filter est le plus important pour un extracteur, car il détermine si les octets peuvent être écrits directement ou doivent d'abord être décodés. Six filtres apparaissent en pratique. DCTDecode stocke les octets sous forme de fichier JPEG complet, prêt à être écrit avec une extension .jpg ; cela représente environ 60 à 70 pour cent des images dans les PDF en couleur. JPXDecode correspond au JPEG2000, rare dans les documents grand public mais présent dans les pipelines d'impression haut de gamme. CCITTFaxDecode est la compression fax Groupe 3 ou Groupe 4 pour les scans noir et blanc à un bit, courante dans les archives professionnelles numérisées. JBIG2Decode est le successeur plus efficace utilisé par le « Réduire la taille du fichier » d'Acrobat et par ABBYY FineReader. FlateDecode est de la donnée pixel brute compressée par zlib, courante dans les graphismes, les captures d'écran et les PDF issus d'outils d'édition orientés web. RunLengthDecode est un simple RLE utilisé surtout dans des PDF plus anciens ou construits à la main.
Les images en ligne, le cas facile à manquer
La spécification PDF permet à de petites images d'être incorporées directement dans le flux de contenu d'une page, entre les opérateurs BI (begin image), ID (image data) et EI (end image), sans devenir un XObject nommé. C'était une optimisation du début des années 1990 pour les très petits graphismes comme les logos, les icônes et les puces, destinée à éviter le surcoût d'un objet séparé pour une image de quelques centaines d'octets. Le format est par ailleurs identique à un XObject Image : les mêmes champs de filtre, d'espace de couleur et de dimensions, écrits sous forme compacte.
Beaucoup d'outils d'« extraction d'images » manquent complètement les images en ligne parce qu'ils parcourent la table XObject du dictionnaire de ressources et s'arrêtent là. Cet outil parcourt la liste d'opérateurs de la page et les capte via paintInlineImageXObject. La conséquence pratique : les PDF avec des logos d'entreprise dans l'en-tête (souvent en ligne) et les PDF issus d'outils d'édition plus anciens qui utilisent des images en ligne pour les icônes renvoient plus d'images qu'un parcours naïf des XObject ne le suggérerait. Si vous comparez le nombre d'images extraites avec celui d'un autre outil, c'est l'une des raisons des différences. Les autres raisons, couvertes plus bas, sont l'inclusion des graphismes décoratifs, des masques pochoirs et des filigranes que certains outils filtrent par défaut.
Masques doux, pochoirs et transparence
La transparence d'image en PDF est rarement encodée à l'intérieur de l'image elle-même. À la place, la page compose une image couleur avec un « masque doux » monocanal séparé (l'entrée SMask du dictionnaire XObject). Le résultat visible dans un lecteur est la composition ; l'image couleur extraite seule est opaque. Pour les images extraites destinées à un réemploi visuel, cela peut produire des surprises : un logo extrait d'un PDF où l'auteur a utilisé un SMask peut apparaître comme un rectangle opaque plutôt que comme un PNG à fond transparent. Le comportement actuel consiste à extraire le XObject Image couleur sans recomposer le SMask, ce qui correspond au comportement de pdfimages -png en ligne de commande et au comportement de tous les services d'extraction cloud que nous avons testés.
Un concept lié est l'indicateur ImageMask. Quand ImageMask vaut true, les octets ne sont pas des données de pixels ; ce sont un pochoir à un bit qui définit où la couleur de remplissage courante est appliquée. Extraire un ImageMask isolément produit une silhouette en noir et blanc plutôt qu'une image utilisable. L'outil les signale dans la galerie pour être complet, mais leur utilité est faible sauf si vous vous intéressez spécifiquement à la silhouette. Triez par dimensions et ignorez les petits pochoirs s'ils encombrent la vue. La recomposition des masques doux en PNG porteurs d'alpha est une fonctionnalité figurant sur la liste de souhaits mais actuellement laissée aux outils de bureau, car elle est parfois destructive : recomposer cuit la couleur de fond dans le résultat, ce qui peut être ou non ce que vous voulez.
Espaces de couleur et leurs conséquences sur la sortie
La plupart des PDF en 2026 utilisent DeviceRGB (similaire à sRGB) ou DeviceCMYK. PDF.js décode les deux de manière transparente, en convertissant le CMYK en RGB avant de peindre sur le canvas. Le PNG extrait est donc toujours en RGB, même quand la source était en CMYK. Pour un simple réemploi visuel c'est correct : une image CMYK est destinée à l'impression et ne s'afficherait pas correctement sur un site web sans conversion. Pour la reproduction imprimée, la conversion est approximative car le canvas de destination n'a pas de profil d'impression attaché. Les utilisateurs visant l'impression devraient garder le PDF original et ne pas faire d'aller-retour par l'extraction ; la fidélité chromatique sera meilleure quand le pipeline d'impression lira l'image CMYK directement.
Les profils de couleur ICCBased attachés aux images PDF sont respectés par PDF.js lors du décodage, donc le PNG extrait approche l'apparence prévue dans des conditions d'affichage standard. Les espaces de couleur indexés (images de palette, le cas typique des 256 couleurs hérité des imports GIF) sont désindexés lors de l'extraction, produisant un PNG en couleurs complètes plutôt qu'à base de palette. C'est le bon comportement pour le réemploi visuel mais cela signifie que la taille d'un PNG extrait peut être plus grande que la taille de l'image indexée originale à l'intérieur du PDF. Le compromis est inévitable dans le pipeline basé sur canvas, et nous préférons la fidélité à la compacité ; les utilisateurs qui veulent les plus petits fichiers possibles peuvent passer la sortie par le Compresseur d'Images ensuite.
Cas d'usage réels qui motivent l'extraction d'images
- Réemployer des graphismes pour des diapositives ou le web. Un designer ou un responsable marketing reçoit le livrable d'un client sous forme de PDF et a besoin des photographies et des diagrammes pour une présentation, une refonte de site web ou un post sur les réseaux sociaux. Le clic droit « enregistrer l'image » d'Acrobat fonctionne une image à la fois ; pour un rapport de 60 pages avec 40 images, c'est une demi-heure de clics contre un simple glisser-déposer dans un onglet de navigateur et un seul téléchargement ZIP.
- Construire un catalogue d'images. Un archiviste, un bibliothécaire ou un auditeur de contenu a un corpus de PDF et a besoin de sortir les images pour les cataloguer, rédiger des textes alternatifs ou construire un index de recherche visuelle. L'extraction par lots suivie d'un téléchargement ZIP est le flux standard ; intégrer un script de parcours de dossier sur le bureau est facile quand le côté navigateur a déjà prouvé que l'extraction renvoie ce qui est attendu.
- Portfolios photographiques livrés en PDF. Les photographes livrent occasionnellement leur travail client sous forme de galerie PDF plutôt que de fichiers individuels, en particulier pour les séances portrait et la couverture d'événements. Le client veut les fichiers individuels. L'extraction les renvoie à la résolution incorporée, qui correspond généralement à la résolution que le photographe a choisie pour la version imprimée.
- Récupérer des images d'un PDF problématique. Un PDF ne s'affiche pas correctement dans un lecteur, ou se comporte de manière erratique, mais la structure sous-jacente est suffisamment intacte pour que PDF.js puisse analyser les dictionnaires de ressources. L'extraction récupère les images incorporées même quand le document se comporte mal par ailleurs. C'est un scénario de sauvetage fréquent pour les fichiers corrompus en transit ou sauvegardés avec des signatures incohérentes.
- Examen forensique et juridique. Les examinateurs qui préparent un dossier de découverte ou un catalogage de preuves ont besoin que chaque image d'un ensemble de documents soit listée et exportable. La garantie « toutes les images incorporées » compte : en manquer une est un problème. L'extraction basée sur la liste d'opérateurs (plutôt que sur la table XObject uniquement) est la bonne approche car elle attrape les images en ligne que certains pipelines laissent silencieusement passer.
- Prétraitement OCR. Certains pipelines OCR fonctionnent mieux sur des images extraites que sur des pages rendues, en particulier quand les images sources sont des scans haute résolution incorporés dans une mise en page de plus basse résolution. L'extraction à la résolution native préserve le détail OCRisable que le rendu de page à 150 ou 300 DPI perdrait.
- Recherche académique et journalistique. Graphiques, photographies et diagrammes des PDF sont extraits pour citation en usage équitable, vérification des faits par rapport aux sources originales ou comparaison entre documents. Les chercheurs veulent aussi souvent la résolution native de l'image incorporée pour détecter une manipulation ou des artefacts de compression que le rendu de page obscurcirait.
Pièges courants et ce qu'ils signifient
- « L'outil a extrait plus d'images que je n'en attendais. » Les PDF contiennent souvent des images que vous ne voyez pas directement : fonds décoratifs répétés sur plusieurs pages, filigranes, ornements d'en-tête et de pied de page, masques de transparence (qui sont techniquement des XObject Image) et minuscules graphismes en ligne comme les cases à cocher. Une extraction complète les renvoie tous. Triez la galerie par dimensions et ignorez les petites vignettes si tout ce que vous vouliez, c'était les photographies principales.
- « L'outil a extrait moins d'images que je n'en attendais. » Le plus souvent, le contenu « manquant » n'était pas une image mais une illustration vectorielle : un export Adobe Illustrator incorporé sous forme d'opérateurs de dessin plutôt que de raster. Le contenu vectoriel n'est pas un XObject Image et n'est pas extractible en tant qu'image. La seule façon de le capturer en raster est de rendre la page via l'outil PDF vers Image. L'autre cas est du texte qui ressemble à une image (un titre stylisé rendu avec une police) ; le texte n'est pas non plus une image.
- « L'image extraite est opaque mais la version dans le document a un fond transparent. » Le document utilise un SMask séparé pour la transparence ; le XObject couleur seul est opaque. La recomposition des masques doux dans la sortie est laissée aux outils de bureau car elle est parfois destructive (elle cuit la couleur de fond dans l'image). Pour l'instant, éditez le PNG dans un outil qui supporte la suppression automatique d'arrière-plan, ou tirez le masque doux séparément depuis la galerie si vous avez besoin de la forme alpha.
- « Certaines images ont l'air en basse résolution. » Les PDF sous-échantillonnent souvent les images au moment de l'incorporation pour garder la taille du fichier gérable. Une photographie de 4000 pixels de large importée dans un document puis passée par « Réduire la taille du fichier » d'Acrobat peut finir stockée à 800 pixels de large. L'extraction renvoie la résolution stockée, pas la résolution d'origine. Le fichier à la résolution caméra d'origine ne se récupère que depuis la source, pas depuis le PDF.
- « Deux images extraites ressemblent à des tuiles d'une image plus grande. » Certains générateurs de PDF découpent les grandes images en grille de tuiles, en particulier quand la source dépasse un seuil de taille de page. Les tuiles apparaissent comme des XObject séparés ; reconstituer l'image entière exige de les réassembler dans un outil de bureau ayant connaissance de la mise en page. C'est rare en 2026, car les bibliothèques PDF modernes ne tuile plus par défaut, mais les documents plus anciens en montrent encore occasionnellement.
- « Le PDF a 100 pages mais seules quelques images ont été extraites. » Beaucoup de PDF sont entièrement composés de texte et de contenu vectoriel. Un document purement textuel contient zéro image incorporée, quel que soit le nombre de pages. Si vous vouliez chaque page comme image, utilisez plutôt l'outil PDF vers Image, qui rend chaque page en un seul PNG ou JPG capturant texte et vecteurs ensemble.
- « L'image CMYK a les mauvaises couleurs après extraction. » Pas vraiment, au sens strict ; l'extraction convertit le CMYK en RGB pour l'affichage écran, et le rendu à l'écran est approximatif car la destination n'a pas de profil d'impression. Pour une reproduction fidèle à l'impression, ne faites pas d'aller-retour par l'extraction PNG. Gardez le PDF original et utilisez un flux d'impression qui lit le CMYK directement.
Extraction navigateur uniquement versus cloud
Les services d'extraction d'images cloud qui occupent le haut des résultats de recherche (Smallpdf, ILovePDF, PDF24 web, Sejda, CleverPDF) téléchargent tous le PDF sur leurs serveurs, décodent côté serveur, et renvoient un ZIP à votre navigateur. Leurs politiques de confidentialité s'engagent généralement sur une suppression dans l'heure et du TLS en transit, et la pression de réputation commerciale sur les opérateurs majeurs est réelle. Rien de tout cela ne change le simple fait structurel que votre document, et chaque image qu'il contient, ont brièvement résidé sur le stockage de quelqu'un d'autre et ont traversé son logiciel. Pour du matériel sensible (dossiers médicaux, relevés financiers, brouillons internes, tout ce qui est couvert par un accord de confidentialité), la meilleure posture est de ne jamais laisser le fichier quitter l'appareil au départ.
Cet outil tourne entièrement dans l'onglet du navigateur. PDF.js analyse le PDF localement, décode les images localement, les écrit sur un canvas local et déclenche un téléchargement local. Aucune requête réseau ne part après le chargement initial de la page. La preuve est disponible dans n'importe quel navigateur : ouvrez l'onglet Réseau des outils de développement avant de cliquer sur extraire, lancez l'extraction et observez qu'aucune requête ne part avec votre fichier ou le contenu de vos images. Le coût du traitement dans le navigateur est que les très gros PDF (des centaines de mégaoctets) sont plus lents qu'ils ne le seraient sur un serveur rapide, mais la posture de confidentialité est catégoriquement différente. La limite de 50 Mo dans cet outil est fixée pour protéger les appareils mobiles d'un dépassement de mémoire, pas parce que l'architecture ne peut pas gérer des fichiers plus grands sur les navigateurs de bureau.
Questions fréquentes supplémentaires
En quoi est-ce différent de « PDF en JPG » ou « PDF en image » ?
Deux opérations véritablement différentes. « PDF en image » rasterise chaque page en une seule image, en capturant texte, vecteurs et images sous forme de pixels aplatis ; la sortie est une image de la page. « Extraire les images » sort les objets image individuels que l'auteur a incorporés dans le fichier ; la sortie est l'image qui se trouve dans la page. Pour un rapport de 10 pages avec trois photographies sur les pages 2 et 7, « PDF en image » renvoie dix fichiers (un par page) ; « Extraire les images » en renvoie trois (les photographies). Utilisez l'outil PDF vers Image pour le premier type.
Pourquoi les images extraites sont-elles en PNG alors que les originales étaient en JPEG ?
Le pipeline actuel fait passer chaque image par un canvas HTML, ce qui produit un bitmap décodé, puis ré-encode ce bitmap en PNG pour préserver la transparence quand elle est présente. Le PNG est sans perte : les pertes de quantification du JPEG sont déjà cuites dans le bitmap et sont préservées exactement, sans deuxième tour de quantification. Les fichiers PNG de sortie sont plus gros que les octets JPEG d'origine, mais la qualité n'est pas dégradée. Un mode futur qui écrirait directement les octets JPEG bruts (correspondant à pdfimages -j) figure sur la liste de souhaits ; le gain là est des fichiers plus petits, pas une meilleure qualité.
L'outil trouve-t-il toutes les images, y compris celles utilisées comme arrière-plan ou en ligne ?
Oui. L'outil parcourt la liste d'opérateurs de la page et résout à la fois les XObject Image nommés (opérateur de peinture Do) et les images en ligne incorporées directement dans le flux de contenu entre les opérateurs BI, ID et EI. Beaucoup d'outils d'extraction manquent les images en ligne parce qu'ils ne parcourent que la table XObject ; cet outil-ci les attrape. Les masques pochoirs (ImageMask à true) sont également signalés, bien qu'ils soient des silhouettes plutôt que des images et ne soient utiles que dans des cas restreints.
Quelle taille de PDF puis-je traiter ?
Jusqu'à 50 Mo dans l'implémentation actuelle. La limite est fixée par la pression mémoire du navigateur sur les appareils mobiles : les gros PDF conservent en mémoire à la fois le document analysé et les images décodées, et dépasser le tas disponible de l'appareil provoque la fermeture de l'onglet par le système. Les navigateurs de bureau peuvent généralement en gérer beaucoup plus ; le plafond est conservateur par sécurité. Pour des documents très volumineux, le pdfimages -all de bureau issu de poppler-utils est le bon outil.
L'extraction modifie-t-elle les droits d'auteur des images ?
Non. Les images incorporées dans un PDF conservent les droits qui appartiennent à l'auteur du document, au photographe ou au titulaire de la licence. Extraire une image d'un PDF auquel vous avez un accès légal est mécaniquement équivalent à en faire une capture d'écran ; ce que vous faites du fichier extrait est régi par les mêmes règles de droit d'auteur que la source. L'usage en référence personnelle est généralement non controversé ; la redistribution ou la réutilisation commerciale dépend des termes de licence de la source.
Existe-t-il un équivalent en ligne de commande ou sur le bureau ?
Oui, deux solides. pdfimages de poppler-utils est l'équivalent le plus proche : pdfimages -all input.pdf prefix- extrait chaque image dans son encodage d'origine quand c'est possible. Installez-le avec brew install poppler sur macOS, apt install poppler-utils sur Debian ou Ubuntu, ou téléchargez les binaires Windows depuis le site du projet. L'autre est mutool extract de MuPDF, qui extrait les images et les polices ensemble. Les deux sont locaux, gratuits et bien maintenus.