Extraction d'images de PDF en ligne, gratuite

Extrayez instantanément toutes les images intégrées dans vos fichiers PDF. Prévisualisez-les avec leurs dimensions, téléchargez-les individuellement ou en archive ZIP.

Vos fichiers ne quittent jamais votre appareil
Déposez le fichier PDF ici ou cliquez pour parcourir

Prend en charge PDF · jusqu'à 50 Mo

Traitement : 0 %

Comment ça marche

  1. Importer le PDF : Déposez ou sélectionnez un fichier PDF pour en extraire les images.
  2. Extraction automatique : L'outil analyse toutes les pages et extrait chaque image intégrée, puis les affiche dans une grille avec leurs dimensions et leur taille.
  3. Télécharger les images : Cliquez sur une image pour la télécharger individuellement, ou utilisez « Télécharger tout en ZIP » pour récupérer l'ensemble des images extraites.

Pourquoi extraire les images d'un PDF ?

Extraire les images d'un PDF est utile pour réutiliser du contenu, récupérer des graphiques pour des présentations ou des sites web, archiver des documents visuels ou partager des images isolées sans transmettre le PDF entier. L'extraction préserve la qualité d'origine : aucun retraitement n'intervient, seules les images intégrées sont exportées telles quelles.

Fonctionnalités

Questions fréquentes

La qualité des images est-elle préservée lors de l'extraction ?

Oui. L'outil extrait les images dans leur format d'origine, sans retraitement ni recompression. La qualité est exactement celle intégrée dans le PDF.

Quels formats d'image peuvent être extraits ?

L'outil extrait les images dans leurs formats d'origine intégrés : PNG, JPG, TIFF, GIF, JPEG2000 et d'autres formats courants. Les fichiers extraits conservent leur format et leur qualité d'origine.

Puis-je voir les dimensions des images avant de les télécharger ?

Oui. Chaque image de la grille de prévisualisation affiche sa largeur et sa hauteur en pixels, ainsi que son format et sa taille approximative. Cela vous aide à identifier et à choisir les images à télécharger.

Puis-je télécharger les images individuellement ?

Oui. Cliquez sur le bouton de téléchargement d'une image pour la récupérer immédiatement. Vous pouvez aussi utiliser « Télécharger tout en ZIP » pour récupérer l'ensemble des images extraites dans une seule archive.

L'outil extrait-il les images utilisées comme arrière-plans ou décorations ?

Oui. L'outil extrait tous les objets image intégrés dans le PDF, y compris les images utilisées comme arrière-plans, décorations ou illustrations, sur l'ensemble des pages.

Mes PDF sont-ils envoyés à un serveur ?

Non. Toute l’extraction se fait localement dans votre navigateur avec PDF.js. Vos PDF ne quittent jamais votre appareil, garantissant confidentialité et sécurité.

Quelle est la limite de taille de fichier ?

Les PDF jusqu'à 50 Mo sont pris en charge. La vitesse d'extraction dépend du nombre de pages et d'images intégrées. Les PDF volumineux contenant beaucoup d'images peuvent prendre quelques instants à traiter.

Puis-je extraire des images sur mobile ?

Oui. Cet outil fonctionne sur les navigateurs de bureau, tablette et mobile. Appuyez simplement pour sélectionner un PDF : toutes les images seront extraites et affichées pour le téléchargement.

Ce que signifie réellement « extraire les images d'un PDF »

L'expression courante « extraire les images d'un PDF » est ambiguë, et cette ambiguïté a une incidence sur ce que l'outil livre. Deux opérations véritablement différentes se cachent derrière les mêmes mots. La première consiste à extraire les objets d'image incorporés : parcourir le document, identifier chaque XObject Image (ou image en ligne) que l'auteur a placé dans le fichier, et réécrire chacune en tant que PNG autonome. La sortie est ce que l'auteur du document a effectivement placé dans le fichier, à la résolution à laquelle il l'a placé. La seconde consiste à rendre les pages sous forme d'images : rasteriser chaque page PDF en une seule image à une résolution choisie, en capturant texte, formes vectorielles et images ensemble sous forme de pixels aplatis. La sortie est une image de la page, pas l'image qui se trouve dans la page.

Cet outil fait le premier travail. Pour un document de 10 pages avec trois photographies incorporées sur les pages 2 et 7, il produit trois fichiers image, pas dix images de page. Si vous voulez le second type, le rendu de la page comme image, utilisez l'outil PDF vers Image. Distinguer les deux opérations est le point de confusion le plus fréquent quand les utilisateurs arrivent : les services « PDF en JPG » font généralement le second type, et beaucoup d'utilisateurs les trouvent quand ils voulaient le premier. Le nombre de fichiers de sortie est le révélateur : une extraction renvoie le nombre d'images incorporées ; un rendu de page renvoie le nombre de pages.

Comment fonctionne cet outil

L'outil utilise PDF.js, le moteur de rendu PDF en JavaScript pur de Mozilla, le même moteur qui propulse l'aperçu PDF intégré de Firefox. Quand vous sélectionnez un PDF, l'API File du navigateur transmet les octets à PDF.js sans aucun aller-retour réseau. PDF.js analyse la table de références croisées, le trailer et le catalogue du document à l'intérieur d'un Web Worker pour que le thread principal reste réactif. Pour chaque page, l'outil demande la liste d'opérateurs et parcourt chaque appel paintImageXObject et paintInlineImageXObject. Pour chaque opérateur d'image, il résout le véritable XObject Image via le cache d'objets de PDF.js, le décode selon son filtre et son espace de couleur, dessine le bitmap sur un canvas hors-écran et exporte le canvas sous forme de PNG.

Largeur, hauteur et taille de fichier approximative sont enregistrées pour la vue galerie. Quand vous cliquez sur « Télécharger tout en ZIP », JSZip regroupe toutes les images extraites dans une seule archive en mémoire, et l'ancre de téléchargement du navigateur déclenche la sauvegarde. Aucune partie de ce processus ne fait de requête réseau. Vous pouvez le vérifier directement : ouvrez les outils de développement du navigateur sur l'onglet Réseau avant de sélectionner un PDF, lancez l'extraction, et observez que rien ne quitte votre machine. Le moteur PDF.js et la bibliothèque JSZip sont téléchargés une fois lors de la première visite et mis en cache par le navigateur, donc les visites suivantes se chargent instantanément et fonctionnent entièrement hors ligne.

Comment les PDF stockent les images

Un fichier PDF est un arbre d'objets. L'arbre des pages référence des objets page ; chaque objet page référence un flux de contenu et un dictionnaire de ressources. L'entrée XObject du dictionnaire de ressources associe des noms courts (comme Im1, Im2) à des flux XObject Image. Le flux de contenu les peint avec l'opérateur Do : une séquence comme q 200 0 0 150 50 300 cm /Im1 Do Q signifie « définir la transformation, peindre l'image nommée Im1 à partir des ressources, restaurer la transformation ». Chaque XObject Image porte Width et Height (dimensions en pixels), ColorSpace (comment interpréter chaque composant), BitsPerComponent (1, 2, 4, 8 ou 16) et Filter (la chaîne de codecs qui compresse les octets).

Le champ Filter est le plus important pour un extracteur, car il détermine si les octets peuvent être écrits directement ou doivent d'abord être décodés. Six filtres apparaissent en pratique. DCTDecode stocke les octets sous forme de fichier JPEG complet, prêt à être écrit avec une extension .jpg ; cela représente environ 60 à 70 pour cent des images dans les PDF en couleur. JPXDecode correspond au JPEG2000, rare dans les documents grand public mais présent dans les pipelines d'impression haut de gamme. CCITTFaxDecode est la compression fax Groupe 3 ou Groupe 4 pour les scans noir et blanc à un bit, courante dans les archives professionnelles numérisées. JBIG2Decode est le successeur plus efficace utilisé par le « Réduire la taille du fichier » d'Acrobat et par ABBYY FineReader. FlateDecode est de la donnée pixel brute compressée par zlib, courante dans les graphismes, les captures d'écran et les PDF issus d'outils d'édition orientés web. RunLengthDecode est un simple RLE utilisé surtout dans des PDF plus anciens ou construits à la main.

Les images en ligne, le cas facile à manquer

La spécification PDF permet à de petites images d'être incorporées directement dans le flux de contenu d'une page, entre les opérateurs BI (begin image), ID (image data) et EI (end image), sans devenir un XObject nommé. C'était une optimisation du début des années 1990 pour les très petits graphismes comme les logos, les icônes et les puces, destinée à éviter le surcoût d'un objet séparé pour une image de quelques centaines d'octets. Le format est par ailleurs identique à un XObject Image : les mêmes champs de filtre, d'espace de couleur et de dimensions, écrits sous forme compacte.

Beaucoup d'outils d'« extraction d'images » manquent complètement les images en ligne parce qu'ils parcourent la table XObject du dictionnaire de ressources et s'arrêtent là. Cet outil parcourt la liste d'opérateurs de la page et les capte via paintInlineImageXObject. La conséquence pratique : les PDF avec des logos d'entreprise dans l'en-tête (souvent en ligne) et les PDF issus d'outils d'édition plus anciens qui utilisent des images en ligne pour les icônes renvoient plus d'images qu'un parcours naïf des XObject ne le suggérerait. Si vous comparez le nombre d'images extraites avec celui d'un autre outil, c'est l'une des raisons des différences. Les autres raisons, couvertes plus bas, sont l'inclusion des graphismes décoratifs, des masques pochoirs et des filigranes que certains outils filtrent par défaut.

Masques doux, pochoirs et transparence

La transparence d'image en PDF est rarement encodée à l'intérieur de l'image elle-même. À la place, la page compose une image couleur avec un « masque doux » monocanal séparé (l'entrée SMask du dictionnaire XObject). Le résultat visible dans un lecteur est la composition ; l'image couleur extraite seule est opaque. Pour les images extraites destinées à un réemploi visuel, cela peut produire des surprises : un logo extrait d'un PDF où l'auteur a utilisé un SMask peut apparaître comme un rectangle opaque plutôt que comme un PNG à fond transparent. Le comportement actuel consiste à extraire le XObject Image couleur sans recomposer le SMask, ce qui correspond au comportement de pdfimages -png en ligne de commande et au comportement de tous les services d'extraction cloud que nous avons testés.

Un concept lié est l'indicateur ImageMask. Quand ImageMask vaut true, les octets ne sont pas des données de pixels ; ce sont un pochoir à un bit qui définit où la couleur de remplissage courante est appliquée. Extraire un ImageMask isolément produit une silhouette en noir et blanc plutôt qu'une image utilisable. L'outil les signale dans la galerie pour être complet, mais leur utilité est faible sauf si vous vous intéressez spécifiquement à la silhouette. Triez par dimensions et ignorez les petits pochoirs s'ils encombrent la vue. La recomposition des masques doux en PNG porteurs d'alpha est une fonctionnalité figurant sur la liste de souhaits mais actuellement laissée aux outils de bureau, car elle est parfois destructive : recomposer cuit la couleur de fond dans le résultat, ce qui peut être ou non ce que vous voulez.

Espaces de couleur et leurs conséquences sur la sortie

La plupart des PDF en 2026 utilisent DeviceRGB (similaire à sRGB) ou DeviceCMYK. PDF.js décode les deux de manière transparente, en convertissant le CMYK en RGB avant de peindre sur le canvas. Le PNG extrait est donc toujours en RGB, même quand la source était en CMYK. Pour un simple réemploi visuel c'est correct : une image CMYK est destinée à l'impression et ne s'afficherait pas correctement sur un site web sans conversion. Pour la reproduction imprimée, la conversion est approximative car le canvas de destination n'a pas de profil d'impression attaché. Les utilisateurs visant l'impression devraient garder le PDF original et ne pas faire d'aller-retour par l'extraction ; la fidélité chromatique sera meilleure quand le pipeline d'impression lira l'image CMYK directement.

Les profils de couleur ICCBased attachés aux images PDF sont respectés par PDF.js lors du décodage, donc le PNG extrait approche l'apparence prévue dans des conditions d'affichage standard. Les espaces de couleur indexés (images de palette, le cas typique des 256 couleurs hérité des imports GIF) sont désindexés lors de l'extraction, produisant un PNG en couleurs complètes plutôt qu'à base de palette. C'est le bon comportement pour le réemploi visuel mais cela signifie que la taille d'un PNG extrait peut être plus grande que la taille de l'image indexée originale à l'intérieur du PDF. Le compromis est inévitable dans le pipeline basé sur canvas, et nous préférons la fidélité à la compacité ; les utilisateurs qui veulent les plus petits fichiers possibles peuvent passer la sortie par le Compresseur d'Images ensuite.

Cas d'usage réels qui motivent l'extraction d'images

Pièges courants et ce qu'ils signifient

Extraction navigateur uniquement versus cloud

Les services d'extraction d'images cloud qui occupent le haut des résultats de recherche (Smallpdf, ILovePDF, PDF24 web, Sejda, CleverPDF) téléchargent tous le PDF sur leurs serveurs, décodent côté serveur, et renvoient un ZIP à votre navigateur. Leurs politiques de confidentialité s'engagent généralement sur une suppression dans l'heure et du TLS en transit, et la pression de réputation commerciale sur les opérateurs majeurs est réelle. Rien de tout cela ne change le simple fait structurel que votre document, et chaque image qu'il contient, ont brièvement résidé sur le stockage de quelqu'un d'autre et ont traversé son logiciel. Pour du matériel sensible (dossiers médicaux, relevés financiers, brouillons internes, tout ce qui est couvert par un accord de confidentialité), la meilleure posture est de ne jamais laisser le fichier quitter l'appareil au départ.

Cet outil tourne entièrement dans l'onglet du navigateur. PDF.js analyse le PDF localement, décode les images localement, les écrit sur un canvas local et déclenche un téléchargement local. Aucune requête réseau ne part après le chargement initial de la page. La preuve est disponible dans n'importe quel navigateur : ouvrez l'onglet Réseau des outils de développement avant de cliquer sur extraire, lancez l'extraction et observez qu'aucune requête ne part avec votre fichier ou le contenu de vos images. Le coût du traitement dans le navigateur est que les très gros PDF (des centaines de mégaoctets) sont plus lents qu'ils ne le seraient sur un serveur rapide, mais la posture de confidentialité est catégoriquement différente. La limite de 50 Mo dans cet outil est fixée pour protéger les appareils mobiles d'un dépassement de mémoire, pas parce que l'architecture ne peut pas gérer des fichiers plus grands sur les navigateurs de bureau.

Questions fréquentes supplémentaires

En quoi est-ce différent de « PDF en JPG » ou « PDF en image » ?

Deux opérations véritablement différentes. « PDF en image » rasterise chaque page en une seule image, en capturant texte, vecteurs et images sous forme de pixels aplatis ; la sortie est une image de la page. « Extraire les images » sort les objets image individuels que l'auteur a incorporés dans le fichier ; la sortie est l'image qui se trouve dans la page. Pour un rapport de 10 pages avec trois photographies sur les pages 2 et 7, « PDF en image » renvoie dix fichiers (un par page) ; « Extraire les images » en renvoie trois (les photographies). Utilisez l'outil PDF vers Image pour le premier type.

Pourquoi les images extraites sont-elles en PNG alors que les originales étaient en JPEG ?

Le pipeline actuel fait passer chaque image par un canvas HTML, ce qui produit un bitmap décodé, puis ré-encode ce bitmap en PNG pour préserver la transparence quand elle est présente. Le PNG est sans perte : les pertes de quantification du JPEG sont déjà cuites dans le bitmap et sont préservées exactement, sans deuxième tour de quantification. Les fichiers PNG de sortie sont plus gros que les octets JPEG d'origine, mais la qualité n'est pas dégradée. Un mode futur qui écrirait directement les octets JPEG bruts (correspondant à pdfimages -j) figure sur la liste de souhaits ; le gain là est des fichiers plus petits, pas une meilleure qualité.

L'outil trouve-t-il toutes les images, y compris celles utilisées comme arrière-plan ou en ligne ?

Oui. L'outil parcourt la liste d'opérateurs de la page et résout à la fois les XObject Image nommés (opérateur de peinture Do) et les images en ligne incorporées directement dans le flux de contenu entre les opérateurs BI, ID et EI. Beaucoup d'outils d'extraction manquent les images en ligne parce qu'ils ne parcourent que la table XObject ; cet outil-ci les attrape. Les masques pochoirs (ImageMask à true) sont également signalés, bien qu'ils soient des silhouettes plutôt que des images et ne soient utiles que dans des cas restreints.

Quelle taille de PDF puis-je traiter ?

Jusqu'à 50 Mo dans l'implémentation actuelle. La limite est fixée par la pression mémoire du navigateur sur les appareils mobiles : les gros PDF conservent en mémoire à la fois le document analysé et les images décodées, et dépasser le tas disponible de l'appareil provoque la fermeture de l'onglet par le système. Les navigateurs de bureau peuvent généralement en gérer beaucoup plus ; le plafond est conservateur par sécurité. Pour des documents très volumineux, le pdfimages -all de bureau issu de poppler-utils est le bon outil.

L'extraction modifie-t-elle les droits d'auteur des images ?

Non. Les images incorporées dans un PDF conservent les droits qui appartiennent à l'auteur du document, au photographe ou au titulaire de la licence. Extraire une image d'un PDF auquel vous avez un accès légal est mécaniquement équivalent à en faire une capture d'écran ; ce que vous faites du fichier extrait est régi par les mêmes règles de droit d'auteur que la source. L'usage en référence personnelle est généralement non controversé ; la redistribution ou la réutilisation commerciale dépend des termes de licence de la source.

Existe-t-il un équivalent en ligne de commande ou sur le bureau ?

Oui, deux solides. pdfimages de poppler-utils est l'équivalent le plus proche : pdfimages -all input.pdf prefix- extrait chaque image dans son encodage d'origine quand c'est possible. Installez-le avec brew install poppler sur macOS, apt install poppler-utils sur Debian ou Ubuntu, ou téléchargez les binaires Windows depuis le site du projet. L'autre est mutool extract de MuPDF, qui extrait les images et les polices ensemble. Les deux sont locaux, gratuits et bien maintenus.

Outils associés