Convertisseur Word → PDF, gratuit
Convertissez vos fichiers Word (.docx) en PDF instantanément. Aucune inscription requise. Vos fichiers ne quittent jamais votre appareil.
Prend en charge .docx · jusqu'à 25 Mo
Comment ça marche
- Importez un fichier Word : déposez ou sélectionnez un fichier .docx à convertir.
- Configurez les options : choisissez la taille de page et les marges souhaitées.
- Convertissez : cliquez sur « Convertir en PDF » pour générer votre PDF. La conversion se fait instantanément dans votre navigateur.
Pourquoi convertir en PDF ?
Le PDF est le format de document universel. Convertir des documents Word en PDF garantit une mise en forme cohérente sur tous les appareils et systèmes d'exploitation, rend les documents en lecture seule pour éviter les modifications accidentelles, réduit la taille du fichier et convient idéalement au partage, à l'archivage et aux envois professionnels. Les PDF sont compatibles partout et préservent votre mise en forme d'origine.
Ce que signifie réellement « DOCX vers PDF »
Un fichier `.docx` n’est pas un document unique comme il apparaît dans Word. C’est une archive ZIP (le conteneur Open Packaging Conventions défini dans ISO/IEC 29500-2) contenant une arborescence de fichiers XML, des images intégrées et des métadonnées de relations. Le texte principal du document vit dans word/document.xml sous forme de balisage WordprocessingML ; les styles de paragraphe dans word/styles.xml ; la numérotation des listes dans word/numbering.xml ; les images intégrées dans word/media/. Renommez n’importe quel `.docx` en `.zip` et décompressez-le pour voir la structure avec un éditeur de texte. Le format a été introduit avec Microsoft Office 2007, normalisé sous le nom ECMA-376 en décembre 2006 et sous le nom ISO/IEC 29500 en 2008, et c’est le format Word par défaut utilisé aujourd’hui par des centaines de millions d’auteurs.
Un PDF (Portable Document Format) décrit le paradigme inverse : des pages à mise en page fixe avec des glyphes à des coordonnées exactes, des polices intégrées et un positionnement absolu. Là où DOCX est basé sur le flux (le texte se réajuste quand la taille de page, les marges ou les polices changent), PDF est positionné au pixel près (chaque caractère occupe un point précis dans le système de coordonnées de la page). La conversion entre les deux est structurellement une traduction entre paradigmes : un format d’écriture flexible devient un format de rendu figé. Tout outil de conversion, qu’il s’agisse de Microsoft Word lui-même, du convertisseur sans interface de LibreOffice, du moteur cloud de Smallpdf ou de cet outil dans le navigateur, fait face au même écart inhérent : la source décrit l’intention, la destination décrit l’apparence, et l’intention doit être engagée dans une apparence spécifique pendant la conversion.
Les différentes approches de conversion acceptent des compromis différents face à cet écart. L’option Enregistrer sous PDF de Word utilise le même moteur de rendu que celui qui affiche le document à l’écran, donc la conversion revient essentiellement à « rendre sur une surface PDF plutôt que sur une surface écran » ; la fidélité est excellente et le texte est sélectionnable dans la sortie. Les services cloud utilisent généralement LibreOffice côté serveur ou un moteur propriétaire ; la fidélité est élevée, le texte est sélectionnable, le fichier est téléversé. Cet outil de navigateur utilise un pipeline différent (décrit dans la section suivante) qui optimise pour la confidentialité et la portée (n’importe quel navigateur, n’importe quel appareil, aucune installation, aucun téléversement) et accepte une pénalité de fidélité en contrepartie. Aucune de ces approches n’est universellement la meilleure ; chacune correspond à un usage différent.
Comment cet outil fonctionne en coulisses
La conversion s’exécute entièrement dans votre navigateur à travers un pipeline en trois étapes : mammoth.js analyse le DOCX et produit du HTML sémantique, html2canvas (appelé par html2pdf.js) peint ce HTML sur un élément `<canvas>` hors écran en utilisant les primitives de rendu du navigateur, et jsPDF (également appelé par html2pdf.js) encapsule le canvas comme données d’image JPEG, le place sur une page PDF et ajoute les sauts de page aux frontières que la taille de page et les marges configurées impliquent. Le PDF de sortie est une séquence d’images bitmap en pleine page, une ou plusieurs par page source, plus l’en-tête de métadonnées PDF.
Une conséquence importante de ce pipeline qui mérite une déclaration franche dès le départ : le PDF de sortie est basé sur une image bitmap, pas sur du texte. Les caractères visibles dans le corps du PDF sont des pixels dans une image, pas des opérateurs de positionnement de texte avec des données de police intégrées. Concrètement, cela signifie que : la recherche dans le PDF ne trouvera pas de mots ; le copier-coller depuis le corps de la page ne renvoie rien ; les lecteurs d’écran ne peuvent pas lire le contenu comme du texte ; l’OCR est nécessaire si le PDF est ensuite traité par des outils de traitement de texte. Pour les flux où l’un de ces aspects est important (recherche juridique, soumissions d’accessibilité, archives de documents destinées à la recherche, tout ce qui sera analysé par un logiciel), le bon outil est Enregistrer sous PDF de Microsoft Word ou Exporter au format PDF de LibreOffice, qui produisent tous les deux des PDF basés sur le texte, avec un texte sélectionnable, recherchable et accessible aux lecteurs d’écran. Le but de cet outil est de livrer un PDF visuellement propre depuis un document Word sans jamais téléverser le document quelque part ; la sortie bitmap est le prix de cette garantie de confidentialité.
Quand vous sélectionnez un `.docx`, l’API File du navigateur transmet les octets à mammoth.js. mammoth traite le DOCX comme un paquet OPC, extrait word/document.xml, et parcourt l’arbre WordprocessingML : `<w:p>` devient `<p>`, `<w:tbl>` devient `<table>`, les runs en gras/italique deviennent du balisage en ligne, les hyperliens deviennent `<a>`, les images intégrées dans `word/media/` deviennent des balises `<img>` en ligne encodées en base64. L’outil rend ensuite le HTML dans un conteneur DOM masqué, applique la taille de page et la marge choisies en CSS et invoque html2pdf avec ce conteneur. html2pdf parcourt le conteneur, le découpe en pages virtuelles aux frontières de page CSS, appelle html2canvas sur chaque morceau de la taille d’une page, et assemble les bitmaps de canvas résultants dans un document jsPDF. L’ensemble du pipeline ne fait aucune requête réseau après le chargement initial de la bibliothèque.
Les trois bibliothèques derrière la conversion
mammoth.js est l’analyseur DOCX. Créé par Michael Williamson sous licence BSD-2-Clause et maintenu sur GitHub à mwilliamson/mammoth.js. La philosophie de conception, énoncée par Williamson lui-même, est que la conversion doit préserver le contenu sémantique (paragraphes, titres, listes, tableaux, notes de bas de page, hyperliens, images intégrées) plutôt que la mise en forme directe (polices spécifiques, tailles, couleurs, espacement). L’auteur soutient que les documents se déplacent entre contextes (Word, web, ePub, PDF) et que le style visuel approprié à l’un est rarement approprié à un autre ; porter la structure sémantique est plus utile que porter l’apparence exacte. Le bundle navigateur fait environ 600 Ko minifié.
jsPDF est l’écrivain PDF. Créé par James Hall (GitHub : MrRio) en 2010, maintenant co-maintenu par yWorks GmbH, sous licence MIT, sur GitHub à parallax/jsPDF. jsPDF peut écrire des PDF à partir de texte, de graphiques vectoriels, d’images et de canvas HTML ; dans cet outil, il consomme les bitmaps de canvas de html2canvas et les assemble en pages PDF. html2canvas, par Niklas von Hertzen (licence MIT), est le rendu HTML-vers-canvas qui peint les nœuds DOM sur un `<canvas>` en utilisant le CSS calculé pour chaque élément. html2pdf.js par Erik Koopmans (licence MIT) est la colle : elle orchestre html2canvas et jsPDF, gère la pagination, expose une API de configuration propre, et empaquette le tout dans un bundle unique d’environ 350 Ko minifié.
L’empreinte combinée au premier chargement est d’environ 950 Ko. Les deux bibliothèques sont mises en cache par le navigateur après la première visite, donc les visites suivantes sont instantanées du point de vue du réseau. Les quatre projets (mammoth.js, html2canvas, jsPDF, html2pdf.js) sont open source, sous licence MIT ou BSD, et ont été déployés dans des dizaines de milliers de projets en production. Le pipeline est mature, bien compris et éprouvé pour le cas d’usage qu’il sert : la conversion DOCX-vers-PDF avec fidélité visuelle sans rendu côté serveur.
Une brève histoire de DOCX et du standard OOXML
- Word .doc (1983 à 2007). Le format binaire `.doc` de Microsoft, utilisé par toutes les versions de Word de Word 1.0 jusqu’à Word 2003. Propriétaire, non documenté pendant la majeure partie de sa vie, reconstitué par rétro-ingénierie par les concurrents pour assurer l’interopérabilité.
- OOXML annoncé (novembre 2005). Microsoft publie le premier brouillon d’Office Open XML, un format basé sur XML destiné à remplacer les binaires `.doc`, `.xls` et `.ppt`. La soumission est faite à Ecma International pour standardisation.
- ECMA-376 première édition (décembre 2006). Ecma International ratifie OOXML comme ECMA-376 première édition : le premier standard officiel pour ce qui est maintenant `.docx`, `.xlsx`, `.pptx`. La spécification fait plus de 6 000 pages.
- Office 2007 sort (janvier 2007). Microsoft Office 2007 est lancé avec `.docx` comme format d’enregistrement par défaut. Office 2003 reçoit un pack de compatibilité gratuit qui lui permet d’ouvrir les nouveaux formats.
- Ratification ISO/IEC 29500:2008 (novembre 2008). Après un processus de fast-track controversé qui a attiré de fortes critiques de la communauté open source et du camp OpenDocument Format (ODF), ISO et IEC adoptent OOXML comme ISO/IEC 29500:2008. La spécification définit deux variantes : Strict (proprement conforme à l’ISO) et Transitional (la variante que Word écrit réellement par défaut, avec les constructions de rétrocompatibilité préservées).
- Aujourd’hui (2026). Presque tous les `.docx` du monde réel sont en OOXML Transitional, générés par Word, LibreOffice, Google Docs, Apple Pages, WPS Office ou l’un des nombreux outils documentaires SaaS. Le format est désormais omniprésent : c’est la valeur par défaut à tous les niveaux de l’économie de l’écriture, des auteurs individuels aux systèmes de gestion documentaire d’entreprise.
Flux du monde réel qui motivent la conversion Word vers PDF
- Envoi de CV ou de résumé à des recruteurs et plateformes d’emploi. Toutes les grandes plateformes d’emploi (LinkedIn Recruiter, Indeed, Workday, Greenhouse, portails gouvernementaux) attendent du PDF. L’auteur rédige dans Word, convertit avant d’envoyer. La confidentialité compte parce que le CV contient des coordonnées personnelles, des adresses et des antécédents professionnels.
- Lettres de motivation et essais de candidature. Universités, programmes de bourses, candidatures administratives, recrutement d’entreprise : tous convergent vers le PDF comme format de soumission. Word reste l’outil de rédaction choisi pour la correction grammaticale, les commentaires et le suivi des révisions ; le PDF est le format de livraison parce que la mise en forme y est verrouillée.
- Contrats et documents juridiques avant signature. Convertir en PDF avant de faire circuler un brouillon de contrat pour que la contrepartie voie un document à mise en page fixe. Après signature, le PDF signé devient la version canonique. La conversion doit se faire sur un appareil de confiance parce que le document est confidentiel.
- Articles académiques, thèses et soumissions à des revues. La plupart des revues et dépôts universitaires acceptent le PDF comme format de soumission. Les auteurs rédigent dans Word (ou LaTeX) et soumettent en PDF. Pour les utilisateurs LaTeX, cet outil n’a pas d’intérêt ; pour la très grande population d’utilisateurs Word en sciences sociales, humanités, gestion et droit, c’est le flux standard.
- Rapports internes et instantanés d’archivage. Convertir un rapport Word en PDF pour l’archivage permanent. Le PDF est l’enregistrement officiel ; la source Word peut continuer à évoluer en tant que brouillon. De nombreux secteurs régulés (finance, santé, droit) exigent du PDF pour les archives de conformité.
- Distribution fiable par e-mail. Le PDF s’affiche de manière cohérente dans les clients de messagerie, ce que `.docx` ne fait pas. Outlook, Gmail, Apple Mail et les applis mobiles de mail ouvrent tous le PDF en ligne ; `.docx` exige que le destinataire ait Word ou une appli compatible installée. PDF est le format de distribution à plus faible friction pour des documents adressés à un public non technique.
Pièges courants et ce qu’ils signifient
- Le texte dans le PDF n’est pas sélectionnable ni recherchable. C’est par conception, pas un bug. Le pipeline rasterise le HTML rendu, donc le corps du PDF est une image bitmap. La recherche dans le PDF, le copier-coller et l’accès lecteur d’écran au texte du corps ne fonctionneront pas. Pour les documents où la sélectabilité compte (juridique, archivage, accessibilité, bases de données documentaires), utilisez Enregistrer sous PDF de Microsoft Word ou Exporter au format PDF de LibreOffice. Les deux produisent des PDF basés sur le texte à partir de sources DOCX.
- Les polices dans le PDF ne correspondent pas au document Word d’origine. mammoth.js se concentre intentionnellement sur le contenu sémantique et ne transplante pas les métadonnées de police directes ; le navigateur rend le HTML avec les polices disponibles localement. Si votre document Word utilisait une police d’entreprise personnalisée installée uniquement sur votre machine de travail, le PDF s’affichera dans la police de repli du navigateur. Le correctif est soit d’installer les polices sources sur l’appareil qui fait la conversion, soit d’utiliser Enregistrer sous PDF de Word, qui intègre les polices que le document référence.
- Les tableaux complexes simplifient ou s’affichent imparfaitement. mammoth gère bien les tableaux standard (lignes, colonnes, bordures de cellules). Les cellules multi-fusionnées, les tableaux profondément imbriqués et les tableaux avec mise en forme conditionnelle élaborée peuvent simplifier ou se rompre visuellement car la sortie HTML de mammoth est un sous-ensemble de ce que produit le moteur de Word. Pour les rapports lourds en tableaux, le bon outil est l’export PDF natif de Word.
- La mise en page multi-colonnes devient une seule colonne. mammoth ne préserve pas la directive `<w:cols>` de Word. Un article à deux colonnes style journal devient une colonne unique dans le HTML résultant et donc dans le PDF. Pour les documents qui ont véritablement besoin d’une mise en page en colonnes dans la sortie, utilisez Enregistrer sous PDF de Word ou le mode sans interface de LibreOffice, qui préservent tous les deux la structure en colonnes pendant la conversion.
- Les en-têtes, pieds de page et numéros de page de la source disparaissent. mammoth se concentre sur le corps du document et ne transplante pas les en-têtes, pieds de page ou champs de numéro de page de Word. html2pdf ajoute sa propre pagination mais ne peut pas injecter les en-têtes/pieds Word d’origine. La solution pour les documents qui ont besoin des en-têtes/pieds d’origine est de convertir via Word, ou de convertir ici puis d’ajouter les numéros de page en aval avec Numérotation de pages PDF gratuite en ligne.
- Commentaires et modifications suivies n’apparaissent pas. Par défaut, mammoth traite les commentaires et marques de révision comme des métadonnées et les ignore. Le PDF résultant reflète le document avec toutes les révisions effectivement acceptées (l’état de
word/document.xmlen ignorant les éléments de révision). Si vous avez besoin que les commentaires ou le balisage soient visibles dans le PDF, utilisez Enregistrer sous PDF de Word avec l’option « Imprimer le balisage » activée, ou acceptez/rejetez d’abord toutes les révisions dans Word puis convertissez. - Les très gros documents peuvent faire planter l’onglet. mammoth et html2canvas chargent et traitent tout le document en mémoire et de manière synchrone. Les documents de plus de 100 pages ou avec de nombreuses images intégrées peuvent saturer la mémoire du navigateur, surtout sur les appareils mobiles avec 4 Go de RAM ou moins. La parade consiste à découper le document dans Word d’abord, à convertir les sections séparément, puis à fusionner les PDF résultants avec Fusion de PDF en ligne, gratuite.
Confidentialité : le document reste sur votre appareil
Chaque grand service cloud de Word-vers-PDF (Smallpdf, iLovePDF, Adobe Acrobat Online, PDF24, Sejda, Soda PDF) téléverse votre fichier sur les serveurs de l’opérateur, l’analyse côté serveur via LibreOffice ou un moteur propriétaire, rend le PDF et le renvoie comme téléchargement. Les implications en matière de confidentialité ne sont pas anodines parce que les documents Word sont régulièrement personnels ou sensibles : CV et lettres de motivation contiennent adresses, numéros et antécédents professionnels ; lettres de motivation et essais personnels contiennent des aveux candides ; formulaires RH contiennent des prétentions salariales ; contrats contiennent des termes commerciaux ; lettres de dossier médical contiennent des informations de santé protégées ; brouillons juridiques contiennent du contenu soumis au secret professionnel. Les grands fournisseurs publient des politiques de confidentialité s’engageant à supprimer dans l’heure ou les deux et à chiffrer en transit avec TLS, et les plus gros disposent de la certification ISO/IEC 27001 et de l’alignement RGPD. Ils ont de fortes raisons commerciales d’honorer ces engagements. Mais « supprimé dans l’heure » n’est pas « jamais vu » : pendant cette heure le contenu du fichier réside dans leur infrastructure, accessible à tout processus ou personne disposant des droits adéquats, et visible dans les journaux et sauvegardes selon la rétention applicable.
Ce convertisseur ne téléverse rien. mammoth.js et html2pdf.js s’exécutent entièrement dans votre onglet de navigateur ; les octets du fichier sont lus par l’API File, traités en JavaScript, et le PDF de sortie est rendu disponible comme téléchargement Blob. Vous pouvez vérifier l’absence de téléversement en ouvrant les outils de développement du navigateur sur l’onglet Réseau avant de cliquer sur Convertir : aucune requête contenant le contenu de votre fichier n’est émise. Le seul trafic réseau est le chargement unique des deux bibliothèques depuis le CDN (environ 950 Ko au total minifiés), qui a lieu une fois au premier accès à la page et est ensuite mis en cache par le navigateur. Passez en mode avion après le chargement de la page et le convertisseur fonctionne toujours sur des fichiers locaux. Le compromis, comme indiqué dans la section sur le fonctionnement de l’outil, est que le PDF de sortie est basé sur une image bitmap : il perd la sélectabilité et la recherchabilité du texte que les convertisseurs côté serveur préservent. Pour la plupart des flux personnels Word-vers-PDF (CV, lettres de motivation, mémos internes, brouillons de contrat, formulaires de candidature), la sortie bitmap convient parfaitement et la garantie de confidentialité vaut le compromis. Pour les documents qui ont besoin de texte sélectionnable dans la sortie, la bonne réponse est Enregistrer sous PDF de Word ou Exporter au format PDF de LibreOffice, qui sont également hors ligne et privés si le document n’a jamais besoin de quitter la machine locale.
Quand un autre outil est le bon choix
- Le PDF de sortie a besoin de texte sélectionnable et recherchable. Recherche juridique, archives documentaires, soumissions d’accessibilité, tout ce qui sera indexé par un moteur de recherche ou lu par un lecteur d’écran : la sortie de cet outil est uniquement bitmap et ne conviendra pas. Utilisez Enregistrer sous PDF de Microsoft Word ou Exporter au format PDF de LibreOffice. Les deux sont capables de fonctionner hors ligne et produisent des PDF basés sur le texte.
- Le document a des mises en page complexes, des équations ou des objets intégrés. Journaux multi-colonnes, articles académiques chargés en maths, documents avec graphiques Excel ou diapositives PowerPoint intégrés, tableaux complexes multi-fusionnés : ces cas bénéficient du rendu natif de Word ou de la conversion sans interface de LibreOffice. L’approche sémantique d’abord de mammoth abandonne ou simplifie volontairement ce qu’elle ne peut pas représenter proprement.
- Vous avez besoin de convertir de nombreux fichiers par lot. Cet outil accepte un document à la fois et le pipeline de rendu est monothread. Pour les lots, la commande CLI standard est
soffice --headless --convert-to pdf *.docx --outdir output/en utilisant LibreOffice. À titre d’alternative, les mêmes bibliothèques mammoth et html2pdf utilisées ici s’exécutent aussi en Node.js pour une conversion scriptée au même profil de fidélité. - Le document est très volumineux (plus de 100 pages ou contenant beaucoup d’images lourdes). mammoth + html2canvas chargent et traitent l’ensemble du document en mémoire ; les gros documents peuvent geler un onglet de navigateur, surtout sur mobile. Soit vous découpez dans Word d’abord et convertissez les sections séparément (puis fusionnez avec Fusion de PDF en ligne, gratuite), soit vous utilisez un outil de bureau qui lit le document depuis le disque en streaming : Word, LibreOffice ou un convertisseur en ligne de commande.
Fonctionnalités
- Conversion rapide : conversion Word → PDF instantanée, sans attente.
- Personnalisable : choisissez la taille de page (A4 ou Letter) et les marges.
- Confidentialité : tout le traitement est local dans votre navigateur. Fichiers jamais envoyés sur un serveur.
- Simple : glissez-déposez votre fichier Word et cliquez sur convertir.
- Un fichier à la fois : convertissez un document Word à la fois pour des résultats optimaux.
Questions fréquentes
Quels formats Word sont pris en charge ?
Ce convertisseur prend en charge les fichiers .docx (Microsoft Word 2007 et ultérieur). Les anciens fichiers .doc ne sont pas pris en charge ; vous pouvez les convertir en .docx dans Microsoft Word puis utiliser cet outil.
Ma mise en forme sera-t-elle préservée ?
La plupart des mises en forme sont préservées, y compris polices, tailles, couleurs et mise en page de base. En revanche, les éléments complexes comme les tableaux avancés, les mises en page multi-colonnes et les objets incorporés peuvent être simplifiés ou ajustés lors de la conversion.
Mon document Word est-il envoyé à un serveur ?
Non. Toute la conversion se fait localement dans votre navigateur via les bibliothèques Mammoth et html2pdf. Votre fichier Word ne quitte jamais votre appareil, pour une confidentialité et une sécurité totales.
Puis-je convertir plusieurs fichiers à la fois ?
Cet outil convertit un fichier Word à la fois. Pour chaque conversion, importez simplement un nouveau fichier .docx et convertissez-le.
Quelle est la limite de taille de fichier ?
Les fichiers jusqu'à 25 Mo sont pris en charge. Les très gros fichiers peuvent prendre plus de temps selon la mémoire disponible dans votre navigateur.
Puis-je ajuster les marges et la taille de page ?
Oui. Avant de convertir, vous pouvez sélectionner la taille de page (A4 ou Letter) et la largeur des marges (Normales, Étroites ou Larges).
Autres questions fréquentes
Pourquoi le texte dans le PDF n’est-il pas sélectionnable ?
Cet outil produit un PDF basé sur une image bitmap : il rend le document Word en HTML, peint ce HTML sur un canvas hors écran via le navigateur, puis intègre le canvas comme image à l’intérieur du PDF. Le PDF de sortie contient donc des images de pages, pas de caractères avec positions. Le copier-coller depuis le corps de la page ne renvoie rien d’utile, et la fonction de recherche dans le PDF ne trouvera pas de mots. Pour les flux qui ont besoin de texte sélectionnable (recherche juridique, bases de recherche, accessibilité), utilisez Enregistrer sous PDF de Microsoft Word ou Exporter au format PDF de LibreOffice ; tous deux produisent des PDF basés sur le texte à partir de sources DOCX.
Pourquoi la police est-elle différente de mon document Word d’origine ?
mammoth.js, la bibliothèque utilisée pour analyser le DOCX, se concentre intentionnellement sur le contenu sémantique (paragraphes, titres, listes, tableaux) plutôt que sur la mise en forme directe (polices spécifiques, tailles exactes, couleurs). Le navigateur rend le HTML résultant en utilisant les polices que vous avez installées localement. Si votre document Word utilisait une police d’entreprise ou de marque uniquement présente sur votre machine de travail, le PDF s’affichera dans la police de repli du navigateur (typiquement un sans-empattement générique). Pour préserver les polices, soit installez les mêmes polices sur votre appareil, soit utilisez Enregistrer sous PDF de Word, qui intègre les polices référencées par votre document.
Cet outil fonctionne-t-il hors ligne ?
Oui, après la première visite. Les bibliothèques (mammoth d’environ 600 Ko, html2pdf d’environ 350 Ko) sont chargées une fois depuis un CDN puis mises en cache par le navigateur. Les visites suivantes au convertisseur fonctionnent entièrement hors ligne, tant que le cache du navigateur n’a pas été vidé. La conversion en elle-même n’a jamais eu besoin du réseau ; seul le chargement initial de la bibliothèque l’a eu. Vous pouvez vérifier en activant le mode avion après le premier chargement de la page et en convertissant un DOCX local.
Puis-je convertir des anciens fichiers .doc (Word 97-2003) ?
Non. Cet outil n’accepte que les .docx (Office Open XML), le format introduit avec Word 2007. L’ancien format binaire .doc nécessite un analyseur différent (mammoth ne gère que le .docx basé sur XML). Pour convertir un fichier .doc, ouvrez-le d’abord dans Word ou LibreOffice et faites Enregistrer sous .docx, puis convertissez ici. La conversion de .doc vers .docx est une opération en un clic dans les deux outils et préserve le contenu.
Les hyperliens seront-ils cliquables dans le PDF résultant ?
Les hyperliens dans le document source apparaissent comme du texte stylé visuellement (bleu, souligné) dans le PDF, mais ils ne sont pas interactifs : parce que le corps du PDF est une image bitmap du HTML rendu, cliquer sur le texte du lien dans un lecteur PDF ne mènera nulle part. Si vous avez besoin de liens cliquables dans le PDF de sortie, utilisez Enregistrer sous PDF de Word (qui préserve les annotations de lien PDF) ou Exporter au format PDF de LibreOffice. Les deux produisent des PDF où les hyperliens restent fonctionnels après conversion.
Existe-t-il un équivalent de bureau ou en ligne de commande ?
Oui, plusieurs. L’approche standard côté serveur et en ligne de commande est le mode sans interface de LibreOffice : soffice --headless --convert-to pdf input.docx --outdir output/ convertit le fichier sur place, est adapté aux lots, ne nécessite pas d’interface graphique. LibreOffice s’installe sur Linux, macOS et Windows ; la même ligne de commande fonctionne partout. Pour une sortie pixel-identique à Word par programmation, Microsoft Word + automatisation COM PowerShell sous Windows reste l’étalon-or (nécessite Word installé). Les mêmes bibliothèques mammoth.js et html2pdf.js que cet outil utilise s’exécutent aussi en Node.js pour une conversion scriptée sans navigateur au même profil de fidélité. Pandoc avec un moteur LaTeX est une autre option pour les flux de publication académique.