Word-zu-PDF-Konverter

Konvertieren Sie Word-Dateien (.docx) sofort in PDF. Keine Anmeldung nötig. Ihre Dateien verlassen Ihr Gerät nie.

Ihre Dateien verlassen niemals Ihr Gerät
Word-Datei hier ablegen oder klicken zum Auswählen

Unterstützt .docx · bis zu 25 MB

Hinweis: Komplexe Formatierungen wie Tabellen, Bilder und Spalten können während der Konvertierung vereinfacht werden.

So funktioniert es

  1. Word-Datei hochladen: Legen Sie eine .docx-Datei zum Konvertieren ab oder wählen Sie sie aus.
  2. Optionen konfigurieren: Wählen Sie das gewünschte Seitenformat und die Randeinstellungen.
  3. Konvertieren: Klicken Sie auf „In PDF umwandeln", um Ihr PDF zu erzeugen. Die Konvertierung erfolgt sofort in Ihrem Browser.

Warum in PDF konvertieren?

PDF ist das universelle Dokumentformat. Word-Dokumente in PDF zu konvertieren, sorgt für eine einheitliche Formatierung über alle Geräte und Betriebssysteme hinweg, macht Dokumente schreibgeschützt, um versehentliche Änderungen zu verhindern, reduziert die Dateigröße und ist ideal zum Teilen, Archivieren und für professionelle Einreichungen. PDFs sind überall kompatibel und bewahren Ihre ursprüngliche Formatierung.

Was «DOCX zu PDF» tatsächlich bedeutet

Eine `.docx`-Datei ist kein einzelnes Dokument so, wie sie in Word erscheint. Sie ist ein ZIP-Archiv (der in ISO/IEC 29500-2 definierte Open-Packaging-Conventions-Container), das einen Baum aus XML-Dateien, eingebettete Bilder und Beziehungsmetadaten enthält. Der eigentliche Dokumenttext liegt in word/document.xml als WordprocessingML-Markup; Absatzformatvorlagen in word/styles.xml; Listennummerierung in word/numbering.xml; eingebettete Bilder in word/media/. Benennen Sie eine beliebige `.docx` in `.zip` um und entpacken Sie sie, dann sehen Sie die Struktur in einem beliebigen Texteditor. Das Format wurde mit Microsoft Office 2007 eingeführt, im Dezember 2006 als ECMA-376 und 2008 als ISO/IEC 29500 normiert, und ist heute das von Hunderten Millionen Autorinnen und Autoren verwendete Word-Standardformat.

Eine PDF (Portable Document Format) beschreibt das entgegengesetzte Paradigma: Seiten mit festem Layout, Glyphen an exakten Koordinaten, eingebetteten Schriften und absoluter Positionierung. Während DOCX flussbasiert ist (Text läuft neu um, wenn Seitengröße, Ränder oder Schriften wechseln), ist PDF pixelpositioniert (jedes Zeichen besetzt einen bestimmten Punkt im Seitenkoordinatensystem). Die Konvertierung zwischen beiden ist strukturell eine Übersetzung zwischen Paradigmen: ein flexibles Autorenformat wird zu einem eingefrorenen Präsentationsformat. Jedes Konvertierungswerkzeug, ob Microsoft Word selbst, der Headless-Konverter von LibreOffice, die Cloud-Engine von Smallpdf oder dieses Browser-Werkzeug, steht vor derselben grundlegenden Lücke: die Quelle beschreibt die Absicht, das Ziel beschreibt das Aussehen, und die Absicht muss während der Konvertierung auf ein konkretes Aussehen festgelegt werden.

Unterschiedliche Konvertierungsansätze gehen mit dieser Lücke unterschiedliche Kompromisse ein. Words eigenes «Speichern unter PDF» nutzt dieselbe Rendering-Engine, die das Dokument am Bildschirm anzeigt, sodass die Konvertierung im Wesentlichen «auf eine PDF-Oberfläche statt auf eine Bildschirmoberfläche rendern» heißt; die Treue ist hervorragend und der Text in der Ausgabe ist auswählbar. Cloud-Dienste verwenden meist serverseitiges LibreOffice oder eine proprietäre Engine; die Treue ist hoch, der Text auswählbar, die Datei wird hochgeladen. Dieses Browser-Werkzeug nutzt eine andere Pipeline (im nächsten Abschnitt beschrieben), die auf Privatsphäre und Reichweite (jeder Browser, jedes Gerät, keine Installation, kein Upload) optimiert und im Gegenzug eine Treuebuße akzeptiert. Keiner dieser Ansätze ist universell der beste; jeder passt zu unterschiedlichen Arbeitsabläufen.

Wie dieses Werkzeug unter der Haube funktioniert

Die Konvertierung läuft vollständig in Ihrem Browser durch eine dreistufige Pipeline: mammoth.js parst die DOCX zu semantischem HTML, html2canvas (von html2pdf.js aufgerufen) zeichnet dieses HTML mit den eigenen Rendering-Primitiven des Browsers auf ein Off-Screen-`<canvas>`-Element, und jsPDF (ebenfalls von html2pdf.js aufgerufen) verpackt das Canvas als JPEG-Bilddaten, legt es auf eine PDF-Seite und setzt Seitenumbrüche an den Grenzen, die die konfigurierte Seitengröße und Ränder implizieren. Die PDF-Ausgabe ist eine Folge ganzseitiger Bitmap-Bilder, eines oder mehrere pro Quellseite, plus PDF-Metadaten-Header.

Eine wichtige Konsequenz dieser Pipeline verdient eine offene Vorab-Klarstellung: die PDF-Ausgabe ist bitmap-basiert, nicht textbasiert. Die sichtbaren Zeichen im PDF-Inhalt sind Pixel innerhalb eines Bildes, keine Textpositionierungsoperatoren mit eingebetteten Schriftdaten. Praktisch bedeutet das: Die Suche im PDF findet keine Wörter; Kopieren aus dem Seiteninhalt liefert nichts Verwertbares; Bildschirmleser können den Inhalt nicht als Text vorlesen; OCR ist nötig, wenn die PDF in nachgelagerte Textverarbeitungswerkzeuge eingespeist wird. Für Arbeitsabläufe, in denen einer dieser Punkte zählt (juristische Discovery, Barrierefreiheits-Einreichungen, suchbare Dokumentarchive, alles, was später von Software analysiert wird), ist das richtige Werkzeug «Datei → Speichern unter PDF» in Microsoft Word oder «Datei → Als PDF exportieren» in LibreOffice; beide erzeugen aus DOCX-Quellen textbasierte PDFs mit auswählbarem, durchsuchbarem und für Bildschirmleser zugänglichem Text. Der Zweck dieses Werkzeugs ist, ein optisch sauberes PDF aus einem Word-Dokument zu liefern, ohne das Dokument irgendwohin hochzuladen; die Bitmap-Ausgabe ist der Preis dieser Datenschutzgarantie.

Wenn Sie eine `.docx` auswählen, übergibt die File-API des Browsers die Bytes an mammoth.js. mammoth behandelt die DOCX als OPC-Paket, extrahiert word/document.xml und durchläuft den WordprocessingML-Baum: `<w:p>` wird zu `<p>`, `<w:tbl>` zu `<table>`, Runs mit Fett/Kursiv werden Inline-Markup, Hyperlinks werden `<a>`, eingebettete Bilder in `word/media/` werden Inline-`<img>`-Tags mit base64-Kodierung. Das Werkzeug rendert das HTML dann in einem versteckten DOM-Container, wendet die gewählte Seitengröße und die Ränder als CSS an und ruft html2pdf für diesen Container auf. html2pdf läuft durch den Container, teilt ihn an den CSS-Seitengrenzen in virtuelle Seiten, ruft html2canvas auf jedes seitengroße Stück auf und setzt die resultierenden Canvas-Bitmaps in einem jsPDF-Dokument zusammen. Die gesamte Pipeline stellt nach dem initialen Laden der Bibliotheken keine Netzwerkanfragen mehr.

Die drei Bibliotheken hinter der Konvertierung

mammoth.js ist der DOCX-Parser. Erstellt von Michael Williamson unter BSD-2-Clause-Lizenz und auf GitHub unter mwilliamson/mammoth.js gepflegt. Die Designphilosophie, von Williamson selbst formuliert, ist, dass die Konvertierung den semantischen Inhalt bewahren soll (Absätze, Überschriften, Listen, Tabellen, Fußnoten, Hyperlinks, eingebettete Bilder), nicht die direkte Darstellung (spezifische Schriften, Größen, Farben, Abstände). Der Autor argumentiert, dass sich Dokumente zwischen Kontexten bewegen (Word, Web, ePub, PDF) und der für einen Kontext passende visuelle Stil selten zu einem anderen passt; semantische Struktur mitzunehmen ist nützlicher, als das exakte Erscheinungsbild mitzunehmen. Das Browser-Bundle ist etwa 600 KB minifiziert.

jsPDF ist der PDF-Schreiber. 2010 von James Hall (GitHub: MrRio) erstellt, jetzt von yWorks GmbH mitgepflegt, MIT-Lizenz, auf GitHub unter parallax/jsPDF. jsPDF kann PDFs aus Text, Vektorgrafiken, Bildern und HTML-Canvases schreiben; in diesem Werkzeug verarbeitet es die Canvas-Bitmaps von html2canvas und setzt sie zu PDF-Seiten zusammen. html2canvas, von Niklas von Hertzen (MIT-Lizenz), ist der HTML-zu-Canvas-Renderer, der DOM-Knoten anhand des berechneten CSS jedes Elements auf ein `<canvas>` zeichnet. html2pdf.js von Erik Koopmans (MIT-Lizenz) ist der Klebstoff: Es orchestriert html2canvas und jsPDF, kümmert sich um Paginierung, bietet eine saubere Konfigurations-API und packt alles in ein einziges Bundle von etwa 350 KB minifiziert.

Der kombinierte Fußabdruck beim ersten Laden liegt bei etwa 950 KB. Beide Bibliotheken werden nach dem ersten Besuch vom Browser zwischengespeichert, sodass spätere Besuche aus Netzwerksicht sofort sind. Alle vier Projekte (mammoth.js, html2canvas, jsPDF, html2pdf.js) sind Open Source unter MIT- oder BSD-Lizenz und werden in Zehntausenden Produktionsprojekten eingesetzt. Die Pipeline ist reif, gut verstanden und für den Anwendungsfall, dem sie dient, kampferprobt: DOCX-zu-PDF-Konvertierung mit visueller Treue ohne serverseitiges Rendering.

Eine kurze Geschichte von DOCX und dem OOXML-Standard

Reale Arbeitsabläufe, die die Word-zu-PDF-Konvertierung antreiben

Häufige Fallstricke und was sie bedeuten

Datenschutz: das Dokument bleibt auf Ihrem Gerät

Jeder große Cloud-Dienst für Word-zu-PDF (Smallpdf, iLovePDF, Adobe Acrobat Online, PDF24, Sejda, Soda PDF) lädt Ihre Datei auf die Server des Anbieters hoch, parst sie serverseitig mit LibreOffice oder einer proprietären Engine, rendert das PDF und liefert es als Download zurück. Die Datenschutzimplikationen sind nicht trivial, denn Word-Dokumente sind regelmäßig persönlich oder sensibel: Lebensläufe und Anschreiben enthalten Privatadressen, Telefonnummern und Berufsbiografien; Anschreiben und persönliche Essays enthalten offene Selbstauskünfte; Personalformulare enthalten Gehaltserwartungen; Verträge enthalten Geschäftsbedingungen; Briefe medizinischer Akten enthalten geschützte Gesundheitsinformationen; Rechtsentwürfe enthalten anwaltlich-mandantliche Inhalte. Die großen Anbieter veröffentlichen Datenschutzerklärungen, die ein Löschen innerhalb von ein bis zwei Stunden und Verschlüsselung in Transit mit TLS zusichern, und die größeren halten ISO/IEC-27001-Zertifizierung und DSGVO-Ausrichtung. Sie haben starke wirtschaftliche Gründe, diese Verpflichtungen einzuhalten. Aber «innerhalb einer Stunde gelöscht» heißt nicht «nie gesehen»: in dieser Stunde liegt der Inhalt der Datei in deren Infrastruktur, zugänglich für jeden Prozess oder Menschen mit entsprechenden Rechten, und in Logs und Backups je nach geltender Aufbewahrung sichtbar.

Dieser Konverter lädt nichts hoch. mammoth.js und html2pdf.js laufen vollständig in Ihrem Browser-Tab; die Datei-Bytes werden über die File-API gelesen, in JavaScript verarbeitet, und die PDF-Ausgabe als Blob-Download zurückgegeben. Sie können das Fehlen eines Uploads überprüfen, indem Sie die Entwicklerwerkzeuge des Browsers auf dem Netzwerk-Tab öffnen, bevor Sie auf Konvertieren klicken: es werden keine Anfragen gestellt, die Ihren Dateiinhalt enthalten. Der einzige Netzwerkverkehr ist das einmalige Laden der beiden Bibliotheken vom CDN beim ersten Besuch (zusammen etwa 950 KB minifiziert), das einmal stattfindet und dann im Browser-Cache verbleibt. Schalten Sie nach dem Laden der Seite den Flugmodus ein, und der Konverter arbeitet weiterhin mit lokalen Dateien. Der Kompromiss, wie im Abschnitt zur Funktionsweise erwähnt, ist, dass die PDF-Ausgabe bitmap-basiert ist: sie verliert die Text-Auswählbarkeit und -Durchsuchbarkeit, die serverseitige Konverter erhalten. Für die meisten persönlichen Word-zu-PDF-Workflows (Lebensläufe, Anschreiben, interne Memos, Vertragsentwürfe, Bewerbungsformulare) ist die Bitmap-Ausgabe völlig ausreichend, und die Datenschutzgarantie wiegt den Kompromiss auf. Für Dokumente, die in der Ausgabe auswählbaren Text brauchen, ist die richtige Antwort Words eigenes «Speichern unter PDF» oder LibreOffices «Als PDF exportieren», die ebenfalls offline und privat sind, wenn das Dokument den lokalen Rechner nicht verlassen muss.

Wann ein anderes Werkzeug die richtige Wahl ist

Funktionen

Häufige Fragen

Welche Word-Formate werden unterstützt?

Dieser Konverter unterstützt .docx-Dateien (Microsoft Word 2007 und neuer). Ältere .doc-Dateien werden nicht unterstützt; Sie können sie in Microsoft Word in .docx konvertieren und dann dieses Tool nutzen.

Bleibt meine Formatierung erhalten?

Die meisten Formatierungen bleiben erhalten, einschließlich Schriftarten, Größen, Farben und Grundlayout. Komplexe Elemente wie fortgeschrittene Tabellen, Mehrspalten-Layouts und eingebettete Objekte können während der Konvertierung vereinfacht oder angepasst werden.

Wird mein Word-Dokument auf einen Server hochgeladen?

Nein. Die gesamte Konvertierung erfolgt lokal in Ihrem Browser über die Bibliotheken Mammoth und html2pdf. Ihre Word-Datei verlässt Ihr Gerät nie, vollständige Privatsphäre und Sicherheit.

Kann ich mehrere Dateien gleichzeitig konvertieren?

Dieses Tool konvertiert jeweils eine Word-Datei. Laden Sie für jede Konvertierung einfach eine neue .docx-Datei hoch und konvertieren Sie sie.

Wie groß darf die Datei maximal sein?

Dateien bis zu 25 MB werden unterstützt. Sehr große Dateien können je nach verfügbarem Browserspeicher länger zur Verarbeitung benötigen.

Kann ich Seitenränder und -format anpassen?

Ja. Vor der Konvertierung können Sie das Seitenformat (A4 oder Letter) und die Randbreite (Normal, Eng oder Breit) wählen.

Weitere häufig gestellte Fragen

Warum lässt sich der Text im PDF nicht auswählen?

Dieses Werkzeug erzeugt eine bitmap-basierte PDF: Es rendert das Word-Dokument als HTML, zeichnet dieses HTML mit dem Browser auf ein Off-Screen-Canvas und bettet das Canvas anschließend als Bild in die PDF ein. Die PDF-Ausgabe enthält daher Bilder von Seiten, keine Zeichen mit Positionen. Copy-and-paste aus dem Seiteninhalt liefert nichts Nützliches, und eine Suchfunktion im PDF findet keine Wörter. Für Workflows, die auswählbaren Text brauchen (juristische Discovery, Forschungsdatenbanken, Barrierefreiheit), verwenden Sie «Datei → Speichern unter PDF» in Microsoft Word oder «Datei → Als PDF exportieren» in LibreOffice; beide erzeugen textbasierte PDFs aus DOCX-Quellen.

Warum ist die Schrift anders als in meinem originalen Word-Dokument?

mammoth.js, die Bibliothek, mit der dieses Werkzeug DOCX parst, fokussiert sich bewusst auf semantischen Inhalt (Absätze, Überschriften, Listen, Tabellen) und nicht auf die direkte Darstellung (spezifische Schriften, exakte Größen, Farben). Der Browser rendert das resultierende HTML mit den lokal installierten Schriften. Wenn Ihr Word-Dokument eine unternehmens- oder markeneigene Schrift verwendete, die nur auf Ihrer Arbeitsmaschine installiert ist, rendert das PDF in der Fallback-Schrift des Browsers (typischerweise eine generische Sans-Serif). Um Schriften zu bewahren, installieren Sie entweder dieselben Schriften auf Ihrem Gerät, oder verwenden Sie Words eigenes «Speichern unter PDF», das die vom Dokument referenzierten Schriften einbettet.

Funktioniert dieses Werkzeug offline?

Ja, nach dem ersten Besuch. Die Bibliotheken (mammoth etwa 600 KB, html2pdf etwa 350 KB) werden einmal von einem CDN geladen und dann vom Browser zwischengespeichert. Spätere Besuche des Konverters funktionieren ganz offline, solange der Browser-Cache zwischenzeitlich nicht geleert wurde. Die Konvertierung selbst benötigte nie ein Netzwerk; nur das initiale Bibliotheksladen tat es. Sie können das verifizieren, indem Sie nach dem einmaligen Öffnen der Seite den Flugmodus aktivieren und eine lokale DOCX konvertieren.

Kann ich alte .doc-Dateien (Word 97-2003) konvertieren?

Nein. Dieses Werkzeug akzeptiert nur .docx (Office Open XML), das mit Word 2007 eingeführte Format. Das ältere binäre .doc-Format erfordert einen anderen Parser (mammoth behandelt nur das XML-basierte .docx). Um eine .doc-Datei zu konvertieren, öffnen Sie sie zuerst in Word oder LibreOffice und speichern Sie sie als .docx, dann konvertieren Sie hier. Die Konvertierung von .doc zu .docx ist in beiden Werkzeugen ein Ein-Klick-Vorgang und bewahrt den Inhalt.

Werden Hyperlinks im resultierenden PDF klickbar sein?

Hyperlinks im Quelldokument erscheinen als visuell gestalteter Text (blau, unterstrichen) im PDF, sind aber nicht interaktiv: weil der PDF-Inhalt ein Bitmap-Bild des gerenderten HTML ist, führt das Anklicken des Linktextes in einem PDF-Reader nirgendwohin. Wenn Sie klickbare Links in der PDF-Ausgabe brauchen, verwenden Sie Words «Datei → Speichern unter PDF» (das die PDF-Linkannotationen erhält) oder LibreOffices «Als PDF exportieren». Beide erzeugen PDFs, in denen Hyperlinks nach der Konvertierung funktionsfähig bleiben.

Gibt es ein Desktop- oder Kommandozeilen-Äquivalent?

Ja, mehrere. Der Standardansatz für Server und Kommandozeile ist der Headless-Modus von LibreOffice: soffice --headless --convert-to pdf input.docx --outdir output/ konvertiert die Datei vor Ort, ist stapelfreundlich, braucht keine GUI. LibreOffice lässt sich unter Linux, macOS und Windows installieren; dieselbe Kommandozeile funktioniert überall. Für pixel-identische Word-Ausgabe per Programm ist Microsoft Word + PowerShell-COM-Automatisierung unter Windows der Goldstandard (setzt installiertes Word voraus). Die gleichen mammoth.js- und html2pdf.js-Bibliotheken, die dieses Werkzeug nutzt, laufen auch in Node.js für skriptgesteuerte browserlose Konvertierung mit demselben Treueprofil. Pandoc mit einer LaTeX-Engine ist eine weitere Option für wissenschaftliche Publikationsworkflows.

Verwandte Tools