Word→PDF変換
Word(.docx)ファイルを瞬時にPDFに変換します。登録不要。ファイルがデバイスを離れることはありません。
.docxをサポート · 最大25 MB
仕組み
- Wordファイルをアップロード: 変換する.docxファイルをドロップまたは選択します。
- オプションを構成: 希望のページサイズと余白を選択します。
- 変換: 「PDFに変換」をクリックしてPDFを生成します。変換はブラウザ内で瞬時に行われます。
なぜPDFに変換するのか?
PDFは普遍的なドキュメント形式です。Wordドキュメントを PDFに変換すると、すべてのデバイスとオペレーティングシステムで一貫したフォーマットが保証され、ドキュメントを読み取り専用にして偶発的な変更を防ぎ、ファイルサイズを削減し、共有、アーカイブ、プロフェッショナルな送信に理想的です。PDFはどこでも互換性があり、元のフォーマットを保持します。
「DOCX から PDF」とは本当のところ何を意味するのか
`.docx` ファイルは、Word に表示されるような単一の文書ではありません。それは ZIP アーカイブ(ISO/IEC 29500-2 で定義された Open Packaging Conventions コンテナ)であり、その中に XML ファイルのツリー、埋め込み画像、関係メタデータが格納されています。文書の本文テキストは word/document.xml に WordprocessingML マークアップとして存在します。段落スタイルは word/styles.xml、リスト番号は word/numbering.xml、埋め込み画像は word/media/ にあります。任意の `.docx` を `.zip` にリネームして解凍すれば、その構造を任意のテキストエディタで見ることができます。この形式は Microsoft Office 2007 と共に導入され、2006 年 12 月に ECMA-376 として、2008 年に ISO/IEC 29500 として標準化されました。今日、何億もの作者が使う Word の既定フォーマットです。
PDF(Portable Document Format)は逆のパラダイムを記述します。固定レイアウトのページ、正確な座標上のグリフ、埋め込みフォント、絶対位置決め。DOCX は流れに基づく形式(ページサイズ、余白、フォントが変わるとテキストが再流動する)ですが、PDF は画素単位で配置される形式(各文字がページ座標系の特定の点を占めます)。両者の変換は構造的にはパラダイム間の翻訳です。柔軟な執筆フォーマットが、凍結された提示フォーマットに変わるのです。Microsoft Word 自身であれ、LibreOffice のヘッドレス変換器、Smallpdf のクラウドエンジン、このブラウザツールであれ、あらゆる変換ツールは同じ本質的な隔たりに直面します。源は意図を、宛先は外見を記述し、意図は変換中に特定の外見にコミットされなければならない、ということです。
異なる変換アプローチは、その隔たりに対して異なるトレードオフを受け入れます。Word 自身の「PDF として保存」は、文書を画面に表示するのと同じ描画エンジンを使うので、変換は本質的に「画面サーフェスでなく PDF サーフェスへ描画する」ことになります。忠実度は素晴らしく、出力中のテキストは選択可能です。クラウドサービスは通常サーバサイドの LibreOffice か独自エンジンを使います。忠実度は高く、テキストは選択可能、ファイルはアップロードされます。このブラウザツールは異なるパイプライン(次節で説明)を使い、プライバシーと到達範囲(任意のブラウザ、任意のデバイス、インストール不要、アップロード不要)を最適化し、引き換えに忠実度の代償を受け入れます。これらのアプローチに普遍的な最善はありません。それぞれが異なるワークフローに合います。
このツールの内部の仕組み
変換は完全にあなたのブラウザ内で、三段階のパイプラインによって走ります。mammoth.js が DOCX を意味的な HTML に解析し、html2canvas(html2pdf.js から呼ばれる)がブラウザ自身の描画プリミティブを使ってその HTML をオフスクリーンの `<canvas>` 要素に描き、jsPDF(同じく html2pdf.js から呼ばれる)がその canvas を JPEG 画像データとして包み、PDF ページに配置し、設定したページサイズと余白から導かれる境界に改ページを入れます。出力 PDF はフルページのビットマップ画像の列で、ソースページごとに 1 枚以上、それに PDF メタデータヘッダーが付くものです。
このパイプラインの重要な帰結は最初に率直に明言しておくに値します。出力 PDF はビットマップベースであり、テキストベースではありません。PDF の本体に見える文字は画像中のピクセルであって、埋め込みフォントデータを伴うテキスト配置オペレータではありません。実務的にはこう意味します。PDF 内検索は単語を見つけません。ページ本体からのコピー&ペーストは役立つものを返しません。スクリーンリーダーは内容をテキストとして読めません。PDF を下流のテキスト処理ツールに渡すなら OCR が必要です。いずれかが重要なワークフロー(法的ディスカバリ、アクセシビリティ提出、検索を想定した文書アーカイブ、ソフトウェアで解析される一切)には、適切なツールは Microsoft Word の「ファイル → PDF として保存」または LibreOffice の「ファイル → PDF としてエクスポート」です。いずれも DOCX ソースからテキストベースの PDF を生成し、テキストは選択可能・検索可能・スクリーンリーダーから読めるものになります。このツールの目的は、Word 文書から視覚的にきれいな PDF を文書をどこにもアップロードせずに届けることであり、ビットマップ出力はそのプライバシー保証の対価です。
`.docx` を選ぶと、ブラウザの File API がバイトを mammoth.js に渡します。mammoth は DOCX を OPC パッケージとして扱い、word/document.xml を取り出し、WordprocessingML ツリーをたどります。`<w:p>` は `<p>` に、`<w:tbl>` は `<table>` に、太字/斜体のラン(run)はインラインマークアップに、ハイパーリンクは `<a>` に、`word/media/` 内の埋め込み画像はインラインの base64 エンコード `<img>` タグになります。続いてツールは HTML を隠れた DOM コンテナの中に描画し、選んだページサイズと余白を CSS として適用し、そのコンテナで html2pdf を呼び出します。html2pdf はコンテナを CSS のページ境界で仮想ページに分割し、各ページサイズの片々に対して html2canvas を呼び出し、得られた canvas ビットマップを jsPDF 文書に組み立てます。パイプライン全体は、最初のライブラリ読み込み以後はネットワーク要求を行いません。
変換を支える三つのライブラリ
mammoth.js は DOCX 解析器です。Michael Williamson が BSD-2-Clause ライセンスで作成し、GitHub の mwilliamson/mammoth.js でメンテナンスされています。Williamson 自身の設計哲学では、変換は意味的な内容(段落、見出し、リスト、表、脚注、ハイパーリンク、埋め込み画像)を保持すべきであり、直接的な表現(特定のフォント、サイズ、色、間隔)ではないとされています。著者は、文書は文脈(Word、Web、ePub、PDF)間を移動し、ある文脈に適した視覚スタイルは別の文脈にも適することはまれだと論じます。意味構造を運ぶ方が、正確な見た目を運ぶより役に立ちます。ブラウザ用バンドルは約 600 KB(minify 後)です。
jsPDF は PDF 書き出しライブラリです。2010 年に James Hall(GitHub: MrRio)が作成し、現在は yWorks GmbH と共同保守、MIT ライセンス、GitHub の parallax/jsPDF にあります。jsPDF はテキスト、ベクター図形、画像、HTML canvas から PDF を書き出せます。このツールでは html2canvas の canvas ビットマップを消費し、それらを PDF ページに組み立てます。html2canvas(Niklas von Hertzen 作、MIT ライセンス)は HTML から canvas への描画器で、各要素の計算済み CSS を使って DOM ノードを `<canvas>` に描きます。html2pdf.js(Erik Koopmans 作、MIT ライセンス)は接着剤で、html2canvas と jsPDF をオーケストレーションし、ページネーションを扱い、整ったコンフィグ API を公開し、すべてを約 350 KB(minify 後)の単一バンドルにまとめます。
初回読み込み時の合計フットプリントは約 950 KB です。両ライブラリは初訪問の後にブラウザによってキャッシュされるので、以降の訪問はネットワーク観点では瞬時です。四つのプロジェクト(mammoth.js、html2canvas、jsPDF、html2pdf.js)はオープンソースで、MIT または BSD ライセンスで、数万の本番プロジェクトで運用されています。このパイプラインは成熟しており、よく理解されており、サーバサイド描画を伴わない視覚的忠実度の DOCX から PDF への変換という用途に対し、戦場でも揉まれてきました。
DOCX と OOXML 標準の小史
- Word .doc(1983 年から 2007 年)。 Microsoft のバイナリ `.doc` 形式。Word 1.0 から Word 2003 までのすべてのバージョンで使われた、専有的で、生涯のほとんどを文書化なしで過ごし、相互運用のために競合他社にリバースエンジニアリングされた形式。
- OOXML 発表(2005 年 11 月)。 Microsoft が、バイナリの `.doc`、`.xls`、`.ppt` の置き換えを意図する XML ベース形式 Office Open XML の最初のドラフトを公開。標準化のために Ecma International へ提出。
- ECMA-376 第 1 版(2006 年 12 月)。 Ecma International が OOXML を ECMA-376 第 1 版として批准。これは、現在の `.docx`、`.xlsx`、`.pptx` にとって最初の公式な標準。仕様書は 6,000 ページを超えました。
- Office 2007 出荷(2007 年 1 月)。 Microsoft Office 2007 は `.docx` を既定の保存形式として出荷されました。Office 2003 には新形式を開けるようにする無償の互換パックが提供されました。
- ISO/IEC 29500:2008 批准(2008 年 11 月)。 オープンソースコミュニティと OpenDocument Format(ODF)陣営から強い批判を集めた論争的なファストトラックの後、ISO と IEC が OOXML を ISO/IEC 29500:2008 として採択。仕様は二つの版を定義します。Strict(クリーンで ISO 準拠)と Transitional(Word が実際に既定で書き出す版で、後方互換のための構造を温存)。
- 今日(2026 年)。 現実世界のほとんどすべての `.docx` は Transitional OOXML であり、Word、LibreOffice、Google Docs、Apple Pages、WPS Office、そして多くの SaaS 文書ツールのどれかで生成されます。この形式はもはや遍在し、個人の書き手から企業の文書管理システムまで、文書執筆経済のあらゆる階層で既定値となっています。
Word から PDF への変換を駆動する実際のワークフロー
- リクルーターや求人プラットフォームへの CV や履歴書の提出。 主要な求人プラットフォーム(LinkedIn Recruiter、Indeed、Workday、Greenhouse、政府の求人ポータル)はすべて PDF を期待します。著者は Word で書き、送信前に変換します。CV には個人連絡先、住所、職歴が含まれるため、プライバシーが重要です。
- カバーレターや志望理由のエッセイ。 大学、奨学金プログラム、行政申請、企業の採用、すべて提出形式として PDF に収束します。文法チェック、コメント、変更履歴の支援があるため執筆の道具は Word のままで、フォーマットが固定される納品形式が PDF です。
- 署名前の契約書および法的文書。 契約書ドラフトを回覧する前に PDF に変換し、相手方が固定レイアウトの文書を見られるようにします。署名後は、署名済み PDF が正本となります。文書は機密なので、変換は信頼できるデバイスで行う必要があります。
- 学術論文、学位論文、ジャーナル投稿。 ほとんどのジャーナルや大学のリポジトリは提出形式として PDF を受け付けます。著者は Word(または LaTeX)で執筆し、PDF で投稿します。LaTeX ユーザーにとってこのツールは関係ありませんが、社会科学、人文学、経営学、法学などにいる極めて多くの Word ユーザーにとっては、これが標準的なワークフローです。
- 内部報告書とアーカイブのスナップショット。 Word レポートを永久保存のために PDF に変換。PDF は正式な記録で、Word のソースはドラフトとして進化を続けられます。多くの規制業種(金融、医療、法務)では、コンプライアンス保管に PDF が要求されます。
- 信頼できるメール配布。 PDF はメールクライアントで一貫して描画されますが、`.docx` はそうではありません。Outlook、Gmail、Apple Mail、モバイルメールアプリはすべて PDF をインラインで開きますが、`.docx` は受信者に Word か互換アプリのインストールを要求します。非技術者向けの文書を配るには、PDF が摩擦の最も少ない配布形式です。
よくある落とし穴とその意味
- PDF 内のテキストは選択も検索もできません。 これはバグでなく設計です。パイプラインはレンダリングした HTML をラスター化するので、PDF 本文はビットマップ画像になります。PDF 内検索、コピー&ペースト、スクリーンリーダーによる本文へのアクセスは機能しません。テキスト選択が重要な文書(法務、保管、アクセシビリティ、文書データベース)には、Microsoft Word の「ファイル → PDF として保存」または LibreOffice の「ファイル → PDF としてエクスポート」を使ってください。どちらも DOCX ソースから、テキストベースの PDF を生成します。
- PDF のフォントが元の Word 文書と一致しません。 mammoth.js は意図的に意味的内容に集中しており、直接のフォントメタデータを移植しません。ブラウザはローカルで利用できるフォントで HTML を描画します。Word 文書が業務用マシンにしかインストールされていないカスタム企業フォントを使っていた場合、PDF はブラウザのフォールバックフォントで描画されます。修正は、変換を行う端末にソースフォントを入れるか、文書が参照するフォントを埋め込む Word の「PDF として保存」を使うことです。
- 複雑な表は簡略化されたり、不完全に表示されたりします。 mammoth は標準的な表(行、列、セルの罫線)をうまく扱います。多重結合セル、深く入れ子になった表、複雑な条件付き書式の表は、視覚的に簡略化されたり崩れたりすることがあります。mammoth の HTML 出力は Word の描画器が出すものの部分集合だからです。表が多いレポートには、Word のネイティブな PDF エクスポートが適切です。
- 多段組レイアウトが一段組になります。 mammoth は Word の `<w:cols>` ディレクティブを保持しません。新聞風の二段組記事は、生成される HTML では一段組になり、その結果 PDF でも一段組になります。出力に段組が本当に必要な文書には、Word の「ファイル → PDF として保存」または LibreOffice のヘッドレスモードを使ってください。どちらも変換中に段組構造を保持します。
- ソースのヘッダー、フッター、ページ番号は失われます。 mammoth は文書本文に焦点を当てており、Word のヘッダー、フッター、ページ番号フィールドを移植しません。html2pdf は独自のページネーションを加えますが、Word の元のヘッダー/フッターを注入することはできません。元のヘッダー/フッターが必要な文書には、Word 経由で変換するか、ここで変換した上で 無料オンラインPDFページ番号 で下流側でページ番号を付け足すかしてください。
- コメントと変更履歴は現れません。 既定で mammoth はコメントや変更マークをメタデータとして扱い、無視します。出力 PDF はすべての変更が実質的に承認された後の文書状態を反映します(変更要素を無視した
word/document.xmlの状態)。コメントや校閲マーキングを PDF に表示したい場合は、Word の「ファイル → PDF として保存」で「校閲マークの印刷」オプションを有効にして使うか、Word ですべての変更を先に承認/拒否してから変換してください。 - とても大きな文書はタブをフリーズさせることがあります。 mammoth と html2canvas はどちらも文書全体をメモリに読み込み、同期的に処理します。100 ページを超える文書や多数の画像を埋め込んだ文書は、特に RAM 4 GB 以下のモバイル端末でブラウザのメモリを飽和させることがあります。緩和策は、まず Word で文書を分割し、セクションごとに変換し、結果の PDF を 無料オンラインPDF結合ツール で結合することです。
プライバシー: 文書はあなたのデバイスにとどまります
主要なクラウドの Word から PDF へのサービス(Smallpdf、iLovePDF、Adobe Acrobat Online、PDF24、Sejda、Soda PDF)はすべて、あなたのファイルを運営者のサーバにアップロードし、サーバ側で LibreOffice や独自エンジンを使って解析し、PDF をレンダリングして、ダウンロードとして送り返します。プライバシー上の含意は些細ではありません。Word 文書は日常的に個人的または機微なものだからです。CV や送り状には自宅住所、電話番号、職歴。志望理由書や個人エッセイには率直な自己開示。HR フォームには希望給与。契約書には商業条項。診療記録に関する手紙には保護対象の医療情報。法律ドラフトには弁護士と依頼者の特権内容。大きな提供者は、一、二時間以内に削除し、TLS で転送中に暗号化することを約束したプライバシーポリシーを公表しており、最大手は ISO/IEC 27001 認証と GDPR への整合性を維持しています。彼らにはそれらの約束を守る強い商業的理由があります。しかし「一時間以内に削除」は「決して見なかった」と同義ではありません。その間にファイルの内容は彼らのインフラ上にあり、適切な権限を持つ任意のプロセスや人物がアクセスでき、適用される保持期間に応じてログとバックアップに残ります。
このコンバータは何もアップロードしません。mammoth.js と html2pdf.js はあなたのブラウザタブ内で完結して動きます。ファイルのバイトは File API で読み込まれ、JavaScript で処理され、PDF 出力は Blob ダウンロードとして同じタブに返されます。アップロードがないことは、変換ボタンを押す前にブラウザの開発者ツールを Network タブにして、操作を実行し、あなたのファイル内容を含む要求が一切発信されないことを観察すれば確認できます。唯一のネットワーク通信は、初回訪問時に CDN から二つのライブラリを一度だけ読み込む分(合計約 950 KB の minified)で、これは一度きりで起き、その後はブラウザキャッシュに残ります。ページが読み込まれた後に機内モードにしても、コンバータはローカルファイルに対して動作し続けます。仕組みの節で述べた通りのトレードオフは、出力 PDF がビットマップベースであることです。サーバサイドのコンバータが保つテキストの選択可能性と検索可能性を失います。CV、送り状、内部メモ、契約書ドラフト、応募フォームといった大半の個人用 Word から PDF のフローでは、ビットマップ出力で十分で、プライバシー保証は引き合います。出力に選択可能なテキストが必要な文書には、Word 自身の「PDF として保存」または LibreOffice の「PDF としてエクスポート」が正解です。ローカルマシンから文書を出さなくてよいなら、どちらもオフラインかつプライベートに使えます。
別のツールが正しい選択になるとき
- 出力 PDF に選択可能・検索可能なテキストが必要なとき。 法的ディスカバリ、文書アーカイブ、アクセシビリティ提出、検索エンジンにインデックスされたりスクリーンリーダーで読まれたりするもの一切。このツールの出力はビットマップだけで、こうした用途には足りません。Microsoft Word の「ファイル → PDF として保存」または LibreOffice の「ファイル → PDF としてエクスポート」を使ってください。どちらもオフラインで動作可能で、テキストベースの PDF を生成します。
- 文書が複雑なレイアウト、数式、埋め込みオブジェクトを含むとき。 多段組の新聞、数学が多い学術論文、Excel のチャートや PowerPoint のスライドを埋め込んだ文書、多重結合の複雑な表。こうした場合は Word のネイティブ描画器か LibreOffice のヘッドレス変換の方が利を得られます。mammoth の「意味優先」アプローチは、きれいに表現できないものを意図的に捨てるか単純化します。
- 多数のファイルをバッチ変換する必要があるとき。 このツールは一度に一つの文書を受け付け、描画パイプラインはシングルスレッドです。バッチには、LibreOffice を使う標準 CLI コマンド
soffice --headless --convert-to pdf *.docx --outdir output/が定番です。代替として、このツールが使うのと同じ mammoth と html2pdf のライブラリは Node.js でも動き、同じ忠実度プロファイルでスクリプト変換ができます。 - とても大きな文書(100 ページ超、または多数の重い画像を含むもの)。 mammoth と html2canvas は文書全体をメモリに載せて処理します。大きな文書は、特にモバイルでブラウザタブを凍結させ得ます。先に Word で分割してセクションごとに変換し(無料オンラインPDF結合ツール で結合)するか、ディスクからストリームでファイルを扱うデスクトップツール(Word、LibreOffice、コマンドラインの変換器)を使ってください。
機能
- 高速変換: 待機なしの瞬時のWord → PDF変換。
- カスタマイズ可能: ページサイズ(A4またはLetter)と余白を選択します。
- プライバシー: すべての処理はブラウザ内でローカルに行われます。サーバーに送信されるファイルはありません。
- シンプル: Wordファイルをドラッグ&ドロップして変換をクリックします。
- 1度に1ファイル: 最良の結果を得るには、1度に1つのWordドキュメントを変換します。
よくある質問
どのWord形式がサポートされていますか?
このコンバーターは.docxファイル(Microsoft Word 2007以降)をサポートしています。古い.docファイルはサポートされていません。Microsoft Wordで.docxに変換してから、このツールを使用できます。
フォーマットは保持されますか?
ほとんどのフォーマットは保持されます。フォント、サイズ、色、基本的なレイアウトを含みます。ただし、高度なテーブル、複数列レイアウト、埋め込みオブジェクトなどの複雑な要素は、変換中に簡素化または調整される場合があります。
Wordドキュメントはサーバーに送信されますか?
いいえ。すべての変換はMammothとhtml2pdfライブラリを介してブラウザ内でローカルに行われます。Wordファイルがデバイスを離れることはなく、完全なプライバシーとセキュリティを保証します。
複数のファイルを一度に変換できますか?
このツールは1度に1つのWordファイルを変換します。各変換のために、新しい.docxファイルをアップロードして変換するだけです。
ファイルサイズの制限は?
最大25 MBまでのファイルがサポートされています。非常に大きなファイルは、ブラウザの利用可能なメモリに応じて時間がかかる場合があります。
余白とページサイズを調整できますか?
はい。変換する前に、ページサイズ(A4またはLetter)と余白の幅(標準、狭い、広い)を選択できます。
その他のよくある質問
PDF 内のテキストが選択できないのはなぜですか?
このツールはビットマップベースの PDF を作ります。Word 文書を HTML に描画し、ブラウザを使ってその HTML を画面外の canvas に描き、そして canvas を画像として PDF に埋め込みます。出力 PDF にはページの写真が入っていて、位置を伴う文字ではありません。ページ本体からのコピー&ペーストは役に立つものを返さず、PDF 内検索は単語を見つけません。選択可能テキストが必要なフロー(法的ディスカバリ、研究データベース、アクセシビリティ)には、Microsoft Word の「ファイル → PDF として保存」または LibreOffice の「ファイル → PDF としてエクスポート」を使ってください。どちらも DOCX ソースからテキストベースの PDF を作ります。
なぜフォントが元の Word 文書と違うのですか?
このツールが DOCX を解析するために使う mammoth.js は、意味的内容(段落、見出し、リスト、表)に意図的に集中しており、直接的な書式(特定のフォント、正確なサイズ、色)には集中しません。ブラウザはローカルにインストールされているフォントを使って、生成された HTML を描画します。あなたの Word 文書が業務用マシンにのみインストールされたカスタムの企業フォントやブランドフォントを使っていた場合、PDF はブラウザのフォールバックフォント(通常は汎用のサンセリフ)で表示されます。フォントを保持したければ、同じフォントをデバイスにもインストールするか、Word 自身の「PDF として保存」を使ってください。文書が参照するフォントを埋め込んでくれます。
このツールはオフラインで動きますか?
はい、最初の訪問の後なら動きます。ライブラリ(mammoth が約 600 KB、html2pdf が約 350 KB)は CDN から一度だけ読み込まれ、その後はブラウザにキャッシュされます。以降の変換ツールへの訪問は、間にブラウザキャッシュが消去されていない限り、ネットワーク接続なしで動きます。変換そのものはそもそもネットワークを必要としません。最初のライブラリ読み込みだけが必要だったのです。一度ページを開いてから機内モードを有効にし、ローカルの DOCX を変換してみれば確認できます。
古い .doc ファイル(Word 97-2003)を変換できますか?
いいえ。このツールは .docx(Word 2007 で導入された Office Open XML)のみを受け付けます。古いバイナリ .doc 形式には別の解析器が必要です(mammoth は XML ベースの .docx だけを扱います)。.doc ファイルを変換するには、まず Word または LibreOffice で開いて .docx として保存し、その上でここで変換してください。.doc から .docx への変換はどちらのツールでもワンクリックの操作で、内容は保持されます。
結果の PDF でハイパーリンクはクリック可能ですか?
ソース文書のハイパーリンクは PDF 内で視覚的にスタイル付きのテキスト(青、下線)として現れますが、インタラクティブではありません。PDF 本体はレンダリングされた HTML のビットマップ画像なので、PDF リーダーでリンクテキストをクリックしてもどこにも移動しません。出力 PDF にクリック可能なリンクが必要なら、Word の「ファイル → PDF として保存」(PDF のリンク注釈を保持)または LibreOffice の「PDF としてエクスポート」を使ってください。どちらも変換後にハイパーリンクが機能する PDF を作ります。
デスクトップやコマンドラインの同等手段はありますか?
はい、いくつかあります。サーバサイドおよびコマンドラインの標準的なアプローチは LibreOffice のヘッドレスモードです。soffice --headless --convert-to pdf input.docx --outdir output/ がファイルをその場で変換します。バッチ向きで GUI 不要です。LibreOffice は Linux、macOS、Windows のいずれにもインストールでき、同じコマンドラインがどこでも動きます。プログラマブルに Word と画素レベルで同じ出力を得るなら、Windows 上の Microsoft Word + PowerShell COM 自動化が金字塔です(Word のインストールが必要)。このツールが使うのと同じ mammoth.js と html2pdf.js のライブラリは Node.js でも動き、同じ忠実度プロファイルでブラウザなしのスクリプト変換ができます。学術出版のワークフローには Pandoc を LaTeX エンジンと組み合わせるのも一つの選択肢です。