Word→PDF変換

Word(.docx)ファイルを瞬時にPDFに変換します。登録不要。ファイルがデバイスを離れることはありません。

ファイルはお使いのデバイスから出ません
ここにWordファイルをドロップ またはクリックして参照

.docxをサポート · 最大25 MB

注意: テーブル、画像、列などの複雑なフォーマットは変換中に簡素化される場合があります。

仕組み

  1. Wordファイルをアップロード: 変換する.docxファイルをドロップまたは選択します。
  2. オプションを構成: 希望のページサイズと余白を選択します。
  3. 変換: 「PDFに変換」をクリックしてPDFを生成します。変換はブラウザ内で瞬時に行われます。

なぜPDFに変換するのか?

PDFは普遍的なドキュメント形式です。Wordドキュメントを PDFに変換すると、すべてのデバイスとオペレーティングシステムで一貫したフォーマットが保証され、ドキュメントを読み取り専用にして偶発的な変更を防ぎ、ファイルサイズを削減し、共有、アーカイブ、プロフェッショナルな送信に理想的です。PDFはどこでも互換性があり、元のフォーマットを保持します。

「DOCX から PDF」とは本当のところ何を意味するのか

`.docx` ファイルは、Word に表示されるような単一の文書ではありません。それは ZIP アーカイブ(ISO/IEC 29500-2 で定義された Open Packaging Conventions コンテナ)であり、その中に XML ファイルのツリー、埋め込み画像、関係メタデータが格納されています。文書の本文テキストは word/document.xml に WordprocessingML マークアップとして存在します。段落スタイルは word/styles.xml、リスト番号は word/numbering.xml、埋め込み画像は word/media/ にあります。任意の `.docx` を `.zip` にリネームして解凍すれば、その構造を任意のテキストエディタで見ることができます。この形式は Microsoft Office 2007 と共に導入され、2006 年 12 月に ECMA-376 として、2008 年に ISO/IEC 29500 として標準化されました。今日、何億もの作者が使う Word の既定フォーマットです。

PDF(Portable Document Format)は逆のパラダイムを記述します。固定レイアウトのページ、正確な座標上のグリフ、埋め込みフォント、絶対位置決め。DOCX は流れに基づく形式(ページサイズ、余白、フォントが変わるとテキストが再流動する)ですが、PDF は画素単位で配置される形式(各文字がページ座標系の特定の点を占めます)。両者の変換は構造的にはパラダイム間の翻訳です。柔軟な執筆フォーマットが、凍結された提示フォーマットに変わるのです。Microsoft Word 自身であれ、LibreOffice のヘッドレス変換器、Smallpdf のクラウドエンジン、このブラウザツールであれ、あらゆる変換ツールは同じ本質的な隔たりに直面します。源は意図を、宛先は外見を記述し、意図は変換中に特定の外見にコミットされなければならない、ということです。

異なる変換アプローチは、その隔たりに対して異なるトレードオフを受け入れます。Word 自身の「PDF として保存」は、文書を画面に表示するのと同じ描画エンジンを使うので、変換は本質的に「画面サーフェスでなく PDF サーフェスへ描画する」ことになります。忠実度は素晴らしく、出力中のテキストは選択可能です。クラウドサービスは通常サーバサイドの LibreOffice か独自エンジンを使います。忠実度は高く、テキストは選択可能、ファイルはアップロードされます。このブラウザツールは異なるパイプライン(次節で説明)を使い、プライバシーと到達範囲(任意のブラウザ、任意のデバイス、インストール不要、アップロード不要)を最適化し、引き換えに忠実度の代償を受け入れます。これらのアプローチに普遍的な最善はありません。それぞれが異なるワークフローに合います。

このツールの内部の仕組み

変換は完全にあなたのブラウザ内で、三段階のパイプラインによって走ります。mammoth.js が DOCX を意味的な HTML に解析し、html2canvas(html2pdf.js から呼ばれる)がブラウザ自身の描画プリミティブを使ってその HTML をオフスクリーンの `<canvas>` 要素に描き、jsPDF(同じく html2pdf.js から呼ばれる)がその canvas を JPEG 画像データとして包み、PDF ページに配置し、設定したページサイズと余白から導かれる境界に改ページを入れます。出力 PDF はフルページのビットマップ画像の列で、ソースページごとに 1 枚以上、それに PDF メタデータヘッダーが付くものです。

このパイプラインの重要な帰結は最初に率直に明言しておくに値します。出力 PDF はビットマップベースであり、テキストベースではありません。PDF の本体に見える文字は画像中のピクセルであって、埋め込みフォントデータを伴うテキスト配置オペレータではありません。実務的にはこう意味します。PDF 内検索は単語を見つけません。ページ本体からのコピー&ペーストは役立つものを返しません。スクリーンリーダーは内容をテキストとして読めません。PDF を下流のテキスト処理ツールに渡すなら OCR が必要です。いずれかが重要なワークフロー(法的ディスカバリ、アクセシビリティ提出、検索を想定した文書アーカイブ、ソフトウェアで解析される一切)には、適切なツールは Microsoft Word の「ファイル → PDF として保存」または LibreOffice の「ファイル → PDF としてエクスポート」です。いずれも DOCX ソースからテキストベースの PDF を生成し、テキストは選択可能・検索可能・スクリーンリーダーから読めるものになります。このツールの目的は、Word 文書から視覚的にきれいな PDF を文書をどこにもアップロードせずに届けることであり、ビットマップ出力はそのプライバシー保証の対価です。

`.docx` を選ぶと、ブラウザの File API がバイトを mammoth.js に渡します。mammoth は DOCX を OPC パッケージとして扱い、word/document.xml を取り出し、WordprocessingML ツリーをたどります。`<w:p>` は `<p>` に、`<w:tbl>` は `<table>` に、太字/斜体のラン(run)はインラインマークアップに、ハイパーリンクは `<a>` に、`word/media/` 内の埋め込み画像はインラインの base64 エンコード `<img>` タグになります。続いてツールは HTML を隠れた DOM コンテナの中に描画し、選んだページサイズと余白を CSS として適用し、そのコンテナで html2pdf を呼び出します。html2pdf はコンテナを CSS のページ境界で仮想ページに分割し、各ページサイズの片々に対して html2canvas を呼び出し、得られた canvas ビットマップを jsPDF 文書に組み立てます。パイプライン全体は、最初のライブラリ読み込み以後はネットワーク要求を行いません。

変換を支える三つのライブラリ

mammoth.js は DOCX 解析器です。Michael Williamson が BSD-2-Clause ライセンスで作成し、GitHub の mwilliamson/mammoth.js でメンテナンスされています。Williamson 自身の設計哲学では、変換は意味的な内容(段落、見出し、リスト、表、脚注、ハイパーリンク、埋め込み画像)を保持すべきであり、直接的な表現(特定のフォント、サイズ、色、間隔)ではないとされています。著者は、文書は文脈(Word、Web、ePub、PDF)間を移動し、ある文脈に適した視覚スタイルは別の文脈にも適することはまれだと論じます。意味構造を運ぶ方が、正確な見た目を運ぶより役に立ちます。ブラウザ用バンドルは約 600 KB(minify 後)です。

jsPDF は PDF 書き出しライブラリです。2010 年に James Hall(GitHub: MrRio)が作成し、現在は yWorks GmbH と共同保守、MIT ライセンス、GitHub の parallax/jsPDF にあります。jsPDF はテキスト、ベクター図形、画像、HTML canvas から PDF を書き出せます。このツールでは html2canvas の canvas ビットマップを消費し、それらを PDF ページに組み立てます。html2canvas(Niklas von Hertzen 作、MIT ライセンス)は HTML から canvas への描画器で、各要素の計算済み CSS を使って DOM ノードを `<canvas>` に描きます。html2pdf.js(Erik Koopmans 作、MIT ライセンス)は接着剤で、html2canvas と jsPDF をオーケストレーションし、ページネーションを扱い、整ったコンフィグ API を公開し、すべてを約 350 KB(minify 後)の単一バンドルにまとめます。

初回読み込み時の合計フットプリントは約 950 KB です。両ライブラリは初訪問の後にブラウザによってキャッシュされるので、以降の訪問はネットワーク観点では瞬時です。四つのプロジェクト(mammoth.js、html2canvas、jsPDF、html2pdf.js)はオープンソースで、MIT または BSD ライセンスで、数万の本番プロジェクトで運用されています。このパイプラインは成熟しており、よく理解されており、サーバサイド描画を伴わない視覚的忠実度の DOCX から PDF への変換という用途に対し、戦場でも揉まれてきました。

DOCX と OOXML 標準の小史

Word から PDF への変換を駆動する実際のワークフロー

よくある落とし穴とその意味

プライバシー: 文書はあなたのデバイスにとどまります

主要なクラウドの Word から PDF へのサービス(Smallpdf、iLovePDF、Adobe Acrobat Online、PDF24、Sejda、Soda PDF)はすべて、あなたのファイルを運営者のサーバにアップロードし、サーバ側で LibreOffice や独自エンジンを使って解析し、PDF をレンダリングして、ダウンロードとして送り返します。プライバシー上の含意は些細ではありません。Word 文書は日常的に個人的または機微なものだからです。CV や送り状には自宅住所、電話番号、職歴。志望理由書や個人エッセイには率直な自己開示。HR フォームには希望給与。契約書には商業条項。診療記録に関する手紙には保護対象の医療情報。法律ドラフトには弁護士と依頼者の特権内容。大きな提供者は、一、二時間以内に削除し、TLS で転送中に暗号化することを約束したプライバシーポリシーを公表しており、最大手は ISO/IEC 27001 認証と GDPR への整合性を維持しています。彼らにはそれらの約束を守る強い商業的理由があります。しかし「一時間以内に削除」は「決して見なかった」と同義ではありません。その間にファイルの内容は彼らのインフラ上にあり、適切な権限を持つ任意のプロセスや人物がアクセスでき、適用される保持期間に応じてログとバックアップに残ります。

このコンバータは何もアップロードしません。mammoth.js と html2pdf.js はあなたのブラウザタブ内で完結して動きます。ファイルのバイトは File API で読み込まれ、JavaScript で処理され、PDF 出力は Blob ダウンロードとして同じタブに返されます。アップロードがないことは、変換ボタンを押す前にブラウザの開発者ツールを Network タブにして、操作を実行し、あなたのファイル内容を含む要求が一切発信されないことを観察すれば確認できます。唯一のネットワーク通信は、初回訪問時に CDN から二つのライブラリを一度だけ読み込む分(合計約 950 KB の minified)で、これは一度きりで起き、その後はブラウザキャッシュに残ります。ページが読み込まれた後に機内モードにしても、コンバータはローカルファイルに対して動作し続けます。仕組みの節で述べた通りのトレードオフは、出力 PDF がビットマップベースであることです。サーバサイドのコンバータが保つテキストの選択可能性と検索可能性を失います。CV、送り状、内部メモ、契約書ドラフト、応募フォームといった大半の個人用 Word から PDF のフローでは、ビットマップ出力で十分で、プライバシー保証は引き合います。出力に選択可能なテキストが必要な文書には、Word 自身の「PDF として保存」または LibreOffice の「PDF としてエクスポート」が正解です。ローカルマシンから文書を出さなくてよいなら、どちらもオフラインかつプライベートに使えます。

別のツールが正しい選択になるとき

機能

よくある質問

どのWord形式がサポートされていますか?

このコンバーターは.docxファイル(Microsoft Word 2007以降)をサポートしています。古い.docファイルはサポートされていません。Microsoft Wordで.docxに変換してから、このツールを使用できます。

フォーマットは保持されますか?

ほとんどのフォーマットは保持されます。フォント、サイズ、色、基本的なレイアウトを含みます。ただし、高度なテーブル、複数列レイアウト、埋め込みオブジェクトなどの複雑な要素は、変換中に簡素化または調整される場合があります。

Wordドキュメントはサーバーに送信されますか?

いいえ。すべての変換はMammothとhtml2pdfライブラリを介してブラウザ内でローカルに行われます。Wordファイルがデバイスを離れることはなく、完全なプライバシーとセキュリティを保証します。

複数のファイルを一度に変換できますか?

このツールは1度に1つのWordファイルを変換します。各変換のために、新しい.docxファイルをアップロードして変換するだけです。

ファイルサイズの制限は?

最大25 MBまでのファイルがサポートされています。非常に大きなファイルは、ブラウザの利用可能なメモリに応じて時間がかかる場合があります。

余白とページサイズを調整できますか?

はい。変換する前に、ページサイズ(A4またはLetter)と余白の幅(標準、狭い、広い)を選択できます。

その他のよくある質問

PDF 内のテキストが選択できないのはなぜですか?

このツールはビットマップベースの PDF を作ります。Word 文書を HTML に描画し、ブラウザを使ってその HTML を画面外の canvas に描き、そして canvas を画像として PDF に埋め込みます。出力 PDF にはページの写真が入っていて、位置を伴う文字ではありません。ページ本体からのコピー&ペーストは役に立つものを返さず、PDF 内検索は単語を見つけません。選択可能テキストが必要なフロー(法的ディスカバリ、研究データベース、アクセシビリティ)には、Microsoft Word の「ファイル → PDF として保存」または LibreOffice の「ファイル → PDF としてエクスポート」を使ってください。どちらも DOCX ソースからテキストベースの PDF を作ります。

なぜフォントが元の Word 文書と違うのですか?

このツールが DOCX を解析するために使う mammoth.js は、意味的内容(段落、見出し、リスト、表)に意図的に集中しており、直接的な書式(特定のフォント、正確なサイズ、色)には集中しません。ブラウザはローカルにインストールされているフォントを使って、生成された HTML を描画します。あなたの Word 文書が業務用マシンにのみインストールされたカスタムの企業フォントやブランドフォントを使っていた場合、PDF はブラウザのフォールバックフォント(通常は汎用のサンセリフ)で表示されます。フォントを保持したければ、同じフォントをデバイスにもインストールするか、Word 自身の「PDF として保存」を使ってください。文書が参照するフォントを埋め込んでくれます。

このツールはオフラインで動きますか?

はい、最初の訪問の後なら動きます。ライブラリ(mammoth が約 600 KB、html2pdf が約 350 KB)は CDN から一度だけ読み込まれ、その後はブラウザにキャッシュされます。以降の変換ツールへの訪問は、間にブラウザキャッシュが消去されていない限り、ネットワーク接続なしで動きます。変換そのものはそもそもネットワークを必要としません。最初のライブラリ読み込みだけが必要だったのです。一度ページを開いてから機内モードを有効にし、ローカルの DOCX を変換してみれば確認できます。

古い .doc ファイル(Word 97-2003)を変換できますか?

いいえ。このツールは .docx(Word 2007 で導入された Office Open XML)のみを受け付けます。古いバイナリ .doc 形式には別の解析器が必要です(mammoth は XML ベースの .docx だけを扱います)。.doc ファイルを変換するには、まず Word または LibreOffice で開いて .docx として保存し、その上でここで変換してください。.doc から .docx への変換はどちらのツールでもワンクリックの操作で、内容は保持されます。

結果の PDF でハイパーリンクはクリック可能ですか?

ソース文書のハイパーリンクは PDF 内で視覚的にスタイル付きのテキスト(青、下線)として現れますが、インタラクティブではありません。PDF 本体はレンダリングされた HTML のビットマップ画像なので、PDF リーダーでリンクテキストをクリックしてもどこにも移動しません。出力 PDF にクリック可能なリンクが必要なら、Word の「ファイル → PDF として保存」(PDF のリンク注釈を保持)または LibreOffice の「PDF としてエクスポート」を使ってください。どちらも変換後にハイパーリンクが機能する PDF を作ります。

デスクトップやコマンドラインの同等手段はありますか?

はい、いくつかあります。サーバサイドおよびコマンドラインの標準的なアプローチは LibreOffice のヘッドレスモードです。soffice --headless --convert-to pdf input.docx --outdir output/ がファイルをその場で変換します。バッチ向きで GUI 不要です。LibreOffice は Linux、macOS、Windows のいずれにもインストールでき、同じコマンドラインがどこでも動きます。プログラマブルに Word と画素レベルで同じ出力を得るなら、Windows 上の Microsoft Word + PowerShell COM 自動化が金字塔です(Word のインストールが必要)。このツールが使うのと同じ mammoth.js と html2pdf.js のライブラリは Node.js でも動き、同じ忠実度プロファイルでブラウザなしのスクリプト変換ができます。学術出版のワークフローには Pandoc を LaTeX エンジンと組み合わせるのも一つの選択肢です。

関連ツール