無料PDF分割ツール
PDFを1ページずつ、またはお好みの範囲で瞬時に分割できます。サーバーへのアップロードなしでページを抽出します。
最大100 MBまでのPDFファイルに対応
使い方
- 上のエリアにPDFを選択またはドロップします。
- 全ページを抽出するか、カスタムページ範囲を指定するかを選びます。
- PDFは ブラウザ内で分割されます · サーバーへのアップロードは一切ありません。
- 分割されたPDFは自動的にZIPファイルとしてダウンロードされます。
PDF分割ツールの活用シーン
- 特定のページを抽出 · 不要なページを文書から取り除きます。
- 個別のページを共有 · 関連するページだけを相手に送信できます。
- ファイルサイズを削減 · 大きなPDFを小さく扱いやすいファイルに分割します。
- 書類を整理 · 複数のセクションを含むPDFを個別の文書に分けます。
- アーカイブ管理 · スキャンした書類を1ページずつのPDFに分割します。
ページ範囲の指定方法
カスタム範囲機能を使うと特定のページを抽出できます。複数の範囲を指定するにはカンマで区切ってください:
- 1 · 1ページ目を抽出
- 1-3 · 1、2、3ページを抽出
- 5, 7-10, 15 · 5ページ目、7–10ページ、15ページ目を抽出
- 2, 4, 6 · 2ページ目から1ページおきに抽出
よくある質問
一度に何ページまで分割できますか?
数百ページのPDFでも分割できます。上限はブラウザのメモリに依存しますが、ほとんどのPDFは瞬時に処理されます。
ファイルサイズの上限はどれくらいですか?
最大100 MBまでのPDFを処理できます。分割はブラウザ内で行われるため、非常に大きなファイルではデバイスによって多少時間がかかる場合があります。
PDFはどこかにアップロードされますか?
いいえ。すべての分割処理は完全にブラウザ内で完結します。PDFがデバイスから外に出ることはなく、プライバシーとセキュリティが完全に守られます。
ページを異なる順序で抽出できますか?
はい。カスタム範囲モードでは任意の順序でページ番号を入力できます。たとえば"5, 3, 1"と入力すると、5、3、1ページの順で1つのPDFが作成されます。
PDFのフォームや注釈はどうなりますか?
テキストとレイアウトは保持されますが、インタラクティブなフォームは引き継がれない場合があります。注釈は分割後も通常保持されます。
「分割」の四つの意味
PDF の文脈で「分割」という動詞は、少なくとも四つの相当に異なる操作を覆っており、UI 上では同じ言葉を使うツールがかなり違った出力を出します。バーストは PDF を一枚ずつの N 個の PDF にばらし、各ファイルにページ番号で名前を付けます。範囲抽出は一つ以上のページ範囲(たとえば 1〜10 と 25〜40 ページ)を選び、各範囲ごとに一つの PDF を作ります。しおりによる章分割は文書のアウトラインツリーを読み、各最上位しおりが覆うページ範囲を見つけ出して、章ごとに一つの PDF を作ります。任意選択はページの任意のサブセット(順不同でも可)を一つの結合 PDF にまとめます。
本ツールは範囲抽出を実装しています。ユーザーがページ範囲を指定すると、ツールが範囲ごとに出力 PDF を構築し、原本には一切手を加えません。各ページをそれ自身一ページの範囲として指定すればバーストも可能ですが、UI は実世界の主流である範囲操作に合わせて最適化されています。任意選択(同じファイル内でのページの任意並べ替え)は 無料のPDFページエディターオンライン ツールの仕事です。しおりを使った章分割はここではまだサポートされておらず、下の本文はその点を正直に説明します。
分割の小史
分割は形式としての PDF より約十年早く存在していました。文書イメージングのベンダーは、1980 年代末にはすでに複数ページの TIFF や PostScript ファイルからページ範囲を抜き出しており、解くべき根本問題は今日と同じでした。すなわち、特定ページの視覚的内容を新しい容器に複製しつつ、その視覚的内容と各リソースを結びつけている相互参照を壊さない、ということです。1993 年に PDF が登場すると、この問題と当時のアルゴリズム的機構の大半をそのまま引き継ぎました。
2000 年代初頭の PDF 操作の代名詞的なコマンドラインツールは pdftk で、Sid Steward が 2002 年に Java で書きました。pdftk は分割、結合、回転、透かしといった明確な操作を備え、いずれも PDF をオブジェクトモデルに構文解析してから関連するサブグラフを再発行することで実装されていました。Jay Berkenbilt が 2008 年に立ち上げた qpdf は現代のオープンソース標準となり、同じ操作を世界中のパッケージマネージャーで使われる C++ ライブラリ越しに公開しています。2008 年の ISO 32000-1 は分割専用のプリミティブを追加しませんでした。既存の形式構造ですでに十分だったからです。分割は純粋にオーサリング側の操作で、同じ部品から、より小さく、依然として妥当な PDF を産み出します。
分割が実際にどう起こるか
本ツールの分割操作は、pdf-lib の内部で三つの決定論的な処理を行います。第一に、ソース PDF の相互参照表を読み込み、各間接オブジェクトをメモリ上のモデルに解析します。第二に、要求された出力範囲ごとに、空の宛先文書を作り、その範囲のページインデックスで copyPages を呼び、選ばれた各ページのリソースグラフ(フォント、画像、フォーム XObject、グラフィックス状態辞書、パターン、色空間)をたどって、推移的に参照される全てのオブジェクトを宛先の番号空間に複製し、複製したページを宛先のページツリーに順序通り追加します。
第三に、各宛先をバイト列に直列化してダウンロードとして送出します。範囲ごとの宛先文書は反復間でガベージコレクションの対象になり得て、それが、出力をすべて同時に保持していたらメモリに収まらないような総ページ数の PDF でもツールが動作する理由です。ページ複製のプリミティブは、本サイトの PDF Merge ツールを駆動するのと同じものですが、逆方向に使われます。どちらの操作も無損失で、複製ページのテキスト、画像、ベクトルグラフィックス、コンテンツストリームはそのまま宛先に書き込まれ、トランスコードもラスタライズも起きず、出力はソースの対応ページとピクセル単位で同じく描画されます。
分割を駆動する実際のワークフロー
- 法的申立てにおける証拠物。 申立てが証拠 A から Z までを伴って提出されると、弁護士が組み上げたマスター PDF は、裁判所の電子事件管理システムでの索引付けのために個々の証拠物に分割される必要があります。米国連邦裁判所の CM/ECF ガイドラインは、システムが各証拠物を別々にタグ付けするため、アップロード前の分割を明示的に推奨しています。
- 試験問題と模範解答。 試験委員会は問題冊子、採点基準、出題講評を一つの結合 PDF にまとめて保管します。学校はその後、学年ごとに配布するために、その PDF をセクション単位で分割します。絶対量で見れば最高位級の分割パターンで、夏の試験期にピークを迎えます。
- バッチからの個別明細書。 銀行、公共料金、給与システムは、毎月、すべての受領者の明細を一冊にまとめたバッチ PDF を生成し、サーバ側で分割することがよくあります。同じ操作は受領者側でも時に必要で、たとえば税務サービスが年通算の明細書を受け取って、四半期ごとのページが必要なときに行います。
- 章や論文の抽出。 大学スタッフは、著作権に配慮したフェアユースの範囲内に収めるため、雑誌の合本や教科書のスキャンを章ごとに配布します。しおり主導の分割が最適ですが、範囲ベースのツールしか持たないユーザーは各章の開始ページを手作業で調べる必要があります。
- 公開記録と情報公開のワークフロー。 政府の記録担当者は大型の内部文書を公開のために受け取り、機微なセクションの境界で分割します。機微でない部分はすぐに公開し、それ以外は別のツールで黒塗り処理に回します。
- サンプル用ポートフォリオ。 写真家やデザイナーはマスターのポートフォリオを保持し、特定の応募のために小さなサンプルを抜き出します。他の用途より量は少ないものの、ユーザー単位の価値は高く、代替策は複数のマスターファイルを抱えることになります。
よくある落とし穴とその回避
- フォーム項目が死ぬ。 インタラクティブフォーム辞書は文書レベルにあります。フォームウィジェットを含むページを複製すると、その視覚的痕跡は伴いますが、それらをインタラクティブにする項目定義は伴いません。分割した出力ではフォームは正しく描画されますが、入力を受け付けません。対処:まず 無料オンラインPDFフラット化 ツールでソースを平坦化し、平坦化済みの複製を分割してください。
- しおりが消える。 アウトラインツリーは文書レベルの構造です。範囲ベースの分割は、現状その関連する部分木を各出力に伝播しないため、ソースにしおりがあったかどうかに関係なく、分割後の各ファイルにはアウトラインが残りません。アウトラインを意識した分割には、部分的なアウトライン再書き出しのパスか、別モードの実装が必要で、当面は見送ります。
- 暗号化された PDF は読み込めない。 開封パスワード付きの PDF はパスワードが提供されるまで構文解析できません。本ツールは暗号化された入力をサポートしません。手順:まず 無料オンラインPDFロック解除 ツールで保護を外し、開錠した複製を分割し、必要なら各出力に 無料PDFパスワード保護オンライン で保護を再適用してください。
- 署名は残らない。 電子署名は入力ファイルの正確なバイト範囲に対する暗号学的ハッシュです。分割は定義上新しい PDF を作り、それらには原本のバイトが含まれませんから、署名はどの出力にも保たれません。これは暗号学的に正しい挙動ですが、時に意表をつきます。署名済みのソース PDF はそのまま保存し、必要であれば未署名の複製を分割してください。
- アクセシビリティタグは引き継がれない。 スクリーンリーダーを駆動する PDF/UA-1 の構造ツリーは文書レベルのオブジェクトです。範囲ベースの分割はそれを出力に運ばないため、タグ付きのソースからはタグなしの分割が生まれます。視覚に障害のある読者へ再配布する文書では、各出力を Adobe Acrobat の「アクセシブルにする」ウィザードで再タグ付けすると良いでしょう。
分割後の合計が入力よりわずかに大きくなる理由
出力の各 PDF は、それ自体で完結する妥当な PDF です。それぞれが独自のカタログ、ページツリー、フォントメタデータ、相互参照表を持ちます。10 MB の PDF を一枚ずつの 10 個の出力に分割すると、合計は通常、10 MB より少し多くなります。これら 10 個のファイルのそれぞれが「自己完結文書であること」の構造的オーバーヘッドを背負うからです。経験的にはこのオーバーヘッドは合計の 1% から 5% の間で、出力ファイル数に応じて絶対量も増えます。多くの用途では無視できますが、極端に大きな文書を多数の小さな出力に分割するユーザーには目に見える量です。総量を気にする方は、各出力をその後 無料オンラインPDF圧縮 ツールに通すと、ファイルあたりのオーバーヘッドの大部分を取り戻せます。
ブラウザ完結の分割 対 クラウド分割
Google の検索結果を埋める各種のクラウド PDF 分割サービス(Smallpdf、ILovePDF、PDF24 の Web アプリ、Adobe Acrobat Online、Sejda の無料プラン)は、いずれもソース PDF を自社のサーバへアップロードし、そこで分割を行い、出力をダウンロードとして返します。プライバシーポリシーは、アップロードされたファイルは数時間で削除されると述べていますが、ファイルはやはり運営者のネットワークを通過し、処理ウィンドウのあいだディスク上に存在し、運営者が不正検知のために保持するあらゆるログを通り抜けます。
本ツールはアップロードしません。お手元の PDF は標準の File API でブラウザのタブに読み込まれ、同じタブ内で pdf-lib に構文解析され、出力 PDF は標準のダウンロード API でお手元のディスクへ書き戻されます。分割のあいだの唯一のネットワーク通信は、ページを初めて開いた瞬間の pdf-lib 自体の CDN からの一度きりのロードです。検証可能で、ブラウザの開発者ツールを Network タブで開き、一度分割を実行して、ファイル内容を運ぶリクエストが発生しないことを確認できます。プライバシー保証の代償は、しおりベースの分割や構造ツリーの伝播など、より大きなサーバ側ツールが提供する欠けた機能です。トレードオフは正直であり、対象文書に合わせてどちらの側を取るかを選べます。
さらによくある質問
しおりや章で分割できますか?
今のところ、できません。本ツールは範囲ベースの分割を行い、ページ範囲を選ぶとそれぞれに対して出力が一つ作られます。しおりベースの分割(ツールが文書のアウトラインを読み、各最上位しおりが覆うページ範囲を分割点として使う方式)は将来追加予定ですが、まだ出ていません。当面の回避策はリーダーで PDF を開き、目に見えるアウトラインから章の開始ページをメモして、その範囲を手で入力することです。アウトラインが深い文書には、Smallpdf や Adobe Acrobat Online のようなサーバ側ツールがこの調査の手間を省いてくれます。
分割後のファイル群が、元のファイルよりも少しだけ大きいのはなぜですか?
各出力 PDF は、自己完結した文書であることの構造的オーバーヘッド(カタログ、ページツリー、相互参照表、フォントメタデータ)を背負います。10 MB のファイルを一枚ずつの 10 個の出力に分割すると、合計は入力より数パーセント多くなります。オーバーヘッドは通常 1% から 5% の範囲で、出力数に応じて絶対量も増えます。総量が気になるなら、各出力を PDF Compress ツールに通せば、ファイルごとのオーバーヘッドの大部分を取り戻せます。
分割しても、しおりとタグ付きアクセシビリティは保たれますか?
現状では保たれません。アウトラインツリーと PDF/UA-1 の構造ツリーはどちらも文書レベルのオブジェクトです。本ツールが用いる pdf-lib の copyPages 操作は、まだそれらを分割出力へ伝播しません。しおりやタグの保持が重要な文書(公的部門の刊行、アクセシブルな配布)では、今日のところ Adobe Acrobat Online が適切です。多くの分割では損失は許容範囲ですが、一部ではそうではなく、そのことをごまかしたくはありません。
暗号化された、あるいはパスワード保護された PDF を分割できますか?
直接にはできません。開封パスワード付きの PDF はパスワードが提供されるまで構文解析できず、pdf-lib は暗号化入力をサポートしません。流れとしては、まず PDF Unlock ツールでパスワードを外し、ここで開錠した複製を分割し、必要なら PDF Protect ツールで各出力に保護を再適用します。分割後の複製は、元の署名済み・暗号化された文書とは別の文書なので、署名の有効性とアクセス制御はこの往復で保たれません。
出力ファイルの命名規約は何ですか?
出力名は、ソース PDF の基底名にページ範囲を示すサフィックスを付けて生成されます。annual-report.pdf という名前のソースを 1〜5 ページと 6〜30 ページに分割すれば、annual-report_pages_1-5.pdf と annual-report_pages_6-30.pdf が作られます。一枚抜き出しは _page_7.pdf のようなサフィックスを得ます。命名は決定論的なので、バッチワークフローは範囲指定から出力名を予測できます。ブラウザの「名前を付けて保存」ダイアログがそれぞれのファイルの落ち先を決め、最近のブラウザはタブごとにダウンロード先フォルダの設定があり、各出力に同じ設定を使います。