मुफ़्त PDF स्प्लिटर

PDF को तुरंत अलग-अलग पृष्ठों या कस्टम रेंज में विभाजित करें। किसी भी सर्वर पर अपलोड किए बिना पृष्ठ निकालें।

आपकी फ़ाइलें कभी आपके डिवाइस से बाहर नहीं जातीं
यहाँ PDF छोड़ें या ब्राउज़ करने के लिए क्लिक करें

100 MB तक की PDF फ़ाइलें समर्थित हैं

प्रक्रिया चल रही है...

यह कैसे काम करता है

  1. ऊपर एक PDF चुनें या छोड़ें।
  2. सभी पृष्ठ निकालने या कस्टम पृष्ठ रेंज निर्दिष्ट करने का विकल्प चुनें।
  3. PDF विभाजित होता है आपके ब्राउज़र में · किसी भी सर्वर पर कुछ भी अपलोड नहीं किया जाता।
  4. अपनी विभाजित PDF को स्वचालित रूप से ZIP फ़ाइल के रूप में डाउनलोड करें।

PDF स्प्लिटर का उपयोग कब करें

पृष्ठ रेंज समझना

कस्टम रेंज सुविधा आपको विशिष्ट पृष्ठ निकालने देती है। कई रेंज को अलग करने के लिए कॉमा का उपयोग करें:

अक्सर पूछे जाने वाले प्रश्न

मैं एक बार में कितने पृष्ठ विभाजित कर सकता/सकती हूँ?

आप सैकड़ों पृष्ठों वाली PDF को विभाजित कर सकते हैं। सीमा आपके ब्राउज़र की मेमोरी पर निर्भर करती है, लेकिन अधिकांश PDF तुरंत प्रोसेस हो जाती हैं।

फ़ाइल आकार की कौन सी सीमा लागू होती है?

100 MB तक की PDF प्रोसेस की जा सकती हैं। चूँकि विभाजन आपके ब्राउज़र में होता है, बहुत बड़ी फ़ाइलों में आपके डिवाइस के अनुसार कुछ समय लग सकता है।

क्या मेरी PDF कहीं अपलोड होती है?

नहीं। सारा विभाजन पूरी तरह आपके ब्राउज़र में होता है। आपकी PDF कभी आपके डिवाइस से बाहर नहीं जाती, जिससे पूर्ण गोपनीयता और सुरक्षा सुनिश्चित होती है।

क्या मैं पृष्ठों को अलग क्रम में निकाल सकता/सकती हूँ?

हाँ। कस्टम रेंज मोड में, किसी भी क्रम में पृष्ठ संख्या दर्ज करें: उदाहरण के लिए, "5, 3, 1" पृष्ठ 5, 3 और 1 को उसी क्रम में रखते हुए एक PDF बनाएगा।

PDF फ़ॉर्म और एनोटेशन का क्या होता है?

टेक्स्ट और लेआउट सुरक्षित रहते हैं, लेकिन इंटरैक्टिव फ़ॉर्म शायद न जाएँ। विभाजन के दौरान एनोटेशन आमतौर पर सुरक्षित रहते हैं।

«विभाजित» के चार अर्थ

PDF संदर्भ में «विभाजित» क्रिया कम से कम चार अलग-अलग संक्रियाओं को घेरती है, और एक ही UI शब्द को इस्तेमाल करने वाले औज़ार बहुत भिन्न आउटपुट देते हैं। फटना (Burst) PDF को N एकल-पन्ने वाले PDF में तोड़ देता है, प्रति पन्ना एक, प्रत्येक का नाम पन्ने की संख्या से। श्रेणी से निष्कर्षण एक या अधिक पन्ना-श्रेणियाँ चुनता है (जैसे पन्ने 1-10 और 25-40) और हर श्रेणी के लिए एक PDF बनाता है। बुकमार्क-आधारित अध्याय-विभाजन दस्तावेज़ के आउटलाइन-वृक्ष को पढ़ता है, हर शीर्ष-स्तरीय बुकमार्क के पन्ना-दायरे खोजता है, और प्रति अध्याय एक PDF बनाता है। स्वनिर्धारित चयन पन्नों का एक मनमाना उपसमुच्चय लेता है, संभवतः क्रम-अनिश्चित, और उन्हें एक ही संयुक्त PDF में रखता है।

यह औज़ार श्रेणी-आधारित निष्कर्षण लागू करता है। उपयोगकर्ता पन्ना-श्रेणियाँ निर्दिष्ट करता है, औज़ार हर श्रेणी के लिए एक आउटपुट PDF बनाता है, और मूल फ़ाइल कभी संशोधित नहीं होती। हर पन्ने को उसकी अपनी एक-पन्ना श्रेणी कह कर «फटना» पाया जा सकता है, परंतु इंटरफ़ेस श्रेणी-कार्य के लिए अनुकूलित है, क्योंकि असली दुनिया में वही अधिक प्रचलित है। स्वनिर्धारित चयन (एक ही फ़ाइल के भीतर पन्नों का मनमाना पुनःक्रमण) मुफ्त PDF पेज संपादक ऑनलाइन औज़ार का काम है; बुकमार्क से अध्याय-विभाजन यहाँ अभी समर्थित नहीं, और नीचे का पाठ इसे ईमानदारी से बताता है।

विभाजन का संक्षिप्त इतिहास

विभाजन प्रारूप के तौर पर PDF से लगभग एक दशक पुराना है। डॉक्यूमेंट-इमेजिंग विक्रेता 1980 के दशक के अंत में ही मल्टी-पेज TIFF और PostScript फ़ाइलों से पन्ना-दायरे निकाल रहे थे, और हल करने वाली बुनियादी समस्या वही थी: चुने हुए पन्नों की दृश्य सामग्री को नए कंटेनर में नक़ल करो, बिना उन क्रॉस-रेफ़रेंस को तोड़े जो उस दृश्य सामग्री को अपने संसाधनों से जोड़ते हैं। PDF ने 1993 में आते समय वही समस्या और उस पुराने काम का अधिकांश एल्गोरिथमिक तंत्र वारिस के रूप में पाया।

2000 के दशक की शुरुआत में PDF के लिए मानक कमांड-लाइन औज़ार था pdftk, जिसे 2002 में Sid Steward ने Java में लिखा था। pdftk में स्पष्ट विभाजन, संयोजन, घूर्णन और वाटरमार्क संक्रियाएँ थीं, सब PDF को ऑब्जेक्ट-मॉडल में पार्स करके फिर प्रासंगिक उपग्राफ़ को दोबारा निकाल कर लागू की गई थीं। 2008 में Jay Berkenbilt द्वारा शुरू किया गया qpdf आधुनिक ओपन-सोर्स मानक बना, उन्हीं संक्रियाओं को C++ लाइब्रेरी के माध्यम से उजागर करता है जिसका दुनिया भर के पैकेज मैनेजर उपयोग करते हैं। ISO 32000-1 (2008) ने विभाजन-विशिष्ट आदिम जोड़े नहीं, क्योंकि मौजूदा रचनाएँ ही पर्याप्त थीं; विभाजन शुद्ध रूप से रचनाकर्ता-पक्ष की संक्रिया है जो उन्हीं इमारती ब्लॉकों से एक छोटी, मान्य PDF देती है।

विभाजन असल में कैसे होता है

इस औज़ार में विभाजन-संक्रिया pdf-lib के भीतर तीन निश्चित पास चलाती है। पहला: स्रोत PDF की क्रॉस-रेफ़रेंस तालिका पढ़ी जाती है और प्रत्येक अप्रत्यक्ष ऑब्जेक्ट को मेमरी-मॉडल में पार्स किया जाता है। दूसरा: हर अनुरोधित आउटपुट-श्रेणी के लिए, औज़ार एक खाली गंतव्य दस्तावेज़ बनाता है, उस श्रेणी की पन्ना-इंडेक्स के साथ copyPages को बुलाता है, हर चुने पन्ने के संसाधन-ग्राफ़ (फ़ॉन्ट, छवियाँ, फ़ॉर्म XObject, ग्राफ़िक्स-स्थिति शब्दकोश, पैटर्न, रंग-स्थान) पर चलकर सभी सकर्मक रूप से संदर्भित ऑब्जेक्ट गंतव्य की संख्या-स्पेस में नक़ल करता है, और नक़ल हुए पन्ने गंतव्य के पन्ना-वृक्ष में क्रम में जोड़ता है।

तीसरा: हर गंतव्य को बाइट्स में क्रमित करके डाउनलोड के रूप में जारी किया जाता है। श्रेणी-दर-श्रेणी गंतव्य दस्तावेज़ इटरेशनों के बीच कचरा-संग्रह के लिए पात्र होते हैं, इसी कारण औज़ार उन PDF पर भी काम करता है जिनकी कुल पन्ना-संख्या एकसाथ मेमरी में नहीं समाती। पन्ना-नक़ल वही आदिम है जो PDF Merge औज़ार को चलाती है, बस उलटी दिशा में। दोनों संक्रियाएँ क्षयहीन हैं: नक़ल हुए पन्नों के पाठ, छवियाँ, सदिश-ग्राफ़िक्स और कंटेंट-स्ट्रीम गंतव्य में जस के तस लिखे जाते हैं, न ट्रांसकोडिंग होती है न रेस्टराइज़ेशन, और आउटपुट स्रोत के संगत पन्नों के साथ पिक्सेल-समान रेंडर होता है।

वे असली कार्य-प्रवाह जो विभाजन को चलाते हैं

आम पेंच और उनके चक्कर

विभाजित हिस्से मिलकर इनपुट से थोड़े बड़े क्यों होते हैं

हर आउटपुट PDF अपने आप में पूर्ण और मान्य PDF है: उसके पास अपनी कैटलॉग, अपनी पन्ना-वृक्ष, अपनी फ़ॉन्ट-मेटाडेटा और अपनी क्रॉस-रेफ़रेंस तालिका है। 10 MB की PDF को 10 एकल-पन्ने आउटपुट में बाँटने पर आम तौर पर कुल आकार थोड़ा 10 MB से अधिक होता है, क्योंकि इन 10 फ़ाइलों में से हर एक «आत्म-निहित दस्तावेज़ होने» का संरचनात्मक बोझ ढोती है। अनुभव-सिद्ध रूप से यह बोझ कुल का 1% से 5% के बीच रहता है, और आउटपुट फ़ाइलों की संख्या के साथ निरपेक्ष रूप से बढ़ता है। अधिकांश उपयोगों में यह नगण्य है; लेकिन जो बहुत बड़े दस्तावेज़ों को बहुत-बहुत छोटे टुकड़ों में बाँट रहे हैं, उनके लिए यह दिखाई देता है। जिनके लिए कुल आकार मायने रखता है, वे हर आउटपुट को मुफ्त ऑनलाइन PDF कम्प्रेस करें औज़ार से गुज़ार कर अधिकांश प्रति-फ़ाइल बोझ पुनः प्राप्त कर सकते हैं।

ब्राउज़र-केवल बनाम क्लाउड विभाजन

Google परिणामों पर हावी क्लाउड PDF विभाजक (Smallpdf, ILovePDF, PDF24 का वेब ऐप, Adobe Acrobat Online, Sejda का मुफ़्त स्तर) सब आपके स्रोत PDF को अपने सर्वर पर अपलोड करते हैं, वहाँ विभाजन करते हैं, और आउटपुट डाउनलोड के रूप में लौटाते हैं। उनकी गोपनीयता नीति कहती है कि अपलोड फ़ाइलें कुछ घंटों में हटा दी जाती हैं, पर वे फ़ाइलें ऑपरेटर के नेटवर्क से गुज़रती हैं, प्रसंस्करण-खिड़की भर उनकी डिस्क पर रहती हैं, और जो भी लॉग ऑपरेटर दुरुपयोग-पहचान के लिए रखता है, उससे होकर निकलती हैं।

यह औज़ार अपलोड नहीं करता। आपकी PDF मानक File API के ज़रिए ब्राउज़र टैब में पढ़ी जाती है, उसी टैब में pdf-lib पार्स करती है, और आउटपुट PDF मानक डाउनलोड API से आपकी डिस्क पर वापस लिखी जाती हैं। विभाजन के दौरान एकमात्र नेटवर्क ट्रैफ़िक यह है कि पन्ना पहली बार खुलने पर pdf-lib ख़ुद CDN से एक बार लोड हो जाए। आप इसे जाँच सकते हैं: ब्राउज़र के डेवलपर टूल का «Network» टैब खोलिए, एक विभाजन चलाइए, और देखिए कि कोई भी ऐसा अनुरोध नहीं चलता जो आपकी फ़ाइल का कंटेंट साथ ले जाए। गोपनीयता-गारंटी की क़ीमत है वे फ़ीचर जो हमारे पास नहीं हैं (बुकमार्क-आधारित विभाजन, संरचना-वृक्ष का संप्रसरण) जो बड़े सर्वर-साइड औज़ार देते हैं; समझौता ईमानदार है, और आप तय कर सकते हैं कि किसी ख़ास दस्तावेज़ के लिए कौन-सा पक्ष ज़्यादा मायने रखता है।

और अकसर पूछे जाने वाले प्रश्न

क्या मैं बुकमार्क या अध्याय के अनुसार विभाजन कर सकता हूँ?

अभी नहीं। यह औज़ार श्रेणी-आधारित विभाजन करता है: आप पन्ना-श्रेणियाँ चुनते हैं और यह हर श्रेणी के लिए एक आउटपुट देता है। बुकमार्क-आधारित विभाजन (जहाँ औज़ार दस्तावेज़ आउटलाइन पढ़ कर हर शीर्ष-स्तर बुकमार्क की पन्ना-श्रेणी को विभाजन-बिंदु मानता है) हम जोड़ने की योजना में है पर अभी आया नहीं है। फिलहाल का चक्कर: PDF को रीडर में खोलिए, दिखाई दे रहे आउटलाइन से अध्यायों के आरंभ-पन्ने नोट कर लीजिए, और वही श्रेणियाँ हाथ से दर्ज कर दीजिए। गहरे आउटलाइन वाले दस्तावेज़ों के लिए, Smallpdf या Adobe Acrobat Online जैसा सर्वर-साइड औज़ार आपको यह खोज-चरण बचा सकता है।

मेरे विभाजित फ़ाइलें मिलकर मूल से थोड़ी बड़ी क्यों हैं?

हर आउटपुट PDF आत्म-निहित दस्तावेज़ होने का संरचनात्मक बोझ ढोता है (कैटलॉग, पन्ना-वृक्ष, क्रॉस-रेफ़रेंस तालिका, फ़ॉन्ट-मेटाडेटा)। 10 MB की एक फ़ाइल को 10 एकल-पन्ने आउटपुट में बाँटने पर मिले कुल आकार में इनपुट से कुछ प्रतिशत की वृद्धि होती है। यह बोझ आम तौर पर 1% से 5% के बीच रहता है; आउटपुट संख्या के साथ निरपेक्ष रूप से बढ़ता है। यदि कुल आकार मायने रखता है, हर आउटपुट को PDF Compress औज़ार से गुज़ार दीजिए, अधिकांश प्रति-फ़ाइल बोझ वापस मिल जाएगा।

क्या विभाजन मेरे बुकमार्क और टैग की हुई सुगम्यता बनाए रखेगा?

अभी नहीं। आउटलाइन-वृक्ष और PDF/UA-1 संरचना-वृक्ष दोनों दस्तावेज़-स्तर के ऑब्जेक्ट हैं। यह औज़ार जिस pdf-lib copyPages संक्रिया का उपयोग करता है, वह उन्हें अभी आउटपुट में नहीं भेजती। जहाँ बुकमार्क और टैग-संरक्षण ज़रूरी है (सार्वजनिक-क्षेत्र प्रकाशन, सुगम दस्तावेज़ वितरण), वहाँ आज Adobe Acrobat Online उपयुक्त औज़ार है। अधिकांश विभाजनों के लिए यह क्षति स्वीकार्य है; कुछ के लिए नहीं, और हम यह दिखावा नहीं करना चाहते कि सब ठीक है।

क्या मैं एन्क्रिप्टेड या पासवर्ड-सुरक्षित PDF को विभाजित कर सकता हूँ?

सीधे नहीं। खुले-पासवर्ड वाले PDF को पासवर्ड दिए बिना पार्स नहीं किया जा सकता, और pdf-lib एन्क्रिप्टेड इनपुट का समर्थन नहीं करती। प्रवाह: पहले PDF Unlock औज़ार से पासवर्ड हटाएँ, यहाँ अनलॉक प्रति को विभाजित करें, और विकल्पतः PDF Protect औज़ार से हर आउटपुट पर सुरक्षा फिर लगा दें। विभाजित प्रतियाँ मूल हस्ताक्षरित-और-एन्क्रिप्टेड वाले से भिन्न दस्तावेज़ हैं, अतः हस्ताक्षर-वैधता और एक्सेस-नियंत्रण इस आने-जाने में संरक्षित नहीं रहते।

आउटपुट फ़ाइलों के नाम का नियम क्या है?

आउटपुट नाम स्रोत PDF के मूल-नाम और श्रेणी-दर्शाने वाले प्रत्यय से बनते हैं। annual-report.pdf नामक स्रोत को 1-5 और 6-30 में विभाजित करने पर annual-report_pages_1-5.pdf और annual-report_pages_6-30.pdf बनेंगी। एकल-पन्ना निष्कर्षण को _page_7.pdf जैसा प्रत्यय मिलता है। नाम-प्रक्रिया निर्धारक है, इसलिए बैच कार्य-प्रवाह श्रेणी-विवरण से आउटपुट नामों की पहले से भविष्यवाणी कर सकते हैं। ब्राउज़र का «इस रूप में सहेजें» संवाद तय करता है कि हर फ़ाइल कहाँ उतरेगी; अधिकांश आधुनिक ब्राउज़र हर टैब के लिए डाउनलोड-फ़ोल्डर का तरजीही विकल्प देते हैं और हर आउटपुट के लिए वही उपयोग करते हैं।

संबंधित उपकरण