मुफ़्त ऑनलाइन PDF से Word कन्वर्ज़न
अपनी PDF फ़ाइलों को तुरंत संपादन योग्य Word DOCX दस्तावेज़ों में कनवर्ट करें। एक दस्तावेज़ बनाने के लिए टेक्स्ट सामग्री निकालें जिसे आप संपादित कर सकें।
PDF का समर्थन · 50 MB तक
रूपांतरण पूर्ण
आपका Word दस्तावेज़ डाउनलोड के लिए तैयार है।
यह कैसे काम करता है
- PDF अपलोड करें: Word में बदलने के लिए एक एकल PDF फ़ाइल छोड़ें या चुनें।
- विकल्प कॉन्फ़िगर करें: फ़ॉन्ट, पेज ब्रेक और पेज नंबर सेटिंग्स चुनें।
- Word में बदलें: PDF को प्रोसेस करने और पाठ निकालने के लिए “Word में बदलें” पर क्लिक करें।
- DOCX डाउनलोड करें: अपना रूपांतरित Word दस्तावेज़ डाउनलोड करें और आवश्यकतानुसार उसे संपादित करें।
PDF को Word में क्यों बदलें?
PDF फ़ाइलों को Word दस्तावेज़ों में बदलना आपको एक संपादन योग्य प्रारूप देता है जिसे आप आसानी से संशोधित, फ़ॉर्मेट और पुन: उपयोग कर सकते हैं। Word दस्तावेज़ PDFs से अधिक लचीले होते हैं, जिससे आप टिप्पणियाँ जोड़ सकते हैं, फ़ॉन्ट बदल सकते हैं, सामग्री को पुनः व्यवस्थित कर सकते हैं, या पाठ को बड़े दस्तावेज़ों में शामिल कर सकते हैं। यह अनुबंधों, रिपोर्टों, शोध पत्रों और किसी भी दस्तावेज़ के लिए विशेष रूप से उपयोगी है जिसे आपको संपादित या अनुकूलित करने की आवश्यकता है।
विशेषताएँ
- पूर्ण पाठ निष्कर्षण: अपने PDF के हर पृष्ठ से सभी पाठ सामग्री निकालें।
- पेज ब्रेक: उचित दस्तावेज़ संरचना के लिए PDF पृष्ठों के बीच स्वचालित रूप से पेज ब्रेक जोड़ें।
- फ़ॉन्ट चयन: आउटपुट Word दस्तावेज़ के लिए अपना पसंदीदा फ़ॉन्ट चुनें।
- पृष्ठ संख्या: वैकल्पिक रूप से दस्तावेज़ में टिप्पणियों के रूप में पृष्ठ संख्या संदर्भ शामिल करें।
- संपादन योग्य आउटपुट: परिणामी DOCX फ़ाइल Word, Google Docs, LibreOffice और अन्य अनुप्रयोगों में पूरी तरह से संपादन योग्य है।
- आँकड़े: निकाली गई सामग्री की पृष्ठ गिनती, वर्ण गिनती और शब्द गिनती देखें।
- गोपनीयता: सभी प्रसंस्करण आपके ब्राउज़र में स्थानीय रूप से होता है। फ़ाइलें कभी भी किसी सर्वर पर अपलोड नहीं होतीं।
- तेज़ रूपांतरण: बिना प्रतीक्षा या कतारों के त्वरित प्रसंस्करण।
अक्सर पूछे जाने वाले प्रश्न
क्या यह मूल PDF लेआउट को संरक्षित रखता है?
यह टूल पाठ सामग्री निकालता है और एक बुनियादी Word दस्तावेज़ बनाता है। मूल PDF से जटिल लेआउट, कॉलम, छवियाँ और फ़ॉर्मेटिंग पूरी तरह से संरक्षित नहीं हो सकती हैं। जिन दस्तावेज़ों के लिए लेआउट महत्वपूर्ण है, आप रूपांतरण के बाद Word दस्तावेज़ को मैन्युअल रूप से समायोजित करना चाह सकते हैं।
क्या मैं रूपांतरित Word दस्तावेज़ संपादित कर सकता हूँ?
हाँ। आउटपुट DOCX फ़ाइल Microsoft Word, Google Docs, LibreOffice और अन्य संगत अनुप्रयोगों में पूरी तरह से संपादन योग्य है। आप कोई भी पाठ जोड़, हटा या संशोधित कर सकते हैं, और अपनी अपनी फ़ॉर्मेटिंग लागू कर सकते हैं।
PDF में छवियों और ग्राफ़िक्स का क्या?
यह टूल केवल पाठ सामग्री निकालता है। PDF में छवियाँ, ग्राफ़िक्स और आरेख रूपांतरित Word दस्तावेज़ में शामिल नहीं हैं। महत्वपूर्ण विज़ुअल सामग्री वाले दस्तावेज़ों के लिए, आपको मैन्युअल रूप से Word फ़ाइल में छवियाँ वापस जोड़नी पड़ सकती हैं।
क्या मैं स्कैन किए गए PDFs को बदल सकता हूँ?
नहीं। यह टूल एसे PDFs के साथ काम करता है जिनमें चयन योग्य पाठ हो। स्कैन किए गए PDFs (छवि आधारित PDFs) में निकालने योग्य पाठ नहीं होता है और इसके लिए OCR (ऑप्टिकल कैरेक्टर रिकग्निशन) की आवश्यकता होगी। स्कैन किए गए दस्तावेज़ों से पाठ निकालने के लिए पहले OCR टूल का उपयोग करें।
फ़ाइल आकार की सीमा क्या है?
50 MB तक की फ़ाइलें समर्थित हैं। बड़ी फ़ाइलें आपके ब्राउज़र की उपलब्ध मेमोरी पर निर्भर करती हैं, लेकिन रूपांतरण धीमा होगा।
क्या मैं पासवर्ड-सुरक्षित PDFs को बदल सकता हूँ?
हाँ, यदि PDF एक उपयोगकर्ता पासवर्ड (न कि स्वामी पासवर्ड) से सुरक्षित है। आपको पहले किसी अन्य टूल का उपयोग करके पासवर्ड हटाना होगा, फिर इस टूल से रूपांतरित करना होगा।
क्या मेरा PDF सर्वर पर अपलोड होता है?
नहीं. सारी कनवर्ज़न PDF.js और docx लाइब्रेरी का उपयोग करके आपके ब्राउज़र में स्थानीय रूप से होती है। आपका PDF कभी आपके डिवाइस से बाहर नहीं जाता, जिससे पूर्ण गोपनीयता और सुरक्षा सुनिश्चित होती है।
क्या मैं मोबाइल उपकरणों पर रूपांतरित कर सकता हूँ?
हाँ। यह टूल डेस्कटॉप, टैबलेट और मोबाइल ब्राउज़रों पर काम करता है। PDF फ़ाइल चुनने के लिए टैप करें और रूपांतरण आपके उपकरण पर प्रोसेस होगा।
PDF से Word कन्वर्टर क्या है?
PDF से Word कन्वर्टर एक PDF फ़ाइल लेता है और एक Microsoft Word DOCX फ़ाइल बनाता है जिसमें वही टेक्स्ट सामग्री इस तरह व्यवस्थित होती है कि आप इसे Word, Google Docs, LibreOffice या किसी भी DOCX-संगत एप्लिकेशन में संपादित कर सकें। आउटपुट एक बिल्कुल नया संपादन योग्य दस्तावेज़ है; मूल PDF आपकी डिस्क पर अछूता रहता है। Word फ़ाइल पैराग्राफ़ और स्वरूपित टेक्स्ट के रन में संरचित है, जो PDF के पॉज़िशन्ड ग्लिफ़्स की सपाट स्ट्रीम से मौलिक रूप से भिन्न है।
PDF को 1993 में अंतिम-स्वरूप फ़ाइल के रूप में डिज़ाइन किया गया था, संपादन के बजाय वफादार प्रदर्शन और मुद्रण के लिए अनुकूलित। Word दस्तावेज़ इसके विपरीत हैं: संरचित, संपादन योग्य, और प्रवाह के लिए निर्मित। उनके बीच कनवर्ट करना इसलिए मूल-इरादे-का-अनुमान-लगाने की समस्या है न कि यांत्रिक अनुवाद। कन्वर्टर PDF की सामग्री स्ट्रीम को पार करता है, ग्लिफ़्स को शब्दों और पंक्तियों में समूहित करता है, और पैराग्राफ़ ब्रेक और फ़ॉन्ट रन को पुनर्निर्मित करने की कोशिश करता है। सीधी गद्य के लिए यह अच्छा काम करता है; तालिकाओं, स्तंभों और जटिल लेआउट के लिए पुनर्निर्माण परिभाषा के अनुसार अपूर्ण है।
यह टूल pdf.js (Mozilla का JavaScript PDF रेंडरर) का उपयोग प्रत्येक पृष्ठ को पढ़ने के लिए और docx.js का उपयोग आउटपुट Word फ़ाइल बनाने के लिए करता है, दोनों पूरी तरह से आपके ब्राउज़र में चलते हैं। आपके द्वारा अपलोड की गई फ़ाइल कभी आपका डिवाइस नहीं छोड़ती। आउटपुट DOCX को Word, Google Docs, Pages, LibreOffice और हर अन्य आधुनिक वर्ड प्रोसेसर में खोला जा सकता है। रूपांतरण टेक्स्ट सामग्री और बुनियादी पैराग्राफ़ संरचना पर केंद्रित है; तालिकाओं, एम्बेडेड छवियों और जटिल मल्टी-कॉलम लेआउट को रूपांतरण के बाद मैन्युअल सफाई की आवश्यकता हो सकती है।
टूल के अंदर क्या है
शीर्ष पर एक ड्रॉप ज़ोन आपकी PDF फ़ाइल स्वीकार करता है। 50 MB सीमा एक आरामदायक ब्राउज़र-मेमोरी सीमा है; pdf.js बड़ी फ़ाइलें संभालता है लेकिन बहुत लंबे दस्तावेज़ों का रूपांतरण काफी धीमा हो जाता है। अपलोड के बाद, एक जानकारी पैनल फ़ाइल नाम, पृष्ठ गणना और फ़ाइल आकार दिखाता है ताकि आप पुष्टि कर सकें कि सही दस्तावेज़ कतार में है। मेस करने के लिए कोई अतिरिक्त विकल्प नहीं हैं; रूपांतरण एक-क्लिक है।
Convert to Word पर क्लिक करें और टूल PDF के हर पृष्ठ के माध्यम से चलता है, pdf.js का उपयोग करके टेक्स्ट सामग्री निकालता है, टेक्स्ट को पैराग्राफ़ द्वारा समूहित करता है (लंबवत अंतर और फ़ॉन्ट परिवर्तनों को पैराग्राफ़-ब्रेक हिज़्म के रूप में उपयोग करते हुए), और docx.js का उपयोग करके एक Word दस्तावेज़ इकट्ठा करता है। प्रगति बार दिखाता है कि कौन सा पृष्ठ संसाधित किया जा रहा है। एक विशिष्ट 10 से 20 पृष्ठ का दस्तावेज़ कुछ सेकंड में परिवर्तित होता है; एक 200 पृष्ठ का दस्तावेज़ आपकी मशीन के आधार पर एक या दो मिनट लेता है।
जब रूपांतरण पूरा होता है, एक डाउनलोड बटन दिखाई देता है। डाउनलोड की गई DOCX फ़ाइल आपके डिफ़ॉल्ट डाउनलोड फ़ोल्डर में जाती है और सीधे Microsoft Word, Google Docs (खींचें या अपलोड करें), LibreOffice Writer, Apple Pages, और किसी भी अन्य DOCX-संगत एडिटर में खुलती है। आउटपुट Word दस्तावेज़ का फ़ाइल आकार आमतौर पर मूल PDF से छोटा होता है क्योंकि Word प्रारूप टेक्स्ट-भारी सामग्री के लिए अधिक कॉम्पैक्ट है।
इतिहास और पृष्ठभूमि
विरोधी डिज़ाइन दर्शन के रूप में PDF और Word (1983 बनाम 1993)
Microsoft Word for MS-DOS 1983 में और Macintosh के लिए 1985 में जारी किया गया था, .doc बाइनरी प्रारूप कार्यालय संपादन मानक बन गया। PDF (Acrobat 1.0) एक दशक बाद 1993 में विपरीत डिज़ाइन लक्ष्य के साथ आया: एक पोर्टेबल केवल-पढ़ने वाला अंतिम रूप, संपादन प्रारूप नहीं। Word दस्तावेज़ टाइप करते समय प्रवाहित और पुन: स्वरूपित होते हैं; PDFs पॉज़िशन्ड ग्लिफ़्स के जमे हुए पृष्ठ हैं। वही डिज़ाइन विकल्प जो PDFs को मुद्रण के लिए महान बनाते हैं उन्हें संपादन के लिए शत्रुतापूर्ण बनाते हैं, जो PDF-से-Word रूपांतरण को एक स्वाभाविक रूप से हानिपूर्ण समस्या बनाता है।
Acrobat 6 Save As Word को शिप करता है (2003)
Adobe Acrobat 6 (मई 2003 में जारी) पहला व्यापक रूप से उपयोग किया जाने वाला टूल था जो PDF-से-Word रूपांतरण को बिल्ट-इन प्रदान करता था। Acrobat Professional में Save As Word Document सुविधा निकाले जा सकने वाले टेक्स्ट के साथ किसी भी PDF से .doc फ़ाइल का उत्पादन कर सकती थी। रूपांतरण अपूर्ण था (Acrobat ने स्वयं लेआउट पुनर्निर्माण के बारे में लंबे अस्वीकरण प्रकाशित किए) लेकिन इसने उपयोगकर्ता अपेक्षा स्थापित की कि PDFs एक क्लिक में Word दस्तावेज़ बन सकते हैं। बाद के संस्करणों ने गुणवत्ता में सुधार किया, विशेष रूप से Acrobat 9 (2008) में तालिका पुनर्निर्माण के लिए।
Solid Documents और विशेष कन्वर्टर (2007)
Solid Documents ने 2007 में Solid PDF to Word जारी किया और जल्दी ही डेस्कटॉप PDF-से-Word रूपांतरण के लिए स्वर्ण मानक बन गया, विशेष रूप से जटिल तालिकाओं और मल्टी-कॉलम लेआउट वाले दस्तावेज़ों के लिए। कंपनी ने Foxit और Nitro PDF सहित अन्य विक्रेताओं को अपना रूपांतरण इंजन लाइसेंस दिया। विशेष कन्वर्टर ने लेआउट-जागरूक हिज़्म का उपयोग किया: तालिका सीमाओं का पता लगाना, स्तंभ प्रवाह को पहचानना, फ़ॉन्ट रन को कैरेक्टर स्वरूपण के रूप में संरक्षित करना। उनकी कीमत पैसा थी लेकिन उन्होंने उन दस्तावेज़ों के लिए Acrobat या जेनेरिक वेब कन्वर्टर्स की तुलना में स्पष्ट रूप से बेहतर आउटपुट का उत्पादन किया जहाँ लेआउट पुनर्निर्माण मायने रखता था।
Microsoft Word सीधे PDFs खोलता है (2013)
Word 2013 (जनवरी 2013 में जारी) ने File > Open के साथ सीधे PDF खोलने की क्षमता जोड़ी। Word आंतरिक PDF-से-Word रूपांतरण करता था (Microsoft इसे PDF Reflow कहता है) और परिणाम को संपादन योग्य दस्तावेज़ के रूप में प्रस्तुत करता था। यह एक प्रमुख प्रयोज्यता सुधार था: अलग कन्वर्टर की आवश्यकता नहीं। गुणवत्ता दस्तावेज़ के अनुसार भिन्न होती है, हर दूसरे कन्वर्टर की तरह। टेक्स्ट-भारी PDFs के लिए परिणाम आमतौर पर अच्छा होता है; डिज़ाइन-भारी PDFs के लिए Word उपयोगकर्ता को चेतावनी देता है कि पुनर्निर्माण मूल से मेल नहीं खा सकता।
वेब कन्वर्टर और SaaS लहर (2013 के बाद से)
Smallpdf (2013), iLovePDF (2014) और PDF24 (पुराना लेकिन विस्तारित वेब सेवा) ने ब्राउज़र-आधारित PDF-से-Word को मुफ्त और सुलभ बनाया। उनके मॉडल को प्रसंस्करण के लिए विक्रेता के सर्वर पर PDF अपलोड करने की आवश्यकता थी, जिसने गोपनीय दस्तावेज़ों के लिए गोपनीयता चिंताओं को उठाया। सुविधा ने बड़े पैमाने पर अपनाने को प्रेरित किया: 2020 तक, ये सेवाएँ सामूहिक रूप से प्रति वर्ष अरबों रूपांतरण संसाधित करती थीं। व्यापार-बंद (सुविधा के लिए गोपनीयता) ठीक वही है जिसे इस तरह के क्लाइंट-साइड ब्राउज़र टूल संबोधित करते हैं।
क्लाइंट-साइड रूपांतरण व्यवहार्य हो जाता है (2019 के बाद से)
जैसे-जैसे pdf.js और docx.js परिपक्व हुए, ब्राउज़र में पूरी तरह से क्लाइंट-साइड PDF-से-Word रूपांतरण व्यावहारिक हो गया। उपयोगकर्ता कुछ भी अपलोड नहीं करता; रूपांतरण उपयोगकर्ता की मशीन पर JavaScript में होता है। यह वह मार्ग है जिसका यह टूल अनुसरण करता है। आउटपुट गुणवत्ता टेक्स्ट-भारी दस्तावेज़ों के लिए विशिष्ट वेब कन्वर्टर्स के बराबर है; लेआउट-भारी दस्तावेज़ों के लिए, डेस्कटॉप विशेषज्ञ (Solid PDF to Word, Acrobat Pro) अभी भी कुछ बेहतर पुनर्निर्माण उत्पन्न करते हैं, लेकिन गोपनीयता व्यापार-बंद किसी भी गोपनीय दस्तावेज़ के लिए ब्राउज़र-आधारित रूपांतरण का समर्थन करता है।
व्यावहारिक वर्कफ़्लो
एक PDF संपादित करना जिसका स्रोत आपके पास नहीं है
एक विक्रेता आपको Word स्रोत के बिना PDF के रूप में एक सेवा अनुबंध भेजता है। आपको अपनी कानूनी टीम की समीक्षा के लिए ट्रैक किए गए परिवर्तन करने की आवश्यकता है। Word में परिवर्तित करें, Word या Google Docs में ट्रैक चेंजेस के साथ संपादित करें, विक्रेता को वापस साझा करें। पुनर्निर्माण को त्वरित लेआउट सफाई की आवश्यकता हो सकती है लेकिन टेक्स्ट संपादन योग्य है और आपके सहयोगी परिचित समीक्षा उपकरणों का उपयोग कर सकते हैं। यह PDF को Word में परिवर्तित करने का सबसे आम कारण है।
पुराने PDFs को संपादन योग्य संग्रह में स्थानांतरित करना
कई संगठनों के पास दशकों पुराने हज़ारों PDFs हैं जहाँ Word स्रोत खो गया है या हटा दिया गया है। जब किसी दस्तावेज़ को अद्यतन करने की आवश्यकता होती है (नई नीति, नया वित्तीय वर्ष, नई ब्रांडिंग), तो Word में वापस परिवर्तित करना पहला कदम है। आउटपुट शायद ही कभी पिक्सेल-परफेक्ट होता है लेकिन यह आपको पुनर्निर्माण के लिए संपादन योग्य टेक्स्ट देता है। पुन: प्रकाशित होने वाले दस्तावेज़ों के लिए Word में मैन्युअल लेआउट सफाई के साथ जोड़ी बनाएँ।
एक PDF को दूसरी भाषा में अनुवाद करना
अनुवाद टूल (Google Translate Documents, DeepL, SDL Trados जैसे पेशेवर अनुवाद मेमोरी टूल) PDFs की तुलना में Word दस्तावेज़ों के साथ बहुत बेहतर काम करते हैं। पहले Word में परिवर्तित करें, फिर अनुवाद चलाएं, फिर अनुवाद की समीक्षा के बाद वैकल्पिक रूप से PDF में पुन: निर्यात करें। Word प्रारूप अनुवादक को परिवर्तनों को ट्रैक करने और टिप्पणियाँ जोड़ने की भी अनुमति देता है, जो किसी भी समीक्षा चक्र के लिए महत्वपूर्ण है।
नए दस्तावेज़ के लिए सामग्री निकालना और पुन: स्वरूपित करना
आप एक नए प्रस्तुति या मेमो में PDF रिपोर्ट के एक अनुभाग का उपयोग करना चाहते हैं। Word में परिवर्तित करें, प्रासंगिक पैराग्राफ़ कॉपी करें (अब ठीक से संपादन योग्य टेक्स्ट), नए दस्तावेज़ में पेस्ट करें, और अपनी लक्षित शैली में पुन: स्वरूपित करें। यह PDF रीडर से सीधे कॉपी करने से तेज़ है, जो अक्सर टूटे हुए लाइन ब्रेक और खोई हुई स्वरूपण को पेश करता है।
एक प्रकाशित फ़ॉर्म या टेम्पलेट को अद्यतन करना
एक पुराने PDF फ़ॉर्म (इंटेक फ़ॉर्म, खर्च रिपोर्ट टेम्पलेट, आवेदन फ़ॉर्म) को नए फ़ील्ड, अद्यतन ब्रांडिंग, या संशोधित शब्द की आवश्यकता है। Word में परिवर्तित करें, उचित फ़ॉर्म फ़ील्ड के साथ Word में संपादित करें (Word में डेवलपर टैब, या Google Forms समकक्ष का उपयोग करें), फिर PDF के रूप में पुन: निर्यात करें या Word के रूप में वितरित करें। यह सरल फ़ॉर्म के लिए सबसे अच्छा काम करता है; गणना के साथ जटिल AcroForms को PDF फ़ॉर्म एडिटर में संपादित किया जाना चाहिए।
PDF तालिका से डेटा खींचना
एक वित्तीय रिपोर्ट में एक तालिका शामिल है जिसकी आपको विश्लेषण के लिए आवश्यकता है। PDF को Word में परिवर्तित करें, तालिका को Excel में कॉपी करें, उन सेल्स को साफ़ करें जो रूपांतरण के दौरान टूट गए। तालिकाओं के लिए यह आमतौर पर एक प्रारंभिक बिंदु है न कि एक तैयार परिणाम; जटिल तालिकाओं को मैन्युअल सफाई की आवश्यकता होती है। शुद्ध डेटा निष्कर्षण के लिए (स्वरूपण को संरक्षित करने की आवश्यकता नहीं), Python में pdfplumber या tabula-py अक्सर Word के माध्यम से जाने से अधिक स्वच्छ परिणाम देते हैं।
सामान्य त्रुटियाँ
तालिकाएँ अक्सर अलग टेक्स्ट बॉक्स में टूट जाती हैं
एक PDF तालिका को विशिष्ट x/y पदों पर टेक्स्ट टुकड़ों के ग्रिड के रूप में रेंडर किया जाता है; अधिकांश PDFs में कोई अंतर्निहित तालिका संरचना नहीं होती। कन्वर्टर को अनुमान लगाना होता है कि तालिका सीमाएँ कहाँ हैं, जो लगता है उससे कठिन है। अधिकांश कन्वर्टर्स तालिकाओं को टेक्स्ट बॉक्स की श्रृंखला या टैब्स के साथ पैराग्राफ़ रन के रूप में उत्पन्न करते हैं, उचित Word तालिकाओं के रूप में नहीं। समाधान रूपांतरण के बाद Word में मैन्युअल रूप से तालिका को फिर से बनाना है, या यदि आपको केवल मानों की आवश्यकता है तो डेटा को साफ़ करने के लिए Excel का उपयोग करना है।
मल्टी-कॉलम लेआउट बिखर जाते हैं
अकादमिक पेपर, पत्रिकाएँ और समाचार पत्र आमतौर पर प्रति पृष्ठ दो या तीन कॉलम का उपयोग करते हैं। कन्वर्टर प्रत्येक कॉलम को x/y स्थिति द्वारा ग्लिफ़ की धारा के रूप में देखता है और बाएँ और दाएँ कॉलम को एकल पैराग्राफ़ प्रवाह में इंटरलीव कर सकता है। परिणाम इस तरह पढ़ा जाता है: बाएँ कॉलम की पहली पंक्ति, दाएँ कॉलम की पहली पंक्ति, बाएँ कॉलम की दूसरी पंक्ति, और इसी तरह। मल्टी-कॉलम PDFs के लिए, इसके बजाय मैन्युअल रूप से कॉलम दर कॉलम कॉपी करें, या एक लेआउट-जागरूक Python लाइब्रेरी जैसे pdfplumber का उपयोग करें जो कॉलम सीमाओं का सम्मान करती है।
फ़ॉन्ट प्रतिस्थापित किए जाते हैं
PDF विशिष्ट फ़ॉन्ट (कभी-कभी अस्पष्ट या कस्टम) को विशिष्ट पॉइंट आकार पर एम्बेड करता है। Word उन्हें आपके सिस्टम पर उपलब्ध निकटतम फ़ॉन्ट के साथ प्रतिस्थापित करता है। परिणाम विभिन्न टाइपोग्राफी के साथ वही सामग्री है, जो सावधानीपूर्वक डिज़ाइन किए गए दस्तावेज़ों को तोड़ सकती है। यदि आपके आउटपुट दस्तावेज़ को PDF से दृश्यतः मेल खाना है, तो रूपांतरण के बाद Word में मैन्युअल रूप से इच्छित फ़ॉन्ट को फिर से लागू करें (या एक कन्वर्टर का उपयोग करें जो स्पष्ट रूप से एम्बेडेड फ़ॉन्ट को संरक्षित करता है)।
फ़ॉर्म फ़ील्ड अनुवादित नहीं होते
PDF इंटरैक्टिव फ़ॉर्म (AcroForms या XFA फ़ॉर्म) फ़ील्ड मानों को स्थिर पृष्ठ सामग्री से अलग संग्रहीत करते हैं। कन्वर्टर केवल स्थिर पृष्ठ टेक्स्ट देखता है, इसलिए फ़ॉर्म मान रूपांतरण में खो जाते हैं। यदि आपको एक भरा हुआ PDF फ़ॉर्म परिवर्तित करने और मानों को रखने की आवश्यकता है, तो पहले फ़ॉर्म-जागरूक टूल (pdftk, Adobe Acrobat डेटा निर्यात करें, या Python pdfplumber के form-field API) के साथ उन्हें निकालें, फिर उन्हें मैन्युअल रूप से Word दस्तावेज़ में मर्ज करें।
गणितीय समीकरण उलझे हुए निकलते हैं
गणित विशेष प्रतीक फ़ॉन्ट (Computer Modern, STIX) से व्यक्तिगत ग्लिफ़्स का उपयोग करके स्थापित होती है। कन्वर्टर ग्लिफ़्स पढ़ता है लेकिन स्थानिक संबंधों को खो देता है जो x वर्ग को x गुणा 2 से अलग बनाते हैं। इनलाइन समीकरण उलझे प्रतीक अनुक्रमों के रूप में निकलते हैं; डिस्प्ले समीकरण वर्णों के असंबंधित रन के रूप में। गणित-भारी PDFs के लिए, एक विशेषज्ञ गणित-जागरूक टूल (MathPix snip) का उपयोग करें, या Word दस्तावेज़ में दृश्य समावेश के लिए समीकरणों को छवियों के रूप में निकालें।
स्कैन किए गए PDFs खाली Word दस्तावेज़ उत्पन्न करते हैं
यदि एक PDF स्कैन से बनाया गया था, तो इसमें पृष्ठ की एक छवि होती है, निकाला जा सकने वाला टेक्स्ट नहीं। कन्वर्टर सामग्री स्ट्रीम के माध्यम से चलता है, कोई टेक्स्ट ऑपरेटर नहीं पाता, और एक खाली या लगभग खाली Word दस्तावेज़ उत्पन्न करता है। पहले स्कैन को OCR के माध्यम से चलाएँ (Tesseract, Adobe Acrobat Recognize Text, ABBYY FineReader) टेक्स्ट परत जोड़ने के लिए, फिर परिवर्तित करें। यदि स्रोत पूरी तरह से एक स्कैन है और आपको एक संपादन योग्य परिणाम चाहिए, तो OCR अपरिहार्य पहला चरण है चाहे आप बाद में किसी भी रूपांतरण टूल का उपयोग करें।
गोपनीयता और डेटा हैंडलिंग
आपके द्वारा अपलोड किया गया PDF रूपांतरण के दौरान आपके डिवाइस पर रहता है। pdf.js इसे ब्राउज़र मेमोरी में पढ़ता है, docx.js आउटपुट Word फ़ाइल को इकट्ठा करता है, और परिणाम सीधे आपकी डिस्क पर डाउनलोड होता है, यह सब आपकी मशीन पर चल रहे JavaScript में। कोई अपलोड चरण नहीं है, कोई दूरस्थ प्रसंस्करण नहीं है, और आपने कौन सा दस्तावेज़ परिवर्तित किया उसके बारे में कोई टेलीमेट्री नहीं है। यह मायने रखता है क्योंकि वे दस्तावेज़ जिन्हें आप सबसे निजी रूप से परिवर्तित करना चाहते हैं (अनुबंध, चिकित्सा रिकॉर्ड, कानूनी पत्राचार, वित्तीय विवरण) ठीक वही दस्तावेज़ हैं जिन्हें आपको कभी किसी तीसरे पक्ष के क्लाउड कन्वर्टर को नहीं भेजना चाहिए।
एक बार पृष्ठ लोड हो जाने के बाद, टूल ऑफ़लाइन काम करता है। आप इंटरनेट से डिस्कनेक्ट कर सकते हैं, एक PDF छोड़ सकते हैं, रूपांतरण चला सकते हैं, और Word दस्तावेज़ डाउनलोड कर सकते हैं बिना आपके डेटा को कभी किसी अन्य मशीन को छुए। क्लाउड-आधारित कन्वर्टर्स (Smallpdf, iLovePDF, Adobe Document Cloud) को प्रसंस्करण से पहले PDF अपलोड करने की आवश्यकता होती है; गोपनीय दस्तावेज़ों के लिए यही विफलता मोड है जिससे बचना है।
इस टूल का उपयोग कब न करें
जब आपको केवल टेक्स्ट चाहिए (PDF to Text का उपयोग करें)
यदि आपका एकमात्र लक्ष्य खोज, अनुक्रमण, अन्यत्र चिपकाना, या किसी अन्य टूल को फ़ीड करने के लिए टेक्स्ट निकालना है, तो इसके बजाय PDF to Text टूल का उपयोग करें। यह सरल, तेज़ है, और एक Word दस्तावेज़ संरचना बनाने का ओवरहेड टालता है जिसकी आपको आवश्यकता नहीं है। PDF to Word तब के लिए है जब आप एक संपादन योग्य दस्तावेज़ चाहते हैं; PDF to Text तब के लिए है जब आप कच्चे शब्द चाहते हैं।
जटिल तालिकाओं या डेटा निष्कर्षण के लिए (विशेष टूल का उपयोग करें)
उन दस्तावेज़ों के लिए जो मुख्य रूप से जटिल तालिकाएँ हैं (वित्तीय रिपोर्ट, वैज्ञानिक डेटा तालिकाएँ, भागों के कैटलॉग), जेनेरिक PDF to Word कन्वर्टर्स अव्यवस्थित आउटपुट उत्पन्न करते हैं। विशेष टूल का उपयोग करें: pdfplumber (Python लाइब्रेरी, मुफ्त), tabula-py (Python, मुफ्त), या Adobe Acrobat Pro की Table Extraction सुविधा (भुगतान)। एक बार की तालिका निष्कर्षण के लिए, Camelot (Python) और Excalibur (Camelot के लिए वेब UI) भी विकल्प हैं। Word दस्तावेज़ तालिकाएँ संग्रहीत करते हैं लेकिन उनमें रूपांतरण शायद ही कभी तालिका-वफादार होता है।
स्कैन किए गए PDFs के लिए (पहले OCR चलाएँ)
यदि आपका PDF कागज़ का स्कैन है या फ़ोटो की एक श्रृंखला है, तो परिवर्तित करने के लिए कोई निकाला जा सकने वाला टेक्स्ट नहीं है। इस टूल द्वारा उत्पादित Word दस्तावेज़ खाली होगा। पहले PDF को OCR के माध्यम से चलाएँ: Tesseract (मुफ्त कमांड-लाइन, अंग्रेज़ी और लैटिन स्क्रिप्ट के लिए उत्कृष्ट), Adobe Acrobat Pro Recognize Text (भुगतान, सर्वोत्तम लेआउट प्रतिधारण), या ABBYY FineReader (भुगतान, गैर-लैटिन स्क्रिप्ट और जटिल दस्तावेज़ों के लिए सर्वोत्तम)। OCR टेक्स्ट परत जोड़ने के बाद, यह कन्वर्टर सामान्य रूप से काम करेगा।
जब पिक्सेल-परफेक्ट लेआउट संपादन क्षमता से अधिक मायने रखता है
यदि दस्तावेज़ का सटीक दृश्य लेआउट संपादन योग्य होने से अधिक महत्वपूर्ण है (कानूनी प्रदर्शनी, प्रमाणित दस्तावेज़, तकनीकी चित्र), तो Word में परिवर्तित न करें। रूपांतरण अनिवार्य रूप से टेक्स्ट को पुनः प्रवाहित करेगा और फ़ॉन्ट को प्रतिस्थापित करेगा, एक ऐसा दस्तावेज़ उत्पन्न करेगा जो अब मूल से बिल्कुल मेल नहीं खाता। PDF को आधिकारिक संस्करण के रूप में रखें और केवल उन अनुभागों को परिवर्तित करें जिन्हें वास्तव में संपादन की आवश्यकता है।
अधिक प्रश्न
परिवर्तित Word दस्तावेज़ मूल PDF से अलग क्यों है?
PDFs पॉज़िशन्ड ग्लिफ़्स संग्रहीत करते हैं, पैराग्राफ़ संरचना नहीं। कन्वर्टर को अनुमान लगाना होता है कि पैराग्राफ़ कहाँ समाप्त होते हैं, कॉलम कहाँ बहते हैं, तालिकाएँ कहाँ शुरू होती हैं, कौन सा फ़ॉन्ट कौन सा है। ये अनुमान सीधे गद्य के लिए अधिकांश समय सही होते हैं लेकिन जटिल लेआउट के लिए उत्तरोत्तर बदतर हो जाते हैं। उन दस्तावेज़ों के लिए जहाँ रूपांतरण लगभग सही होना चाहिए, लेआउट-जागरूक रूपांतरण वाले डेस्कटॉप टूल का उपयोग करें (Acrobat Pro, Solid PDF to Word, ABBYY FineReader) और बाद में कुछ मैन्युअल सफाई करने की अपेक्षा करें।
क्या PDF से छवियाँ Word दस्तावेज़ में दिखाई देंगी?
यह ब्राउज़र-आधारित कन्वर्टर टेक्स्ट और बुनियादी संरचना पर केंद्रित है; एम्बेडेड छवियाँ PDF की जटिलता के आधार पर रूपांतरण में जीवित रह सकती हैं या नहीं भी। उन PDFs के लिए जहाँ छवियाँ मायने रखती हैं (फ़ोटो किताबें, प्रस्तुतियाँ, चित्रित रिपोर्ट), व्यूअर में PDF खोलें और छवियों को अलग से निकालें, फिर उन्हें मैन्युअल रूप से Word दस्तावेज़ में डालें। इस साइट पर PDF Extract Images टूल इस उद्देश्य के लिए PDF से हर छवि खींचता है।
क्या रूपांतरण विपरीत दिशा में जा सकता है, Word से PDF?
हाँ, लेकिन उस दिशा के लिए समर्पित Word to PDF टूल का उपयोग करें। Word से PDF आसान दिशा है: Word में पहले से ही एक अच्छी तरह से परिभाषित संरचना है जो PDF पर साफ-सुथरी मैप करती है। हर वर्ड प्रोसेसर (Word, Google Docs, LibreOffice, Pages) में बिल्ट-इन Export to PDF है। कठिन दिशा PDF से Word है क्योंकि PDFs में संरचनात्मक जानकारी की कमी है जिस पर Word निर्भर करता है। Microsoft Word स्वयं उसी प्रकार की रिवर्स-इंजीनियरिंग का उपयोग करके PDFs खोल सकता है (Word 2013 और बाद में File > Open)।
क्या टूल गैर-लैटिन स्क्रिप्ट (चीनी, अरबी, सिरिलिक) का समर्थन करता है?
हाँ, बशर्ते स्रोत PDF में उन वर्णों के लिए उचित ToUnicode फ़ॉन्ट मानचित्र हो (जो किसी भी आधुनिक PDF में होता है)। निकाला गया टेक्स्ट Unicode है और Word दस्तावेज़ में सही ढंग से दिखाई देता है। दाएँ से बाएँ स्क्रिप्ट जैसे अरबी और हिब्रू तार्किक क्रम में उत्पन्न होती हैं; आपको उचित प्रदर्शन के लिए Word में दाएँ से बाएँ पैराग्राफ़ स्वरूपण लागू करने की आवश्यकता हो सकती है। CJK (चीनी, जापानी, कोरियाई) पूरी तरह से समर्थित है।
DOC और DOCX के बीच क्या अंतर है?
DOC पुराना Microsoft Word बाइनरी प्रारूप है (Word 97 से 2003)। DOCX Word 2007 में पेश किया गया नया XML-आधारित प्रारूप है, 2008 में ISO/IEC 29500 (Office Open XML) के रूप में मानकीकृत। DOCX मूल रूप से XML फ़ाइलों का एक ZIP संग्रह है, जो इसे खुला, पार्स करने योग्य और हर आधुनिक वर्ड प्रोसेसर द्वारा अच्छी तरह से समर्थित बनाता है। यह टूल DOCX उत्पन्न करता है। यदि आपको विशेष रूप से बहुत पुराने Word संस्करणों के साथ संगतता के लिए DOC की आवश्यकता है, तो रूपांतरण के बाद Word के अंदर से DOCX को DOC के रूप में सहेजें।
यह सीधे Word में PDF खोलने की तुलना में कैसे है?
Microsoft Word 2013 और बाद वाला File > Open का उपयोग करके सीधे PDFs खोल सकता है। Microsoft के बिल्ट-इन रूपांतरण की गुणवत्ता आम तौर पर टेक्स्ट-भारी दस्तावेज़ों के लिए वेब कन्वर्टर्स के बराबर है और लेआउट-भारी दस्तावेज़ों के लिए थोड़ी बेहतर है (Microsoft ने PDF Reflow में भारी निवेश किया है)। इस ब्राउज़र टूल का लाभ गोपनीयता है: कुछ भी अपलोड नहीं किया जाता, और रूपांतरण उन उपकरणों पर चलता है जिनके पास Word इंस्टॉल नहीं हो सकता (Linux, Chromebook, मोबाइल)। जो आपके वर्कफ़्लो के अनुकूल हो उसका उपयोग करें।