मुफ़्त ऑनलाइन PDF तुलना
दो PDF फ़ाइलों की साथ-साथ तुलना करें, दृश्य अंतर हाइलाइट के साथ। तत्काल परिणाम, सर्वर पर कोई अपलोड नहीं।
PDF समर्थित · 100 MB तक
PDF समर्थित · 100 MB तक
यह कैसे काम करता है
- बाइं ड्रॉप जोन में चुनकर या खींचकर अपना पहला PDF अपलोड करें।
- दाइं ड्रॉप जोन में अपना दूसरा PDF अपलोड करें।
- अपना दृश्य मोड चुनें: “साथ-साथ” दोनों PDF एक साथ प्रदर्शित करता है, “ओवरले” अंतरों को लाल रंग में दिखाता है।
- पूर्व/अगला बटन का उपयोग करके या सीधे पृष्ठ संख्या दर्ज करके पृष्ठों में नेविगेट करें।
- ओवरले मोड में, लाल हाइलाइट दोनों दस्तावेज़ों के समान पृष्ठ संख्याओं के बीच पिक्सल अंतर दर्शाते हैं।
PDF तुलना क्यों करें?
PDF तुलना संस्करण नियंत्रण, गुणवत्ता आश्वासन और दस्तावेज़ प्रबंधन के लिए आवश्यक है। इसका उपयोग दस्तावेज़ संशोधनों के बीच परिवर्तनों को ट्रैक करने, संपादन सही से लागू होने की पुष्टि करने, अनधिकृत संशोधनों का पता लगाने, अनुबंध या कानूनी दस्तावेज़ों की तुलना करने, फॉर्म सबमिशन को मान्य करने और कई प्रतियों में दस्तावेज़ संगति सुनिश्चित करने के लिए करें। स्वचालित अंतर हाइलाइटिंग मैन्युअल समीक्षा की तुलना में समय बचाती है और त्रुटियाँ कम करती है।
दृश्य मोड विवरण
- साथ-साथ · एक ही स्क्रीन पर दोनों PDF एकसाथ देखें। लेआउट परिवर्तन, जोड़ या हटाने जैसे स्पष्ट भेदों का पता लगाने के लिए आदर्श। दोनों PDF स्वतंत्र रूप से नेविगेट होते हैं।
- ओवरले · दूसरे PDF को पहले के ऊपर रखता है और सभी पिक्सल अंतरों को लाल रंग में हाइलाइट करता है। विस्तृत परिवर्तन पहचान के लिए उपयुक्त। तुलना के लिए दोनों PDF में समान पृष्ठ संख्या होनी चाहिए।
उपयोग के मामले
- संस्करण नियंत्रण · दस्तावेज़ संस्करणों के बीच परिवर्तनों को ट्रैक करें और पहचानें कि क्या संशोधित हुआ।
- कानूनी और अनुबंध · अनुबंध संस्करणों की तुलना करें ताकि सुनिश्चित हो सके कि सभी संशोधन सही से लागू हुए।
- अनुपालन · सत्यापित करें कि फॉर्म और रिपोर्ट अनुमोदित टेम्पलेट या पिछले संस्करणों से मेल खाते हैं।
- गुणवत्ता आश्वासन · सत्यापित करें कि तैयार दस्तावेज़ अपेक्षित आउटपुट से मेल खाते हैं।
- धोखाधड़ी पहचान · PDF में अनधिकृत संशोधन या छेड़छाड़ का पता लगाएं।
अक्सर पूछे जाने वाले प्रश्न
ओवरले मोड अंतरों को कैसे हाइलाइट करता है?
ओवरले मोड रेंडर किए गए पृष्ठों की पिक्सल-दर-पिक्सल तुलना करता है। कोई भी भिन्न पिक्सल लाल रंग में हाइलाइट होता है। यह टेक्स्ट परिवर्तन, चित्र संशोधन, रिक्ति समायोजन और अन्य सभी दृश्य भेदों को पकड़ता है।
क्या मैं अलग-अलग आयामों वाले PDF की तुलना कर सकता हूँ?
हाँ। अलग-अलग पृष्ठ आकार वाले PDF पूरी तरह समर्थित हैं। साथ-साथ मोड में प्रत्येक PDF अपने मूल आकार में रेंडर होता है। ओवरले मोड में पहला PDF कैनवस आयाम निर्धारित करता है।
स्कैन या चित्र-आधारित PDF के बारे में क्या?
स्कैन किए गए PDF (रास्टर चित्रों से बने) पूरी तरह समर्थित हैं। तुलना दोनों PDF को रेंडर करके और दृश्य आउटपुट की तुलना करके काम करती है, इसलिए यह स्कैन किए गए दस्तावेज़ों में परिवर्तनों का पता लगाती है जैसे किसी भी अन्य PDF में।
क्या मैं एन्क्रिप्टेड PDF की तुलना कर सकता हूँ?
यह टूल सामान्य PDF के साथ काम करता है। यदि आपके PDF पासवर्ड से सुरक्षित या एन्क्रिप्टेड हैं, तो आपको तुलना से पहले PDF अनलॉकिंग टूल से सुरक्षा हटानी होगी।
PDF का अधिकतम आकार कितना हो सकता है?
प्रत्येक PDF 100 MB तक हो सकता है। प्रोसेसिंग समय फाइल आकार, पृष्ठ संख्या और आपके डिवाइस की विशेषताओं पर निर्भर करता है। बहुत बड़ी फाइलों को लोड और रेंडर होने में कुछ सेकंड लग सकते हैं।
क्या तुलना 100% सटीक है?
हाँ, दृश्य अंतरों के लिए। टूल सटीक पिक्सल-दर-पिक्सल तुलना करता है, इसलिए यह किसी भी दृश्य परिवर्तन का पता लगाएगा। हालांकि, यह रेंडर किए गए आउटपुट की तुलना करता है, PDF की आंतरिक संरचना की नहीं, फॉन्टों या PDF लाइब्रेरीज़ के कारण रेंडरिंग में मामूली अंतर तब दिख सकते हैं जब वास्तविक सामग्री समान हो।
PDF तुलना टूल क्या है?
एक PDF तुलना टूल दो PDF फ़ाइलें लेता है और आपको दिखाता है कि उनके बीच क्या बदल गया है। कठिन हिस्सा यह परिभाषित करना है कि परिवर्तन का क्या मतलब है। जो दस्तावेज़ एक जैसे दिखते हैं, उनके लिए आप चाहते हैं कि टूल कहे समान, भले ही अंतर्निहित बाइट्स अलग हों क्योंकि वे अलग सॉफ़्टवेयर द्वारा उत्पन्न किए गए थे। वास्तविक संपादन वाले दस्तावेज़ों के लिए, आप चाहते हैं कि टूल ठीक से उजागर करे जहाँ टेक्स्ट, लेआउट या छवियाँ बदल गई हैं। विभिन्न तुलना रणनीतियाँ वास्तविक परिवर्तनों को पकड़ने और शोर को नज़रअंदाज़ करने के बीच अलग-अलग व्यापार-बंद करती हैं।
यह टूल दृश्य तुलना का उपयोग करता है: दोनों PDFs से प्रत्येक पृष्ठ एक पिक्सेल ग्रिड पर रेंडर किया जाता है, और दो ग्रिड्स ओवरले की जाती हैं। मेल खाने वाले पिक्सेल पृष्ठभूमि के रूप में दिखाए जाते हैं; अलग होने वाले पिक्सेल लाल रंग में उजागर किए जाते हैं। यह हर दृश्य परिवर्तन को पकड़ता है, जिसमें लेआउट शिफ्ट, फ़ॉन्ट प्रतिस्थापन, छवि संपादन और टेक्स्ट पुनर्लेखन शामिल हैं। यह अदृश्य परिवर्तनों (PDF मेटाडेटा, छिपे हुए फ़ॉर्म फ़ील्ड, एम्बेडेड JavaScript) को नहीं पकड़ता, जो एक विशेषता है: ये दस्तावेज़ की विशिष्ट समीक्षा के लिए शायद ही कभी मायने रखते हैं।
सब कुछ pdf.js (Mozilla का PDF रेंडरर) और pdf-lib (PDF हेरफेर लाइब्रेरी) का उपयोग करके आपके ब्राउज़र में चलता है। दोनों PDFs मेमोरी में लोड किए जाते हैं, कैनवस तत्वों में रेंडर किए जाते हैं, और पिक्सेल तुलना आपकी मशीन पर JavaScript में चलती है। कोई फ़ाइल सर्वर पर अपलोड नहीं की जाती। टूल 100 MB तक के PDFs को संभालता है और मानक डिजिटल PDFs, स्कैन किए गए PDFs, और किसी भी स्रोत से PDFs पर काम करता है जब तक कि वे पासवर्ड-एन्क्रिप्टेड न हों।
टूल के अंदर क्या है
शीर्ष अनुभाग में दो ड्रॉप ज़ोन एक-दूसरे के बगल में होते हैं: मूल PDF को बाईं ओर छोड़ें, संशोधित PDF को दाईं ओर। लेबल स्पष्ट करते हैं कि कौन सा कौन है, ताकि आप गलती से जोड़े गए टेक्स्ट को हटाए गए टेक्स्ट के रूप में न समझें। दोनों फ़ाइलों को आपके फ़ाइल प्रबंधक से खींचा जा सकता है या फ़ाइल पिकर के साथ चुना जा सकता है। जैसे ही दोनों फ़ाइलें लोड हो जाती हैं, टूल प्रत्येक की पृष्ठ गणना की रिपोर्ट करता है, जो पहला संकेत है कि क्या वास्तविक परिवर्तन हुए हैं।
ड्रॉप ज़ोन के नीचे, एक व्यू-मोड टॉगल साइड बाय साइड (दोनों पृष्ठ एक-दूसरे के बगल में रेंडर किए गए) और ओवरले (दोनों पृष्ठ संयुक्त जिसमें अंतर लाल रंग में हाइलाइट किए गए) के बीच स्विच करता है। साइड बाय साइड पहली नज़र के लिए या स्क्रीनशॉट साझा करने के लिए सबसे अच्छा है। ओवरले वह जगह है जहाँ वास्तविक तुलना होती है: दो रेंडरिंग के बीच कोई भी पिक्सेल जो अलग है वह लाल रंग में दिखाई देता है, ताकि आप बिना दोनों संस्करण पढ़े तुरंत देख सकें कि क्या बदला।
पृष्ठ नेविगेशन आपको दस्तावेज़ को एक बार में एक पृष्ठ देखने देता है। यदि दोनों PDFs में अलग पृष्ठ गणना है, तो नेविगेशन जो भी लंबा है वहाँ रुक जाता है, और लापता पृष्ठ खाली दिखाया जाता है। बटन पहले या अंतिम पृष्ठ पर कूदते हैं; पृष्ठ संख्या इनपुट आपको किसी भी विशिष्ट पृष्ठ पर सीधे जाने देता है। लंबे दस्तावेज़ों के लिए, नेविगेशन रेंडरिंग के बजाय अड़चन है, इसलिए वर्कफ़्लो है: लोड करें, एक पृष्ठ पर कूदें, तुलना करें, दोहराएं।
इतिहास और पृष्ठभूमि
कंप्यूटर विज्ञान में diff समस्या (1976)
एक दस्तावेज़ के दो संस्करणों की तुलना करना एक पुरानी समस्या है। पहला व्यावहारिक समाधान diff उपयोगिता थी जिसे डगलस मैकलरॉय ने 1976 में बेल लैब्स में लिखा था। Diff दो टेक्स्ट फ़ाइलों की तुलना करता है और उन पंक्तियों को प्रिंट करता है जो भिन्न हैं, सबसे लंबे सामान्य उपक्रम एल्गोरिथम का उपयोग करते हुए। यूजीन मायर्स ने 1986 में O(ND) पेपर के साथ एल्गोरिथम में सुधार किया जो git सहित लगभग हर आधुनिक diff टूल का आधार बन गया। टेक्स्ट diff आधार है, लेकिन यह केवल टेक्स्ट पर काम करता है, रेंडर किए गए दस्तावेज़ों पर नहीं।
दृश्य diff और पिक्सेल तुलना (1990 का दशक)
1990 के दशक ने दृश्य diff टूल पेश किए जो स्रोत टेक्स्ट के बजाय रेंडर किए गए आउटपुट की तुलना करते थे। WinMerge (1998), BeyondCompare (Scooter Software, 1996) और Araxis Merge (1996) ने टेक्स्ट के साथ-साथ छवि तुलना जोड़ी। पिक्सेल-दर-पिक्सेल diff वैचारिक रूप से सरल है (प्रत्येक पिक्सेल स्थिति की तुलना करें, मेल न खाने वाले को हाइलाइट करें), लेकिन यह उन रेंडर की तुलना करते समय शोर पैदा करता है जो मनुष्यों के लिए समान दिखते हैं लेकिन एंटी-एलियासिंग या फ़ॉन्ट हिंटिंग द्वारा भिन्न होते हैं। अवधारणात्मक diff और संरचनात्मक समानता (Wang et al. 2004) जैसे परिशोधन अवधारणात्मक रूप से अप्रासंगिक अंतरों को फ़िल्टर करने का प्रयास करते हैं।
Acrobat PDF तुलना जोड़ता है (2015)
Adobe ने 2015 में Acrobat Pro DC में Compare Files सुविधा जोड़ी। शुद्ध दृश्य diff के विपरीत, Acrobat की तुलना टेक्स्ट-जागरूक है: यह डाला गया, हटाया गया और प्रतिस्थापित किया गया टेक्स्ट पहचानता है और परिवर्तनों को साइडबार में प्रस्तुत करता है, Word के ट्रैक चेंजेस व्यू के समान। यह उचित टेक्स्ट लेयर्स वाले डिजिटल PDFs पर अच्छा काम करता है लेकिन स्कैन किए गए PDFs या कस्टम फ़ॉन्ट एन्कोडिंग वाले PDFs पर ख़राब हो जाता है। Adobe का टूल केवल डेस्कटॉप एप्लिकेशन पर चलता है; यह ब्राउज़र में उपलब्ध नहीं है।
DiffPDF और कमांड-लाइन PDF diff टूल (2010 का दशक)
DiffPDF (2010) और diff-pdf (Wine-आधारित रैपर, 2012) जैसे ओपन-सोर्स कमांड-लाइन टूल ने PDF तुलना को स्क्रिप्टेड वर्कफ़्लो में लाया। ये टूल या तो टेक्स्ट द्वारा (दोनों PDFs निकालें और टेक्स्ट diff चलाएं) या छवि द्वारा (दोनों PDFs को रास्टराइज़ करें और छवि diff चलाएं) तुलना करते हैं। वे CI पाइपलाइनों में उपयोगी हैं जहाँ आप PDF प्रतिगमन को फ़्लैग करना चाहते हैं, लेकिन उन्हें स्थानीय स्थापना की आवश्यकता है और गैर-डेवलपर्स के लिए अजीब हैं।
ब्राउज़र-आधारित PDF रेंडरिंग परिपक्व होता है (2013)
Mozilla ने फरवरी 2013 में Firefox 19 के साथ pdf.js भेजा, जिससे JavaScript-आधारित PDF रेंडरिंग उत्पादन-तैयार हो गया। Chrome ने 2013-2014 में समान प्रभाव के लिए PDFium (C++, Foxit-व्युत्पन्न) को एकीकृत किया। एक बार ब्राउज़र PDFs को नेटिव रूप से रेंडर कर सकते थे, ब्राउज़र-आधारित PDF तुलना टूल बनाना संभव हो गया: JavaScript में दोनों फ़ाइलें लोड करें, प्रत्येक पृष्ठ को कैनवस पर रेंडर करें, कैनवस पिक्सेल बफ़र्स की तुलना करें। यह टूल उस वंश का अनुसरण करता है।
गोपनीयता-प्रथम क्लाउड विकल्प (2020 से आगे)
COVID-युग के रिमोट कार्य उछाल ने कई PDF टूल को ऑनलाइन धकेला। अधिकांश क्लाउड PDF तुलना सेवाएँ (Smallpdf, iLovePDF, PDF24) प्रसंस्करण के लिए दोनों फ़ाइलों को सर्वर पर अपलोड करने की आवश्यकता रखती हैं, जो अनुबंध, चिकित्सा रिकॉर्ड या वित्तीय विवरण जैसे गोपनीय दस्तावेज़ों के लिए अस्वीकार्य है। क्लाइंट-साइड चलने वाले ब्राउज़र-आधारित टूल एक गोपनीयता-संरक्षण विकल्प हैं: फ़ाइल कभी आपके डिवाइस से नहीं निकलती, लेकिन आप क्लाउड टूल के समान तुलना अनुभव प्राप्त करते हैं।
व्यावहारिक वर्कफ़्लो
अनुबंध संस्करण समीक्षा
एक प्रतिपक्ष यह दावा करते हुए एक रेडलाइन किया गया अनुबंध भेजता है कि केवल एक खंड बदला है। मूल PDF और संशोधित PDF लोड करें, ओवरले मोड पर स्विच करें, और पृष्ठों के माध्यम से चलें। लाल हाइलाइट हर वास्तविक संशोधन दिखाते हैं, न केवल वे जो प्रतिपक्ष ने इंगित किए। यह उन छिपे परिवर्तनों (एक तारीख बदलाव, एक संख्या मरोड़ा, एक खंड चुपके से जोड़ा गया) को पकड़ता है जिन्हें केवल-टेक्स्ट रेडलाइन याद कर सकते हैं। अनुवर्ती के लिए किसी भी अप्रत्याशित लाल क्षेत्र के स्क्रीनशॉट सहेजें।
डिज़ाइन और मार्केटिंग संपार्श्विक अनुमोदन
एक डिज़ाइनर एक ब्रोशर के संस्करण 2 को यह दावा करते हुए भेजता है कि उन्होंने आपकी प्रतिक्रिया का समाधान किया। संस्करण 1 और संस्करण 2 लोड करें, प्रत्येक पृष्ठ को ओवरले करें, और परिवर्तन सत्यापित करें। पिक्सेल diff टाइपोग्राफी मरोड़, रंग बदलाव, छवि स्वैप और लेआउट समायोजन को पकड़ता है जिन्हें दो संस्करणों को क्रमिक रूप से पढ़ते समय मिस करना आसान होता है। बहु-पृष्ठ संपार्श्विक के लिए यह दोनों को प्रिंट करने और साथ-साथ रखने की तुलना में बहुत तेज़ है।
तकनीकी दस्तावेज़ीकरण प्रतिगमन जांच
जब आप तकनीकी दस्तावेज़ीकरण को PDF (उपयोगकर्ता मैनुअल, API संदर्भ, आंतरिक SOPs) के रूप में प्रकाशित करते हैं, तो पिछले रिलीज़ की तुलना में नए संस्करण की तुलना करना अनपेक्षित diffs पकड़ता है। पिक्सेल तुलना एक पृष्ठ-ब्रेक शिफ्ट या पुनः क्रमांकित अनुभाग को पकड़ने के लिए पर्याप्त संवेदनशील है जिसे टेक्स्ट diff भ्रामक रूप से प्रस्तुत कर सकता है। सैकड़ों पृष्ठों वाले दस्तावेज़ों के लिए, पहले साइड-बाय-साइड मोड में स्कैन करें, फिर किसी भी पृष्ठ को ओवरले करें जो अलग दिखता है।
कर फ़ॉर्म वर्ष-दर-वर्ष तुलना
कर फ़ॉर्म (IRS 1040, UK SA100, French 2042 आदि) हर साल बदलते हैं। इस साल के फ़ॉर्म की तुलना पिछले साल के साथ करना नए लाइन आइटम, हटाए गए कटौती और पुनः क्रमांकित अनुभागों की पहचान करता है। लेखाकारों और कर तैयार करने वालों के लिए, यह कर प्राधिकरण से फ़ॉर्म परिवर्तन नोट्स पढ़ने से तेज़ है। ओवरले हर मुद्रित परिवर्तन को तुरंत हाइलाइट करता है।
अकादमिक पेपर संशोधन ट्रैकिंग
जब एक पेपर पीयर रिव्यू से गुजरता है, तो मूल सबमिशन की तुलना संशोधित संस्करण से करना यह सत्यापित करने में मदद करता है कि कौन से समीक्षक टिप्पणियों का समाधान किया गया था। LaTeX-जनित PDFs आमतौर पर इतने साफ होते हैं कि दृश्य diff हर टेक्स्ट परिवर्तन पकड़ लेता है। यदि आंकड़े या समीकरण अद्यतन किए गए, तो पिक्सेल तुलना उन्हें स्पष्ट रूप से हाइलाइट करती है। दोनों संस्करणों को पूर्ण रूप से पढ़ने से समय बचाता है।
विनियमन और नीति परिवर्तन ट्रैकिंग
सरकारी विनियमन, कॉर्पोरेट नीतियाँ और मानक दस्तावेज़ (ISO, IEEE, IETF) आमतौर पर PDF के रूप में प्रकाशित होते हैं। नए संस्करण की तुलना पिछले से करना मूल परिवर्तनों की पहचान करने का सबसे तेज़ तरीका है। अनुपालन टीमें इसका उपयोग हितधारकों को यह बताने के लिए करती हैं कि क्या बदला बिना पूरे दस्तावेज़ को फिर से पढ़े। साइड-बाय-साइड मोड संदर्भ के लिए अच्छा है; ओवरले मोड हर सूक्ष्म संपादन को देखने के लिए अच्छा है।
सामान्य त्रुटियाँ
विभिन्न जनरेटर अलग-अलग रेंडर उत्पन्न करते हैं
Microsoft Word से निर्यात किया गया दस्तावेज़ और Google Docs से निर्यात किया गया वही दस्तावेज़ एक ही टेक्स्ट को थोड़े अलग kerning, लाइन रैपिंग या फ़ॉन्ट प्रतिस्थापन के साथ रेंडर कर सकता है। पिक्सेल diff इन्हें अंतर के रूप में फ़्लैग करता है, भले ही दस्तावेज़ सामग्री अपरिवर्तित है। यदि आप दो अलग टूल से निर्यात किए गए समान स्रोत दस्तावेज़ की तुलना कर रहे हैं, तो शोर की एक बेसलाइन की अपेक्षा करें। Adobe की टेक्स्ट-जागरूक तुलना का उपयोग करें या शोर को फ़िल्टर करने के लिए निष्कर्षण के बाद टेक्स्ट-diff चलाएं।
अलग-अलग रिज़ॉल्यूशन पर स्कैन किए गए PDFs हर जगह अलग दिखते हैं
यदि एक PDF 300 DPI पर एक स्कैन है और दूसरा उसी भौतिक दस्तावेज़ का 600 DPI पर स्कैन है, तो रेंडर किए गए पिक्सेल संरेखित नहीं होंगे। हर पृष्ठ लाल के समुद्र के रूप में दिखाई देगा। उसी DPI पर पुनः स्कैन करके रेंडरिंग रिज़ॉल्यूशन का मिलान करें, या दोनों पर OCR चलाएं और दृश्य रेंडरिंग के बजाय टेक्स्ट की तुलना करें। दृश्य diff केवल तब काम करता है जब दोनों PDFs समान पिक्सेल ग्रिड पर रेंडर होते हैं।
पृष्ठ रोटेशन अंतर
यदि एक PDF में एक पृष्ठ दूसरे PDF में उसी पृष्ठ के सापेक्ष 90 डिग्री घूमा हुआ है, तो पिक्सेल तुलना पूरे पृष्ठ को अलग के रूप में फ़्लैग करेगी। तुलना करने से पहले दोनों PDFs के पृष्ठ-रोटेशन मेटाडेटा की जांच करें। PDF रीडर दोनों पृष्ठों को स्क्रीन पर सीधे दिखाएंगे, अंतर्निहित रोटेशन को छुपाते हुए। रोटेशन सत्यापित करने के लिए PDF मेटाडेटा टूल का उपयोग करें, और यदि आवश्यक हो तो मिलान के लिए एक PDF घुमाएं।
एंटी-एलियासिंग सब-पिक्सेल अंतर पैदा करता है
यहाँ तक कि दो बार रेंडर किए गए समान PDFs की तुलना करते समय भी, ब्राउज़र एंटी-एलियासिंग ग्लिफ़ किनारों के साथ छोटे पिक्सेल-मान अंतर पैदा कर सकता है। ओवरले टेक्स्ट के चारों ओर एक धुंधला लाल हेलो दिखा सकता है। यह रेंडरिंग शोर है, वास्तविक परिवर्तन नहीं। यदि शोर सिग्नल को अभिभूत कर रहा है, तो एक उच्च तुलना सीमा पर विचार करें (एक दूसरे के 5 प्रतिशत के भीतर पिक्सेल को मिलान के रूप में मानें) या उच्च रिज़ॉल्यूशन पर रास्टराइज़ करें जहाँ प्रत्येक ग्लिफ़ अधिक पिक्सेल पर कब्ज़ा करता है।
लेआउट शिफ्ट लाल हाइलाइट कैस्केड करते हैं
यदि आप एक पृष्ठ के शीर्ष के पास एक एकल पैराग्राफ जोड़ते हैं, तो पृष्ठ का बाकी हिस्सा नीचे शिफ्ट हो जाता है। डाले गए पैराग्राफ के नीचे की प्रत्येक पंक्ति अब एक अलग y-निर्देशांक पर बैठती है, और पिक्सेल diff उन सभी को अलग के रूप में हाइलाइट करता है। वास्तविक परिवर्तन एक पैराग्राफ था लेकिन दृश्य diff उसके नीचे सब कुछ है। यह मुख्य कारण है कि टेक्स्ट-जागरूक diff (जो पैराग्राफ समझता है) सामग्री-भारी PDFs के लिए शुद्ध पिक्सेल diff की तुलना में अक्सर बेहतर परिणाम देता है।
दृश्य diff अदृश्य परिवर्तन याद करता है
PDFs में अदृश्य परिवर्तन हो सकते हैं: मेटाडेटा संपादन, एम्बेडेड JavaScript, छिपे हुए फ़ॉर्म फ़ील्ड, शून्य अपारदर्शिता पर सेट वॉटरमार्क, संलग्न फ़ाइलें। दृश्य तुलना उनमें से किसी को भी नहीं पकड़ेगी क्योंकि वे पिक्सेल में रेंडर नहीं होते। व्यापक ऑडिटिंग के लिए, दृश्य diff को PDF मेटाडेटा टूल (जो निर्माता, निर्माण तिथि, शीर्षक, कस्टम डिक्शनरी प्रविष्टियाँ दिखाता है) और PDF अनलॉक टूल (जो एन्क्रिप्शन फ़्लैग प्रकट करता है) के साथ संयोजित करें। दृश्य diff आवश्यक है लेकिन पर्याप्त नहीं।
गोपनीयता और डेटा हैंडलिंग
आप जो दोनों PDFs टूल में लोड करते हैं वे पूरे समय आपके डिवाइस पर रहते हैं। pdf.js और pdf-lib JavaScript लाइब्रेरी हैं जो आपके ब्राउज़र में निष्पादित होती हैं; वे फ़ाइल सामग्री के साथ कोई नेटवर्क अनुरोध नहीं करतीं। फ़ाइलें मेमोरी में पढ़ी जाती हैं, कैनवस तत्वों में रेंडर की जाती हैं, और पिक्सेल तुलना JavaScript में चलती है। हम कभी भी कोई फ़ाइल अपलोड नहीं करते, कभी भी सामग्री लॉग नहीं करते, और कभी भी विश्लेषण नहीं करते कि उनमें क्या है। यह मायने रखता है क्योंकि वे दस्तावेज़ जिनकी आप सबसे ज़्यादा तुलना करना चाहते हैं (अनुबंध, वित्तीय रिपोर्ट, कानूनी पत्राचार, चिकित्सा रिकॉर्ड) ठीक वही हैं जिन्हें आपको कभी भी तीसरे पक्ष की सेवा को नहीं भेजना चाहिए।
एक बार पृष्ठ लोड हो जाने के बाद, टूल ऑफ़लाइन काम करता है। आप इंटरनेट से डिस्कनेक्ट कर सकते हैं, दोनों PDFs छोड़ सकते हैं, तुलना चला सकते हैं, और ओवरले की समीक्षा कर सकते हैं बिना आपके डेटा को कभी किसी अन्य मशीन को छुए। तुलना परिणाम (लाल-हाइलाइटेड ओवरले) पृष्ठ पर एक रेंडर की गई छवि है; यदि आप इसे रखना चाहते हैं, तो स्क्रीनशॉट लें। कुछ भी सर्वर-साइड सहेजा नहीं जाता और कुछ भी अपलोड नहीं किया जाता।
इस टूल का उपयोग कब न करें
शुद्ध टेक्स्ट तुलना (इसके बजाय diff-checker का उपयोग करें)
यदि आपके PDFs केवल टेक्स्ट हैं और आप चाहते हैं कि एक पंक्ति-दर-पंक्ति diff हो जिसमें इन्सर्ट और डिलीट निकाले गए हों, तो पहले टेक्स्ट निकालें (PDF-से-टेक्स्ट) और परिणाम को टेक्स्ट diff टूल के माध्यम से चलाएं। टेक्स्ट diff पैराग्राफ रिफ़्लो, लेआउट शिफ्ट और फ़ॉन्ट परिवर्तनों को स्वाभाविक रूप से संभालता है, इनमें से कोई भी पिक्सेल diff अच्छी तरह से नहीं संभालता। Absolutool diff-checker टूल टेक्स्ट के लिए ठीक यही करता है। पिक्सेल diff सबसे अच्छा है जब लेआउट और दृश्य तत्व मायने रखते हैं, शुद्ध गद्य नहीं।
PDFs की तुलना जो बाइट-समान होनी चाहिए
यदि आपको सत्यापित करने की आवश्यकता है कि दो PDFs बिल्कुल एक ही फ़ाइल हैं (बिल्ड पुनरुत्पादकता, फ़ाइल अखंडता जांच, धोखाधड़ी पहचान), तो दृश्य diff के बजाय हैश तुलना (SHA-256, MD5) का उपयोग करें। एक हैश जांच तेज़, नियतात्मक है और रेंडरिंग शोर के प्रति प्रतिरक्षित है। file-hash टूल सेकंड में SHA-256 हैश की गणना करता है; यदि हैश मेल खाते हैं तो फ़ाइलें समान हैं, यदि वे भिन्न हैं तो फ़ाइलें समान नहीं हैं चाहे वे कैसे भी रेंडर हों।
बहुत बड़े PDFs जो ब्राउज़र मेमोरी से अधिक हैं
दो 100 MB PDFs को एक साथ लोड करना, साथ ही प्रत्येक पृष्ठ के लिए रेंडर किए गए कैनवस, बहुत सारी ब्राउज़र मेमोरी का उपभोग करता है। कम-स्पेक लैपटॉप और अधिकांश मोबाइल डिवाइसों पर यह टैब क्रैश कर सकता है। बहुत बड़े PDFs (वास्तुशिल्प चित्र, बहु-हज़ार पृष्ठ मैनुअल) के लिए, पहले प्रत्येक PDF को PDF स्प्लिटर टूल से विभाजित करें और मिलते-जुलते भागों की तुलना करें। या मेमोरी-भारी तुलना के लिए Adobe Acrobat Pro DC जैसे डेस्कटॉप टूल का उपयोग करें।
विभिन्न फ़ाइल स्वरूपों में PDFs की तुलना
यदि एक दस्तावेज़ PDF है और दूसरा Word फ़ाइल या HTML पृष्ठ है, तो यह टूल उनकी तुलना नहीं कर सकता। पहले दोनों को PDF (या दोनों को टेक्स्ट) में परिवर्तित करें ताकि आप समान की समान से तुलना कर रहे हों। प्रारूपों के पार तुलना लगभग हमेशा भारी दृश्य diffs उत्पन्न करती है क्योंकि रेंडरर पूरी तरह से अलग होते हैं। पहले एक सामान्य प्रारूप में परिवर्तित करें; फिर तुलना करें।
अधिक प्रश्न
ओवरले लाल क्यों दिखाता है भले ही PDFs समान दिखते हैं?
पिक्सेल-परफेक्ट तुलना सब-पिक्सेल रेंडरिंग अंतर पकड़ती है जो मनुष्य नहीं देख सकते। दो PDFs अलग टूल (Word बनाम LaTeX बनाम InDesign) द्वारा उत्पन्न किए गए हो सकते हैं जो फ़ॉन्ट को अलग तरह से हिंट करते हैं या किनारों को अलग तरह से एंटी-एलियास करते हैं। सामग्री समान है; पिक्सेल नहीं हैं। इन मामलों के लिए, दोनों PDFs से टेक्स्ट निकालने के बाद टेक्स्ट-आधारित diff को प्राथमिकता दें, या स्वीकार करें कि शोर वास्तविक है और केवल बड़े लाल क्षेत्रों को देखें।
क्या मैं स्कैन किए गए PDFs की तुलना कर सकता हूँ?
हाँ, स्कैन किए गए PDFs काम करते हैं क्योंकि टूल टेक्स्ट के बजाय रेंडर किए गए पिक्सेल की तुलना करता है। पकड़ यह है कि दोनों स्कैन समान रिज़ॉल्यूशन और अभिविन्यास पर होने चाहिए, अन्यथा तुलना बेकार शोर होगी। उसी भौतिक पृष्ठ के स्कैन के लिए, यह टूल जोड़ी गई हस्तलेखन, संशोधन चिह्न या मुहरों जैसे अंतर पकड़ता है। अलग DPI पर अलग पृष्ठों के स्कैन के लिए, पहले दोनों पर OCR करें और टेक्स्ट की तुलना करें।
क्या टूल जानता है कि कौन सा PDF पुराना है?
नहीं, टूल दोनों PDFs को सममित रूप से व्यवहार करता है। यह आपको दिखाता है कि वे कहाँ भिन्न हैं; यह अनुमान नहीं लगाता कि कौन सा मूल है और कौन सा संशोधन है। आप तय करते हैं कि कौन सी फ़ाइल किस तरफ रखी जाए। बाएँ और दाएँ लेबल पूरी तरह से स्थितिगत हैं। यदि आपको अस्थायी संदर्भ की आवश्यकता है (पहले कौन आया), तो अपने फ़ाइल प्रबंधक में फ़ाइल संशोधन समय या PDF मेटाडेटा की जाँच करें।
क्या मैं तुलना को रिपोर्ट के रूप में निर्यात कर सकता हूँ?
सीधे नहीं: तुलना ब्राउज़र में लाइव रेंडर की जाती है। इसे कैप्चर करने के लिए, ओवरले पृष्ठों के स्क्रीनशॉट लें और एक रिपोर्ट दस्तावेज़ में पेस्ट करें। अधिक परिष्कृत रिपोर्टिंग के लिए (टिप्पणियों के साथ अंतरों का PDF), Adobe Acrobat Pro DC की Compare Files सुविधा एक प्रिंट करने योग्य रिपोर्ट उत्पन्न करती है; यह ब्राउज़र टूल केवल लाइव दृश्य तुलना पर केंद्रित है।
क्या होगा यदि दोनों PDFs में अलग पृष्ठ गणना है?
पृष्ठ नेविगेशन किसी भी PDF की अधिकतम पृष्ठ गणना तक फैलता है। जब आप एक ऐसे पृष्ठ पर पहुँचते हैं जो केवल एक PDF के पास है, तो दूसरा पक्ष खाली दिखाता है। यह सबसे सरल व्यवहार है और आमतौर पर सबसे उपयोगी: यदि संस्करण 2 ने अंत में दो पृष्ठ जोड़े, तो आप उन पृष्ठों को जोड़ी गई सामग्री के रूप में देखते हैं। यदि पृष्ठ बीच में डाले गए, तो प्रत्येक बाद का पृष्ठ अलग दिखाई देगा क्योंकि वे शिफ्ट हो गए हैं; यह संकेत है कि एक प्रविष्टि हुई।
टेक्स्ट-आधारित के बजाय पिक्सेल-आधारित तुलना क्यों?
पिक्सेल तुलना सब कुछ दृश्य पकड़ती है: टेक्स्ट संपादन, लेआउट शिफ्ट, छवि परिवर्तन, फ़ॉन्ट प्रतिस्थापन, रंग समायोजन, संशोधन। टेक्स्ट-आधारित तुलना केवल टेक्स्ट परिवर्तन पकड़ती है और लेआउट और छवियों के प्रति अंधी है। दस्तावेज़ समीक्षा (अनुबंध, रिपोर्ट, मार्केटिंग) के लिए दृश्य परिवर्तन अक्सर टेक्स्ट जितने ही मायने रखते हैं। पिक्सेल तुलना सुरक्षित डिफ़ॉल्ट है; शुद्ध गद्य तुलना के लिए, टेक्स्ट diff अधिक सटीक है।