किसी भी टेक्स्ट में शब्द और वर्ण कैसे गिनें
आपके पाठ में कितने शब्द या वर्ण हैं यह जानना आपकी सोच से अधिक बार मायने रखता है। सोशल मीडिया पोस्ट में वर्ण सीमाएँ होती हैं। शैक्षणिक पेपर में शब्द गणना होती है। SEO मेटा विवरण को एक विशिष्ट सीमा तक पहुँचने की आवश्यकता होती है। यहाँ तक कि ईमेल विषय पंक्तियाँ भी कुछ लंबाइयों पर बेहतर प्रदर्शन करती हैं। एक ब्राउज़र-आधारित काउंटर बिना सर्वर अपलोड की आवश्यकता के, जब आप टाइप करते हैं तब सब कुछ लाइव दिखाता है।
प्लेटफ़ॉर्म वर्ण सीमाएँ
| प्लेटफ़ॉर्म | सीमा | क्या गिना जाता है |
|---|---|---|
| Twitter/X पोस्ट | 280 वर्ण | सभी वर्ण जिनमें रिक्त स्थान शामिल हैं |
| Twitter/X Premium | 25,000 वर्ण | प्रति «लॉन्ग पोस्ट» ट्वीट |
| Instagram कैप्शन | 2,200 वर्ण | सभी वर्ण |
| Instagram बायो | 150 वर्ण | प्रोफ़ाइल का दृश्य भाग |
| LinkedIn पोस्ट | 3,000 वर्ण | सभी वर्ण |
| LinkedIn शीर्षक | 220 वर्ण | प्रोफ़ाइल पर आपके नाम के नीचे |
| TikTok कैप्शन | 4,000 वर्ण | प्रति वीडियो पोस्ट |
| Facebook पोस्ट | 63,206 वर्ण | लेकिन 80 से कम पर सबसे अच्छी सहभागिता |
| Bluesky पोस्ट | 300 वर्ण | रिक्त स्थान शामिल |
| Mastodon टूट | 500 वर्ण | डिफ़ॉल्ट; कुछ इंस्टेंस अधिक की अनुमति देते हैं |
| मेटा विवरण (SEO) | 155-160 वर्ण | खोज परिणामों में दृश्य |
| शीर्षक टैग (SEO) | 50-60 वर्ण | SERPs में इससे आगे काटा जाता है |
| SMS संदेश | 160 वर्ण | प्रति खंड |
| ईमेल विषय पंक्ति | 50-60 वर्ण | मोबाइल प्रदर्शन के लिए |
| YouTube शीर्षक | 100 वर्ण | पूर्ण प्रदर्शन के लिए |
| YouTube विवरण | 5,000 वर्ण | «अधिक» के बिना पहले 125 दृश्य |
| Reddit पोस्ट शीर्षक | 300 वर्ण | सबरेडिट कम सीमाएँ निर्धारित कर सकते हैं |
| Discord संदेश | 2,000 वर्ण | प्रति संदेश; लंबा कई में विभाजित |
| WhatsApp संदेश | 65,536 वर्ण | चैट के लिए प्रभावी रूप से असीमित |
शब्दों और वर्णों को कैसे गिनें
- अपना पाठ चिपकाएँ या टाइप करें: काउंटर में पाठ दर्ज करें। आँकड़े आपके टाइप करते समय तुरंत अपडेट होते हैं।
- आँकड़ों की समीक्षा करें: शब्द गणना, वर्ण गणना (रिक्त स्थान के साथ और बिना), वाक्य गणना, पैराग्राफ गणना और अनुमानित पठन समय देखें।
- परिणामों को कॉपी करें: विश्लेषण को अपने क्लिपबोर्ड में सहेजने के लिए «आँकड़े कॉपी करें» पर क्लिक करें।
शब्द गणना का संक्षिप्त इतिहास
शब्द गणना कंप्यूटर से सदियों पहले की है। मध्ययुगीन शास्त्री भुगतान का अनुमान लगाने के लिए शब्दों की गिनती करते थे (कुछ मठों में पाठ की «लाइन» के अनुसार भुगतान, दूसरों में «पेज» के अनुसार)। शब्द गणना निर्दिष्ट करने वाली पहली अंग्रेज़ी शैली गाइड शायद Strunk & White की «The Elements of Style» (1918) थी, जिसने 250-300 शब्दों को एक विशिष्ट पैराग्राफ अधिकतम के रूप में निर्धारित किया।
शब्द गणना टाइपराइटर के साथ यांत्रिक हो गई: एक मानक टाइप किया गया पांडुलिपि पृष्ठ ~250 शब्दों का होता था (12-पॉइंट Courier, डबल-स्पेस्ड, 1-इंच मार्जिन)। यह अभी भी प्रकाशन में «मानक पांडुलिपि पृष्ठ» है, उपन्यासकार प्रति शब्द पुस्तक अग्रिमों पर बातचीत करते हैं, और एक प्रकाशित पृष्ठ ~250 शब्दों की पांडुलिपि के अनुरूप है।
Microsoft Word ने Word 95 (1995) में एक अंतर्निहित शब्द काउंटर जोड़ा, जिससे यह तत्काल हो गया बजाय इसके कि आप मैन्युअल रूप से ट्रैक करें। वेब-आधारित शब्द काउंटर 1990 के दशक के अंत में दिखाई दिए। आज, हर लेखन उपकरण (Google Docs, Notion, Obsidian, VS Code, Word, Pages) में लाइव शब्द गणना है; जब आप एक संपादक के बिना पाठ चिपकाते हैं तो समर्पित ब्राउज़र-आधारित काउंटर मौजूद हैं।
बुनियादी गणना से परे
अच्छे शब्द काउंटर आपको केवल एक संख्या से अधिक देते हैं:
पठन समय: लगभग 200-250 शब्द प्रति मिनट का अनुमान। ब्लॉग पोस्ट और लेखों के लिए उपयोगी ताकि पाठकों को पता चले कि वे क्या प्रतिबद्ध कर रहे हैं।
कीवर्ड घनत्व: कुल शब्दों के प्रतिशत के रूप में विशिष्ट शब्द कितनी बार दिखाई देते हैं। SEO के लिए महत्वपूर्ण: आप चाहते हैं कि आपका लक्ष्य कीवर्ड स्वाभाविक रूप से (1-2% घनत्व) बिना भरने के दिखे।
वाक्य और पैराग्राफ गणना: आपके लेखन की संरचना का मूल्यांकन करने में मदद करता है। छोटे पैराग्राफ (2-4 वाक्य) स्क्रीन पर पढ़ना आसान होता है।
औसत शब्द लंबाई: कम औसत शब्द लंबाई आमतौर पर आसान पढ़ने का मतलब है। Hemingway का प्रति शब्द औसत 4.2 अक्षर था; शैक्षणिक पेपर अक्सर 5.5+ औसत होते हैं।
सबसे अधिक उपयोग किए गए शब्द: आवृत्ति के अनुसार शीर्ष शब्द दिखाता है। दोहराव को पकड़ने या अपने «संकेत» शब्दों को खोजने के लिए उपयोगी (लेखक अनजाने में कुछ शब्दों का अति प्रयोग करते हैं)।
पठनीयता स्कोर: Flesch-Kincaid (US), Gunning Fog, SMOG, Coleman-Liau ग्रेड-स्तर अनुमान देते हैं। अधिकांश समाचार पत्र 8वीं कक्षा के पठन स्तर का लक्ष्य रखते हैं; कॉर्पोरेट दस्तावेज़ अक्सर 12+ हिट करते हैं।
«शब्द» के रूप में क्या गिना जाता है
शब्द की परिभाषा आपकी अपेक्षा से अधिक भिन्न होती है:
- रिक्त स्थान-विभाजित: अधिकांश काउंटर पाठ को रिक्त स्थान से विभाजित करते हैं। «It's» 1 शब्द है; «well-being» 1 शब्द है (हाइफ़न जुड़ता है); «U.S.A.» 1 शब्द है (कोई रिक्त स्थान नहीं)।
- यौगिक गणना: कुछ शैली गाइड हाइफ़न युक्त शब्दों को 2 के रूप में गिनते हैं («twenty-five» → 2 शब्द)। अधिकांश काउंटर ऐसा नहीं करते।
- संख्याएँ: «1,000,000» आमतौर पर 1 शब्द है। «1 million» 2 शब्द हैं।
- संक्षेपण: «FAQ» 1 शब्द है। «F.A.Q.» भी 1 शब्द है (कोई आंतरिक रिक्त स्थान नहीं)।
- इमोजी: आमतौर पर प्रत्येक 1 शब्द, लेकिन कुछ काउंटर उन्हें 0 (गैर-पाठ) या उनके ग्राफीम क्लस्टर आकार के अनुसार गिनते हैं (जो त्वचा-टोन संशोधक के लिए 4+ कोडपॉइंट हो सकते हैं)।
- CJK भाषाएँ: चीनी, जापानी, कोरियाई पाठ शब्दों के बीच रिक्त स्थान का उपयोग नहीं करता। शुद्ध वर्ण गणना (या वर्ण-जोड़ी गणना) शब्द गणना का अनुमान लगाती है। कुछ काउंटर उचित शब्द विभाजन का उपयोग करते हैं; अधिकांश वर्ण गणना पर वापस आ जाते हैं।
उपकरणों में सुसंगत शब्द गणना के लिए, एक ही पाठ को कई काउंटरों में चिपकाएँ और वह चुनें जो आपके लक्ष्य प्लेटफ़ॉर्म की गणना से मेल खाता हो।
Unicode और इमोजी मुश्किलें
आधुनिक पाठ गणना को Unicode को सही ढंग से संभालना चाहिए:
- संयोजन वर्ण: «é» एक कोडपॉइंट (U+00E9) या दो (U+0065 + U+0301 संयोजन तीव्र उच्चारण) हो सकता है। दोनों समान रूप से दिखाई देते हैं। एक भोली वर्ण गणना एन्कोडिंग के आधार पर 1 या 2 देती है।
- सरोगेट जोड़े: इमोजी और दुर्लभ वर्ण 2 UTF-16 कोड इकाइयों का उपयोग करते हैं। JavaScript का
.length«😀» के लिए 2 लौटाता है जब तक आप[...str].length(जो 1 लौटाता है) का उपयोग नहीं करते। Twitter, Discord और अधिकांश प्लेटफ़ॉर्म ग्राफीम क्लस्टर द्वारा गिनते हैं। - त्वचा-टोन संशोधक: 👍🏽 एक उपयोगकर्ता-समझा हुआ वर्ण है लेकिन 2 कोडपॉइंट (अंगूठा + टोन संशोधक)। 👨👩👧👦 जैसे परिवार इमोजी 7+ कोडपॉइंट हो सकते हैं।
- शून्य-चौड़ाई जोड़क: 👨💻 (आदमी + ZWJ + लैपटॉप) जैसी इमोजी अनुक्रम शून्य-चौड़ाई जोड़क का उपयोग करते हैं। कोडपॉइंट द्वारा विभाजन अधिक गिनता है।
- दाएँ-से-बाएँ पाठ: अरबी और हिब्रू दिशात्मक नियंत्रण वर्ण जोड़ते हैं जो सीमाओं की ओर गिनते हैं लेकिन अदृश्य हैं।
एक अच्छा काउंटर इन सभी को सही ढंग से संभालने के लिए Intl.Segmenter API (ब्राउज़र-नेटिव, 2022 से) का उपयोग करता है।
सामान्य कठिनाइयाँ
- Twitter Premium «लॉन्ग पोस्ट» ट्वीट अलग गिनते हैं: 25,000 वर्ण सीमा, लेकिन मीडिया (छवियाँ, वीडियो) निःशुल्क स्तर पर सीमा की ओर गिनती है और भुगतान पर कोई प्रभाव नहीं डालती।
- SMS मल्टी-सेगमेंट संदेशों की लागत अधिक है: 160 वर्णों से अधिक SMS कई खंडों में विभाजित होता है, प्रत्येक अलग-अलग शुल्क लिया जाता है। एक काउंटर का उपयोग करें जो मल्टी-सेगमेंट को फ़्लैग करता है।
- GSM-7 बनाम Unicode SMS: GSM-7 एन्कोडिंग में SMS प्रति खंड 160 वर्ण की अनुमति देता है; Unicode (कोई भी गैर-लैटिन वर्ण) सीमा को प्रति खंड 70 तक कम कर देता है। एक एकल इमोजी या उच्चारण वाला अक्षर आपकी SMS लागत को कई गुना बढ़ा सकता है।
- केवल रिक्त स्थान «खाली» पाठ: केवल रिक्त स्थान, टैब या नई लाइनों वाला पाठ वर्ण गिनता है लेकिन शून्य शब्द। गलती से चिपकाए गए रिक्त स्थान को पहचानने का आसान तरीका।
- Markdown मार्कअप पाठ के रूप में गिना जाता है: शब्द काउंटर आमतौर पर कच्चे Markdown को गिनते हैं, जिसमें
**बोल्ड**मार्कर और[लिंक पाठ](url)सिंटैक्स शामिल हैं। यदि आपका प्लेटफ़ॉर्म Markdown को सादे पाठ में रेंडर करता है, तो दृश्य वर्ण गणना स्रोत गणना से छोटी है। - छिपे ट्रैकिंग वर्ण: स्पैम-लड़ाई उपकरण कभी-कभी कॉपी-पेस्ट का पता लगाने के लिए अदृश्य ट्रैकिंग वर्ण (शून्य-चौड़ाई रिक्त स्थान, शून्य-चौड़ाई जोड़क) जोड़ते हैं। ये प्लेटफ़ॉर्म सीमाओं की ओर गिने जाते हैं।
सुझाव
- पहले लिखें, बाद में गिनें: वर्ण सीमाओं को अपने पहले मसौदे को प्रतिबंधित न करने दें। स्वतंत्र रूप से लिखें, फिर फिट करने के लिए ट्रिम करें।
- पोस्ट करने से पहले जाँचें: प्रकाशन से पहले अपनी सोशल मीडिया पोस्ट को एक काउंटर में चिपकाएँ। बीच वाक्य में काटा जाना अव्यवसायिक दिखता है।
- ब्लॉग पोस्ट के लिए पठन समय का उपयोग करें: अपने लेखों में «5 मिनट का पठन» जोड़ने से पाठक की अपेक्षाएँ निर्धारित होती हैं और सहभागिता बढ़ सकती है।
- अदृश्य वर्णों पर ध्यान दें: कुछ पाठ संपादक छिपे वर्ण (शून्य-चौड़ाई रिक्त स्थान, गैर-तोड़ने वाले रिक्त स्थान) जोड़ते हैं जो सीमाओं की ओर गिने जाते हैं लेकिन अदृश्य हैं। एक वर्ण काउंटर इनको प्रकट करता है।
- सामग्री प्रकार के अनुसार शब्द गणना लक्षित करें: लंबे ब्लॉग पोस्ट के लिए 1,500-2,500 शब्द (SEO स्वीट स्पॉट), न्यूज़लेटर लेखों के लिए 500-800, उत्पाद विवरण के लिए 300-500, विज्ञापन शीर्षकों के लिए 50-150।
- एक पठन-स्तर जाँचकर्ता के साथ जोड़ें: केवल शब्द गिनना आपको यह नहीं बताता कि आपका लेखन स्पष्ट है या नहीं। एक पठनीयता स्कोर (Flesch-Kincaid, Hemingway) यह बताता है कि आपका पाठ आपके दर्शकों के पठन स्तर से मेल खाता है या नहीं।
गोपनीयता और गोपनीय पाठ
शब्द काउंटर पूरी तरह से आपके ब्राउज़र में चलता है। आप जो पाठ चिपकाते हैं, उत्पन्न आँकड़े और कोई भी कस्टम सेटिंग्स सभी आपके डिवाइस पर रहते हैं। कुछ भी सर्वर पर अपलोड नहीं किया जाता, लॉग नहीं किया जाता या किसी के साथ साझा नहीं किया जाता।
यह मायने रखता है क्योंकि पाठ इनपुट अक्सर गोपनीय होते हैं: ग्राहकों को मसौदा ईमेल, गोपनीय कानूनी पत्राचार, आंतरिक कंपनी लेखन, व्यक्तिगत जर्नल प्रविष्टियाँ, अप्रकाशित पुस्तकों के मसौदा अध्याय। क्लाउड शब्द काउंटर अपने सर्वर अनुरोधों में आपके पाठ को लॉग करते हैं, कभी-कभी «सुधार» या एनालिटिक्स के लिए इसे बनाए रखते हैं। संवेदनशील लेखन के लिए, एक केवल-ब्राउज़र काउंटर में शून्य एक्सपोज़र है: चिपकाएँ, गणना देखें, टैब बंद करें, चला गया।
ब्राउज़र-आधारित गणना पृष्ठ लोड होने के बाद ऑफ़लाइन भी काम करती है, यात्रा करते समय या कम-कनेक्टिविटी वाले वातावरण में लिखते समय उपयोगी है।
अक्सर पूछे जाने वाले प्रश्न
रिक्त स्थान के साथ और बिना वर्णों में क्या अंतर है?
रिक्त स्थान के साथ वर्ण सभी वर्ण गिनते हैं, जिसमें शब्दों के बीच के रिक्त स्थान शामिल हैं। बिना रिक्त स्थान के, केवल अक्षर, अंक और विराम चिह्न गिने जाते हैं। कुछ प्लेटफ़ॉर्म एक तरह से गिनते हैं, अन्य दूसरे तरह से, Twitter/X रिक्त स्थान गिनता है, SMS भी।
पठन समय की गणना कैसे की जाती है?
पठन समय आमतौर पर एक औसत वयस्क के लिए प्रति मिनट 200-250 शब्दों पर अनुमानित है। 1,000 शब्दों वाले एक लेख को पढ़ने में लगभग 4 से 5 मिनट लगते हैं।
क्या काउंटर अन्य भाषाओं के साथ काम करता है?
हाँ। शब्द और वर्ण काउंटर सभी भाषाओं और Unicode वर्णों का समर्थन करते हैं, जिसमें चीनी, जापानी, कोरियाई, अरबी, इमोजी और उच्चारण वाले वर्ण शामिल हैं।
क्या मेरा टेक्स्ट कहीं संग्रहीत या भेजा जाता है?
नहीं। सारी गिनती आपके ब्राउज़र में होती है। आपका टेक्स्ट कभी आपके डिवाइस से बाहर नहीं जाता।