मुफ़्त शब्द और वर्ण काउंटर ऑनलाइन
शब्द गणना, वर्ण गणना, वाक्य, पैराग्राफ और अनुमानित पढ़ने का समय तुरंत देखने के लिए नीचे अपना टेक्स्ट पेस्ट या टाइप करें।
इस टूल के बारे में
यह मुफ़्त शब्द काउंटर छात्रों, लेखकों, ब्लॉगर्स और सोशल मीडिया प्रबंधकों के लिए एकदम सही है। निबंध, ट्वीट, Instagram कैप्शन और अधिक के लिए तुरंत शब्द गिनें। पढ़ने का समय 200 शब्द प्रति मिनट की औसत पढ़ने की गति पर आधारित है।
सामान्य शब्द गणना सीमाएँ
सामान्य सीमाओं को जानने से आपको अपने लक्ष्य तक पहुँचने में मदद मिलती है:
- Twitter/X पोस्ट · 280 वर्ण
- Instagram कैप्शन · 2,200 वर्ण
- Meta विवरण (SEO) · 155-160 वर्ण
- कॉलेज निबंध · आमतौर पर 250-650 शब्द
- ब्लॉग पोस्ट (SEO) · रैंकिंग के लिए 1,500-2,500 शब्द
- लघु कथा · 1,000-7,500 शब्द
अक्सर पूछे जाने वाले प्रश्न
पढ़ने का समय कैसे गणना किया जाता है?
हम 200 शब्द प्रति मिनट के मानक औसत का उपयोग करते हैं। यह गैर-तकनीकी सामग्री के लिए वयस्क पढ़ने की गति के लिए व्यापक रूप से स्वीकृत औसत है।
एक शब्द के रूप में क्या गिना जाता है?
व्हाइटस्पेस द्वारा अलग किए गए वर्णों का कोई भी क्रम एक शब्द के रूप में गिना जाता है। "well-known" जैसे हाइफ़नयुक्त शब्द एक शब्द के रूप में गिने जाते हैं। संख्याएँ और संक्षिप्ताक्षर भी गिने जाते हैं।
क्या मेरा टेक्स्ट कहीं सेव किया जाता है?
नहीं। सब कुछ आपके ब्राउज़र में होता है। आपका टेक्स्ट कभी भी किसी सर्वर पर नहीं भेजा जाता या कहीं संग्रहीत नहीं किया जाता। टैब बंद करें और यह चला जाता है।
एक शब्द के रूप में, ठीक-ठीक क्या गिना जाता है?
Microsoft Word, Google Docs, Pages, Unix की wc कमांड और लगभग हर ब्राउज़र-आधारित काउंटर एक ही नियम पर सहमत हैं: एक शब्द ग़ैर-स्पेस वर्णों का अधिकतम क्रम है, जो पड़ोसी क्रमों से स्पेस द्वारा अलग होता है। wc के लिए POSIX मानक एक शब्द को «स्पेस से सीमित मुद्रण योग्य वर्णों का ग़ैर-शून्य लंबाई वाला अनुक्रम» के रूप में परिभाषित करता है, वही नियम जो चार-पंक्ति का JavaScript कार्यान्वयन (text.trim().split(/\s+/).length) देता है। यह शुद्ध रूप से यांत्रिक है: यह न आकृति-विज्ञान समझता है, न विराम चिह्न, न भाषा। «Hello world» दो शब्द हैं; बिना स्पेस का «Hello,world» एक है। «Don't» एक शब्द है; «do n't» दो हैं।
एक भाषाविद् इसे चुनौती देगा। Oxford English Dictionary graphemic word (स्पेस से बंधे अक्षरों का अनुक्रम) और lexeme (एक अमूर्त शब्दकोश प्रविष्टि) के बीच अंतर करती है। दोनों आम मामलों में अलग-अलग हो जाते हैं:
- हाइफ़न युक्त समास। «State-of-the-art» एक शब्द है, टोकन के अंदर कोई स्पेस नहीं है। Microsoft Word, Google Docs और यह काउंटर सब सहमत हैं।
- संकुचन। «Don't», «won't», «it's», «you'd've» हर एक एक शब्द गिने जाते हैं। apostrophe को टोकन का हिस्सा माना जाता है, मानक अंग्रेज़ी प्रयोग के अनुसार।
- संख्याएँ और दशमलव। «3.14» एक है; «3 . 14» तीन है। «1,000,000» एक है; «1 000 000» (यूरोपीय परंपरा) तीन है।
- संक्षिप्त रूप। «U.S.A.» एक शब्द है; «U S A» तीन है। «NATO» एक है। «Ph.D.» एक है।
- URL और ईमेल। «https://absolutool.com/tools» किसी भी स्पेस-स्प्लिट काउंटर में एक शब्द है।
साधारण गद्य के लिए, इस नियम और एक सावधान मानव गणक के बीच असहमति आम तौर पर एक प्रतिशत से कम होती है। अत्यधिक समस्त, हाइफ़न-समृद्ध या संख्या-समृद्ध पाठ के लिए यह 5-15% तक पहुँच सकती है। स्पेस नियम से परे, Unicode एक औपचारिक Word Boundary एल्गोरिद्म (UAX #29) प्रकाशित करता है, एक 14-नियम स्थिति मशीन जो वर्ण श्रेणियों के आधार पर शब्द सीमाओं को पहचानती है। JavaScript इसे {granularity: 'word'} के साथ Intl.Segmenter के माध्यम से उजागर करता है, और बिना शब्दकोश के चीनी, जापानी, थाई या ख़मेर में शब्द गिनने का यही एकमात्र सही रास्ता है।
वे भाषाएँ जो स्पेस का उपयोग नहीं करतीं
चीनी, जापानी (शुद्ध कांजी या कांजी + हीरागाना में), थाई, लाओ, ख़मेर, बर्मी और तिब्बती बिना अंतर-शब्द स्पेस के लिखी जाती हैं, इस परंपरा को scriptio continua कहते हैं। एक चीनी अनुच्छेद पर स्पेस-टोकनाइज़र चलाएँ तो वह 1 लौटाता है, पूरे अनुच्छेद को एक ही «शब्द» के रूप में। इन लिपियों के लिए सार्थक मेट्रिक वर्ण-गिनती है, शब्द-गिनती नहीं।
पेशेवर अनुवाद में, अंगूठे का नियम लगभग है एक चीनी वर्ण ≈ 1.5-2.0 अंग्रेज़ी शब्द; दो जापानी वर्ण ≈ एक अंग्रेज़ी शब्द; एक कोरियाई वर्ण ≈ 0.55 अंग्रेज़ी शब्द। चीनी-से-अंग्रेज़ी अनुवादक आम तौर पर चीनी पक्ष के स्रोत वर्णों की संख्या से और अंग्रेज़ी पक्ष के लक्ष्य शब्दों की संख्या से बिल बनाते हैं। पूर्व एशियाई लिपियों में अद्वितीय रूप से, कोरियाई शब्द-स्पेसिंग का उपयोग करती है (띄어쓰기, ttuieosseugi), इसलिए स्पेस टोकनाइज़ेशन काम करता है, लेकिन स्पेसिंग नियम कुख्यात रूप से कठिन हैं और किनारे के मामलों पर मूल वक्ता भी असहमत हैं।
लेखकों को प्रति-शब्द भुगतान का संक्षिप्त इतिहास
प्रति-शब्द भुगतान उन्नीसवीं सदी के अंत के मास-सर्कुलेशन पत्रिकाओं से शुरू हुआ। 1920 और 1930 के दशक तक pulp पत्रिकाएँ, Black Mask, Weird Tales, Astounding, Argosy, प्रति शब्द दर पर भुगतान करती थीं, एक चौथाई सेंट से दो सेंट तक। Raymond Chandler ने 1930 के दशक में Black Mask से प्रसिद्ध रूप से प्रति शब्द एक पैसा पाया था। मॉडल आज भी जीवित है: penny-stock content mills प्रति शब्द 0.01-0.05 USD देती हैं, मध्य-स्तरीय व्यावसायिक पत्रिकाएँ 0.30-0.75 USD देती हैं, और शीर्ष-स्तरीय अमेरिकी glossies (The New Yorker, The Atlantic, Wired, Harper's) प्रति शब्द 1-3 USD देती हैं, उच्च-प्रोफ़ाइल फ़ीचर के लिए कभी-कभी अधिक।
क्योंकि सीमा संविदात्मक है, सटीक शब्द-गिनती जानना आय है। प्रति शब्द 1 USD पर एक 1 500-शब्द फ़ीचर 1 500 USD है; 1 400 पर वह 1 400 है। संपादक सीमा लागू करते हैं, 2 000-शब्द कमीशन का मतलब 1 950-2 050 है, 2 400 नहीं, और सीमा को चूकना फ़्लैट-दर कटौती या kill-fee का अर्थ हो सकता है।
उपन्यास शब्द-गिनतियाँ और दैनिक-शब्द आदत
प्रकाशन व्यवसाय में वयस्क उपन्यासों के लिए लक्ष्य शब्द-गिनतियाँ उल्लेखनीय रूप से सुसंगत हैं। वयस्क साहित्यिक कथा 80 000-100 000 शब्दों पर उतरती है; वाणिज्यिक थ्रिलर, रहस्य और रोमांस 70 000-90 000 पर; महाकाव्य फ़ैंटेसी और साइ-फ़ाई 100 000-120 000 पर (कभी-कभी 150 000+)। Young Adult 50 000-80 000 है, Middle Grade 25 000-55 000, picture books 100-500, novellas 17 500-40 000, short stories 1 000-7 500, flash fiction 1 000 से कम। एजेंट इन सीमाओं के बहुत बाहर के पहले उपन्यासों के queries गुणवत्ता की परवाह किए बिना अस्वीकार करेंगे, पारंपरिक सीमाएँ पाठक की अपेक्षा और प्रिंटिंग-प्रेस अर्थशास्त्र को कोडित करती हैं।
National Novel Writing Month, जिसकी स्थापना 1999 में Chris Baty ने की, नवंबर के लिए 50 000 शब्दों का लक्ष्य रखता है, मोटे तौर पर The Great Gatsby (50 061) और Slaughterhouse-Five (49 459) की लंबाई के बराबर। यह तीस दिनों के लिए प्रतिदिन 1 667 शब्द बनता है। Stephen King On Writing में प्रति दिन 2 000 शब्दों की सिफ़ारिश करते हैं; Anthony Trollope अपनी डाकघर की नौकरी पर जाने से पहले प्रति दिन 3 000 लिखते थे; Graham Greene कथित तौर पर ठीक 500 शब्दों पर रुक जाते थे; Mark Twain का लक्ष्य 1 400 था। दैनिक-शब्द आदत वही चीज़ है जो «मेरे पास एक विचार है» को «मैं N दिनों में पूरा कर लूँगा» में बदलती है। प्रति दिन 1 000 शब्दों पर 90 000-शब्द उपन्यास 90 दिन है।
शैक्षणिक और जर्नल शब्द-गिनतियाँ
अमेरिकी और ब्रिटिश उच्च शिक्षा के लिए असाइनमेंट लंबाइयाँ आम तौर पर इस तरह हैं: हाई-स्कूल निबंध 300-1 000 शब्द; विश्वविद्यालय निबंध (मानविकी) 1 500-3 000; टर्म पेपर 3 000-6 000; honours thesis 12 000-20 000; मास्टर्स thesis 20 000-40 000; पीएच.डी. dissertation मानविकी में 80 000-100 000 (विज्ञान में अक्सर छोटा, 40 000-60 000)। Common App व्यक्तिगत वक्तव्य की सीमा 650 शब्द है, आवेदन पोर्टल इसे लागू करता है। यूके में UCAS व्यक्तिगत वक्तव्य की सीमा 4 000 वर्ण या 47 पंक्तियाँ है, जो भी छोटा हो। अधिकांश विश्वविद्यालय निबंध सीमा को ±10% सहिष्णुता के साथ लागू करते हैं।
जर्नल लेख 500-1 500 शब्दों के letter, 1 500-3 000 शब्दों के brief, 4 000-8 000 शब्दों के मानक शोध लेख, से 6 000-12 000 शब्दों की समीक्षा तक चलते हैं। Nature Letters 3 000 शब्दों पर सीमित है; JAMA Original Investigation तीन-पैराग्राफ़ सार के साथ 3 000 पर; PNAS Direct Submission छह मुद्रित पृष्ठों पर, लगभग 6 000 शब्द।
याद रखने योग्य सोशल-मीडिया वर्ण सीमाएँ
- X/Twitter पोस्ट: 280 वर्ण (मार्च 2006 में लॉन्च के समय मूल रूप से 140; नवंबर 2017 में दोगुना होकर 280)। X Premium ग्राहक फ़रवरी 2023 से 25 000 वर्ण तक पोस्ट कर सकते हैं। URL अंतर्निहित लंबाई की परवाह किए बिना हमेशा 23 वर्ण गिने जाते हैं, इमोजी 2 गिने जाते हैं, CJK वर्ण 2 गिने जाते हैं।
- Bluesky: 300 वर्ण।
- Threads (Meta): 500 वर्ण।
- LinkedIn पोस्ट: 3 000 वर्ण; «देखें और» से पहले पहले ~210 (डेस्कटॉप) या ~140 (मोबाइल) दिखाई देते हैं।
- Instagram कैप्शन: 2 200 वर्ण 125-वर्ण पूर्वावलोकन के साथ।
- TikTok कैप्शन: 4 000 वर्ण।
- SMS GSM-7: प्रति सेगमेंट 160 वर्ण; UCS-2 (ग़ैर-लैटिन वर्णमालाओं के लिए) 70 तक गिर जाता है।
- Google meta description: डेस्कटॉप पर ट्रंकेशन से पहले लगभग 155-160 वर्ण, मोबाइल पर ~120।
- Google title-tag: डेस्कटॉप पर लगभग 50-60 वर्ण या लगभग 600 पिक्सेल।
वाक्य विभाजन एक period पर बँटने से कठिन है
भोला नियम, ., !, ? पर बँटना, पहले अनुच्छेद के अंदर ही हर वास्तविक अंग्रेज़ी पाठ पर विफल हो जाता है। «Dr. Smith met Mr. Jones at U.S. Steel» एक वाक्य है; भोला विभाजन चार लौटाता है। «J. R. R. Tolkien wrote The Hobbit» एक है; भोला चार लौटाता है। «The pH of 7.4 is normal» एक है; भोला दो लौटाता है। डोमेन नाम («Visit absolutool.com.») और ईमेल झूठे सकारात्मक बनाते हैं; अंडाकार («Wait...what?») झूठे नकारात्मक बनाते हैं।
मज़बूत विभाजन को या तो एक क्यूरेटेड संक्षिप्त रूप सूची चाहिए (NLTK के Punkt segmenter द्वारा अपनाया गया तरीक़ा, जिसे Kiss और Strunk के 2006 के पेपर ने एक मिलियन-शब्द कॉर्पस पर F1 ≈ 0.97 तक प्रशिक्षित किया) या एक सांख्यिकीय मॉडल। एक ब्राउज़र-आधारित काउंटर के लिए, व्यावहारिक समझौता है [.!?]+ के बाद whitespace और एक बड़े अक्षर पर बँटना, एक छोटी संक्षिप्त रूप ब्लैकलिस्ट (Mr|Mrs|Dr|Prof|Sr|Jr|St|Inc|Ltd|U.S|e.g|i.e|etc|vs) के साथ। उससे भी, शोरीले पाठ पर सटीकता लगभग 90% पर सीमित होती है। वाक्य गिनती को अनुमानित मानें।
पठनीयता सूत्र, प्रत्येक एक अनुच्छेद में
Flesch Reading Ease (1948)। Rudolf Flesch का सूत्र: 206.835 − 1.015 × (शब्द/वाक्य) − 84.6 × (शब्दांश/शब्द)। उच्चतर का अर्थ आसान। 0-30 «बहुत कठिन, कॉलेज स्नातक» है; 60-70 «सादी अंग्रेज़ी, आठवीं-नौवीं कक्षा» है; 90-100 «बहुत आसान, पाँचवीं कक्षा» है। Reader's Digest ~65 का लक्ष्य रखती है; Time ~52 का; Harvard Law Review 30 के आसपास चलती है।
Flesch-Kincaid Grade Level (1975)। तकनीकी-मैनुअल पठनीयता के लिए अमेरिकी नौसेना ने J. Peter Kincaid से कमीशन किया: 0.39 × (शब्द/वाक्य) + 11.8 × (शब्दांश/शब्द) − 15.59। आउटपुट एक अमेरिकी ग्रेड स्तर है (8.0 = आठवीं कक्षा)। अब Microsoft Word के स्पेल-चेक में सन्निहित है और कॉपीराइटिंग में सबसे अधिक उद्धृत पठनीयता मेट्रिक है।
SMOG (1969)। Harry McLaughlin का «Simple Measure of Gobbledygook» पाठ की शुरुआत, मध्य और अंत से दस लगातार वाक्यों में केवल तीन या अधिक शब्दांशों वाले शब्दों को गिनता है। अमेरिकी National Institutes of Health ने स्वास्थ्य रोगी पुस्तिकाओं के लिए इसे प्राथमिकता दी क्योंकि यह स्वास्थ्य पाठ पर वास्तविक समझ के साथ Flesch-Kincaid से बेहतर सहसंबंध रखता है।
Gunning Fog (1952)। Robert Gunning का सूचकांक: 0.4 × ((शब्द/वाक्य) + 100 × (जटिल_शब्द/शब्द))। The Wall Street Journal Fog ~11 का लक्ष्य रखती है; लंदन का Times ~14। Gunning का दावा यह था कि Fog 12 से ऊपर का कोई भी व्यावसायिक लेखन पाठक खो देगा।
पढ़ने का और बोलने का समय, संख्याएँ कहाँ से आती हैं
यह काउंटर पढ़ने का समय प्रति मिनट 200 शब्द पर और बोलने का समय प्रति मिनट 130 शब्द पर दिखाता है। 200-wpm आँकड़ा Marc Brysbaert के 2019 के 190 अध्ययनों के मेटा-विश्लेषण की तुलना में रूढ़िवादी है, जिसने ग़ैर-कथा के लिए 238 wpm और कथा के लिए 260 wpm पर अभिसरण किया (Journal of Memory and Language)। हल्के से धीमे की ओर ग़लती करना उपयोगकर्ता-अनुकूल चुनाव है, बेहतर है कि एक «पाँच मिनट का पठन» सात मिनट के बजाय चार मिनट का हो। 130-wpm बोलने की दर बातचीत वाली बोली से मेल खाती है; औपचारिक भाषण औसतन 100-130 wpm होते हैं। बीस मिनट का keynote मोटे तौर पर 2 600 बोले गए शब्द हैं। Medium की «X min read» सुविधा, जिसे 2014 में Mike Sall ने पेश किया, मूल रूप से 275 wpm पर अंशांकित थी।
क्यों आपकी गिनती Word से भिन्न है
तीन सामान्य कारण: (1) Microsoft Word और Google Docs हाइफ़न युक्त शब्दों को एक मानते हैं (इस काउंटर से मेल खाते हुए), लेकिन कुछ PHP-आधारित काउंटर हर ग़ैर-अक्षर पर बँटते हैं और «well-known» के लिए दो लौटाते हैं। (2) Word से चिपकाना अदृश्य वर्ण लाता है, घुमावदार उद्धरण, बिना तोड़ने वाले स्पेस (U+00A0), soft hyphens (U+00AD), जो उपकरण के अनुसार टोकन को खंडित या जोड़ सकते हैं। (3) अद्वितीय-शब्द गिनतियाँ डिफ़ॉल्ट रूप से case-संवेदी हैं, इसलिए «The» और «the» दो अलग-अलग अद्वितीय शब्द गिने जाते हैं; case हटाना और stemming («running» → «run») करना विशिष्ट गद्य पर अद्वितीय गिनती को लगभग 15% कम कर देगा।
यदि आपका चीनी या जापानी पाठ शून्य (या एक) शब्द दिखाता है, तो यह स्पेस-टोकनाइज़र वही कर रहा है जो उसे बताया गया है, अपना ध्यान वर्ण-गिनती पर डालें, जो उन लिपियों के लिए सार्थक मेट्रिक है। यदि «3,000» एक शब्द गिना जाता है, तो ऐसा इसलिए है क्योंकि अल्पविराम ग़ैर-स्पेस है और टोकन सतत है; यह सही व्यवहार है और Word से मेल खाता है।
और प्रश्न
पठनीयता स्कोर कितना सटीक है?
पठनीयता सूत्र शब्द-प्रति-वाक्य और शब्दांश-प्रति-शब्द से जटिलता का अनुमान लगाते हैं, वे वास्तव में नहीं समझते कि आपका गद्य अच्छा है या नहीं। «आठवीं कक्षा» का स्कोर का अर्थ है आठवीं कक्षा के पठन-सामग्री के विशिष्ट वाक्य-लंबाई और शब्दांश-घनत्व प्रोफ़ाइल; यह स्पष्टता प्रमाणित नहीं करता। स्कोर को विवेक की जाँच के रूप में उपयोग करें, फ़ैसले के रूप में नहीं। Hemingway लगभग ग्रेड 4 पर अंक पाते हैं; King James Bible ग्रेड 8 के आसपास; The Wall Street Journal ग्रेड 11 के आसपास।
क्या यह काउंटर Markdown या HTML संभालता है?
यह textarea में जो भी है उसे यथावत गिनता है, जिसमें **bold**, # headers और <p> जैसे HTML टैग शामिल हैं। यदि आप केवल रेंडर किया गया पाठ गिनना चाहते हैं, तो पहले अपनी सामग्री को Markdown previewer या ब्राउज़र के Reader View में चिपकाएँ, फिर साफ़ किया गया पाठ यहाँ कॉपी करें। Hugo, Jekyll और 11ty सभी निर्मित पृष्ठों पर शब्द-गिनती की गणना करने से पहले front-matter और Markdown को हटा देते हैं।
एक सटीक शब्द-गिनती को छूने का सबसे अच्छा सुझाव क्या है?
अपने लक्ष्य से 10-15% आगे लिखें, फिर काटें। काटना भरने से बहुत आसान है, और कटौतियाँ लगभग हमेशा गद्य को मज़बूत बनाती हैं, क्योंकि हटाने में सबसे आसान चीज़ें ही सबसे कमज़ोर होती हैं। पारंपरिक संपादक की सलाह («अपने प्यारे को मार दो») तभी समझ में आती है यदि आपके पास मारने को प्यारे हों, जिसका मतलब है आपने उन्हें पहले लिखा है।
क्या मैं इसे क़ानूनी briefs और अदालत फ़ाइलिंग के लिए उपयोग कर सकता हूँ?
विवेक की जाँच के लिए हाँ, अमेरिकी सर्वोच्च न्यायालय याचिकाकर्ताओं के briefs को 13 000 शब्दों तक सीमित करता है और Federal Rule 32(a)(7)(B) अपीलीय briefs को 13 000 शब्दों तक सीमित करता है, दोनों स्पेस-गिने हुए। फ़ाइलिंग पर आवश्यक प्रमाणित शब्द-गिनती के लिए, Microsoft Word की गिनती का उपयोग करें (जिसे न्यायालय नाम से स्वीकार करते हैं) और इस उपकरण को मसौदा जाँच के रूप में मानें।