Emoji Unicode कनवर्टर

इमोजी को Unicode कोड पॉइंट (U+XXXX) में कनवर्ट करें या इमोजी प्राप्त करने के लिए कोड पॉइंट पेस्ट करें।

इमोजी → Unicode

Unicode → इमोजी

वर्ण विवरण

वर्ण विवरण देखने के लिए ऊपर एक इमोजी रूपांतरित करें।

कैसे उपयोग करें

  1. इमोजी या कोड पॉइंट दर्ज करें: इमोजी वर्ण पेस्ट करें या इसका Unicode कोड पॉइंट टाइप करें (जैसे U+1F600)।
  2. सभी प्रतिनिधित्व देखें: टूल दशमलव कोड, हेक्स मान, HTML एंटिटी, CSS एस्केप, UTF-8 बाइट्स आदि प्रदर्शित करता है।
  3. कोई भी प्रारूप कॉपी करें: HTML, CSS या JavaScript में उपयोग के लिए तुरंत कॉपी करने हेतु परिणाम पर क्लिक करें।

इमोजी Unicode कन्वर्टर क्यों इस्तेमाल करें?

इमोजी Unicode कोड पॉइंट के रूप में एन्कोड होते हैं, लेकिन अलग-अलग सिस्टम अलग-अलग प्रारूपों का उपयोग करते हैं। HTML को 😀 या 😀 एंटिटी की आवश्यकता होती है। CSS pseudo-element के लिए एस्केप्ड रूप \1F600 चाहिए। JavaScript स्ट्रिंग के लिए \u{1F600} चाहिए। इन्हें मैन्युअली ढूँढना धीमा है, यह टूल एक ही इमोजी इनपुट से तुरंत हर प्रारूप तैयार कर देता है। डेवलपर्स, डिज़ाइनर और कंटेंट क्रिएटर इसका उपयोग कोडबेस में इमोजी को सुरक्षित रूप से जोड़ने के लिए करते हैं, जहाँ कच्चे अक्षरों को सीधे कॉपी-पेस्ट करने से एन्कोडिंग समस्याएँ हो सकती हैं।

समर्थित आउटपुट प्रारूप

emoji का एक संक्षिप्त इतिहास, और वे भाग जो सभी गलत समझते हैं

Shigetaka Kurita को NTT DoCoMo में 1998-1999 में «पहला emoji» बनाने का श्रेय देने वाली origin story सबसे अधिक repeated है। वह कहानी सच है लेकिन अधूरी है। Kurita से पहले के दो developments का उल्लेख करना उचित है:

emoji बाकी दुनिया तक कैसे पहुँचे

Kurita के set के बाद एक दशक तक, emoji एक Japanese carrier phenomenon थे, तीन competing और incompatible vendor sets (DoCoMo, KDDI, SoftBank) के साथ। crossover तीन stages में हुआ:

Unicode Consortium का standardisation work parallel में चला। अक्टूबर 2010, Unicode 6.0 standard का पहला version था जिसने emoji को एक recognised set के रूप में add किया, Japanese carrier sets के union से लगभग 722 emoji contribute करते हुए। अगस्त 2014, Unicode Technical Report #51 प्रकाशित हुई (बाद में मई 2017 में UTS #51 में promoted), emoji को कैसे encode, sequence और present किया जाए इसकी formal specification।

अधिकांश emoji code points U+FFFF से ऊपर क्यों रहते हैं

Unicode हर character को 65,536 code points में से 17 «planes» में organize करता है। Plane 0 Basic Multilingual Plane (BMP) है, U+0000 से U+FFFF तक। अधिकांश everyday written language यहाँ रहती है। Planes 1-16 supplementary planes हैं (informally «astral planes»), U+10000 से U+10FFFF तक। अधिकांश emoji Plane 1, Supplementary Multilingual Plane में रहते हैं, specifically Emoticons (U+1F600-U+1F64F), Miscellaneous Symbols and Pictographs (U+1F300-U+1F5FF), Transport and Map Symbols (U+1F680-U+1F6FF), और Supplemental Symbols and Pictographs (U+1F900-U+1F9FF) जैसे blocks में। newer Symbols and Pictographs Extended-A block U+1FA70-U+1FAFF पर है।

यह developers के लिए UTF-16 की वजह से मायने रखता है। UTF-16, BMP code points को single 16-bit unit के रूप में encode करता है, लेकिन supplementary code points को surrogate pair के रूप में encode करना होगा: दो 16-bit units, एक high-surrogate range U+D800-U+DBFF से और एक low-surrogate range U+DC00-U+DFFF से। JavaScript का string type internally UTF-16 है, इसीलिए "😀".length 2 return करता है न कि 1: engine code units count कर रहा है, code points नहीं। Modern JS code grapheme clusters को correctly count करने के लिए Array.from("😀").length या Intl.Segmenter API का उपयोग करता है।

UTF-8 वही emoji को 4-byte sequence के रूप में handle करता है। character 😀 (U+1F600) UTF-8 में F0 9F 98 80 है। इसीलिए MySQL का पुराना utf8 charset (जो वास्तव में utf8mb3 है, 3-byte sequences तक capped) emoji store नहीं कर सकता, आपको utf8mb4 चाहिए। MySQL 8.0 ने utf8mb4 को default बनाया, लेकिन legacy databases अभी भी emoji store करने में fail होते हैं और SQL mode के आधार पर silently truncate या error करते हैं। यह एक frequent real-world bug है।

Variation selectors, एक ही heart काला या लाल क्यों दिख सकता है

कुछ Unicode characters की एक «dual personality» होती है: context के आधार पर वे plain monochrome text symbol या colourful emoji के रूप में दिख सकते हैं। Unicode 3.2 (मार्च 2002) में दो presentation selectors जोड़े गए: U+FE0F (Variation Selector-16, VS16) emoji presentation request करता है, और U+FE0E (VS15) text presentation request करता है। उदाहरण: (U+2764, «Heavy Black Heart») एक text-default symbol है; ❤️ (U+2764 U+FE0F) वह emoji-presentation red heart है जिसे अधिकांश apps colour में render करते हैं। VS16 के साथ और बिना VS16 के एक ही code point बिल्कुल अलग दिखता है।

एक प्रसिद्ध related example sun है। U+2600 «Black Sun With Rays» text-style monochrome पर default है; VS16 (U+2600 U+FE0F) जोड़ने पर colourful ☀️ मिलता है। इसके विपरीत, U+1F31E «Sun With Face» Unicode 6.0 (अक्टूबर 2010) में जोड़ा गया एक अलग code point है, default emoji presentation, और किसी selector की आवश्यकता के बिना smiling 🌞 render करता है। दो different code points, दो different histories, दोनों को informally «the sun emoji» कहा जाता है।

Skin-tone modifiers और Fitzpatrick scale

Unicode 8.0 (17 जून 2015 को released) में standard ने पाँच modifier characters जोड़े जो किसी भी human-presenting emoji का skin tone adjust करते हैं। modifiers Fitzpatrick scale पर based हैं, एक dermatological classification जो 1975 में Harvard में American dermatologist Thomas B. Fitzpatrick द्वारा विकसित की गई। medical scale में छह types (I से VI) हैं। emoji purposes के लिए, types I और II को एक single modifier में merge किया गया है, जिससे पाँच emoji modifiers बचते हैं:

usage positional है: modifier किसी supported human emoji के immediately बाद आता है। उदाहरण के लिए, 👋 (U+1F44B, waving hand) + U+1F3FD 👋🏽 produce करता है, medium-tone wave। यदि recipient का font कोई particular base+modifier combination support नहीं करता, तो modifier एक separate brown square के रूप में render होता है, पुराने systems पर एक common failure mode।

Zero-Width Joiner sequences, compound emoji कैसे बनाए जाते हैं

Zero-Width Joiner, code point U+200D, वह «glue» character है जो multiple emoji को एक composite glyph में combine करने देता है जब renderer sequence को recognize करता है। ZWJ invisible है और इसकी कोई width नहीं है, यह purely rendering engine को signal करने के लिए exists करता है कि surrounding characters को fuse होना चाहिए। तीन patterns dominate करते हैं:

Unicode 15.1 (12 सितंबर 2023 को released) में heavily उपयोग किया गया: 15.1 में 118 new emoji जोड़े गए, जिनमें से 108 existing emoji के directional variants थे (default left के बजाय right facing people)। महत्वपूर्ण बात, 15.1 ने zero new base code points जोड़े: हर new emoji existing components से built एक sequence था।

Keycaps, regional indicators, और flag mechanism

Keycap sequences। 1️⃣ जैसा keycap emoji तीन code points से built है: एक digit (U+0031 = «1»), VS16 (U+FE0F), और Combining Enclosing Keycap character U+20E3। combining keycap को 1999 में Unicode 3.0 के भाग के रूप में approve किया गया था। keycap emoji का full set 0-9 plus # और * cover करता है। three-character sequence naive .length checks को हमेशा trip up करता है।

Regional indicator pairs (flags)। Unicode national flags को single characters के रूप में encode नहीं करता। इसके बजाय, यह 26 Regional Indicator Symbols define करता है, code points U+1F1E6 से U+1F1FF तक, प्रत्येक Latin letter A से Z के corresponding। एक flag regional indicators की एक pair है जो ISO 3166-1 alpha-2 country code spell करती है। French flag 🇫🇷 U+1F1EB U+1F1F7 है: regional-indicator letters F और R। 26 × 26 = 676 possible pairs में से, केवल लगभग 270 valid ISO country codes के corresponding हैं; बाकी अधिकांश platforms पर दो letter symbols के रूप में render होते हैं।

हाल के emoji versions, संक्षेप में

Vendor designs, एक ही code point, अलग artwork

Unicode meaning और code point को standardise करता है, artwork को कभी नहीं। हर platform अपना emoji font ship करता है, और visual differences इतने real हैं कि academic studies (Hecht et al., CSCW 2018, cross-platform emoji misinterpretation पर) में documented miscommunication cause हुई है। major fonts:

जब किसी device का font किसी particular code point या sequence के लिए कोई glyph नहीं रखता, तो browsers और operating systems एक blank rectangle display करते हैं, जिसे commonly tofu कहा जाता है। Tofu सबसे मजबूत possible signal है कि recipient का device sender के device से पुराना है। New emoji आमतौर पर एक Unicode release से सभी major platforms तक propagate होने में छह से अठारह महीने लेते हैं।

Accessibility, content authors को क्या जानना चाहिए

Modern screen readers (NVDA, JAWS, VoiceOver, TalkBack) Unicode Common Locale Data Repository से हर emoji का CLDR short name read करते हैं, उदाहरण के लिए 😀 के लिए «grinning face», 👨‍👩‍👧‍👦 के लिए «family: man, woman, girl, boy»। Unicode CLDR 90+ languages में official short names और keywords maintain करता है, जिसे Apple और Microsoft platforms के हर major screen reader उपयोग करता है। WCAG technique H86 meaningful emoji को <span role="img" aria-label="thumbs up">👍</span> में wrap करने की recommendation करता है; decorative emoji को aria-hidden="true" से hide किया जाना चाहिए। तीन pitfalls: repeated emoji verbose हो जाते हैं (😂😂😂😂😂 पाँच बार «Face with tears of joy» पढ़ता है); text-style emoticons (:)) बिना Unicode short name के «colon close-paren» पढ़ते हैं; skin-tone modifiers ज़ोर से पढ़े जाते हैं (👋🏽 «waving hand: medium skin tone» पढ़ता है, informative लेकिन slower)।

Emojipedia और cultural infrastructure

Emojipedia 2013 में Jeremy Burge द्वारा founded, एक Australian designer जिन्होंने birthday dinner के बाद domain को whim पर register किया। यह अब emoji meanings, vendor designs और release coverage के लिए de facto reference site है, 2021 में लगभग 590 million page views serving। Burge Unicode Emoji Subcommittee में थे, 2022 तक Emojipedia के «Chief Emoji Officer» के रूप में serve किया, और World Emoji Day (17 July) बनाया: चुना गया क्योंकि Apple का calendar emoji 📅 date 17 July display करता है, जो 2002 में Macworld Expo में Apple के iCal के original launch date की ओर एक nod है। Emojipedia को अगस्त 2021 में Zedge, Inc. (NYSE: ZDGE) ने acquire किया और यह उसी brand के under operate करना जारी रखता है। Unicode Emoji Subcommittee, जो new emoji proposals evaluate करती है, currently Jennifer Daniel द्वारा chair की जाती है, एक former Google design lead, subcommittee chair बनने वाली पहली महिला।

Quick-reference संख्याएं

संबंधित टूल

मुफ़्त इमोजी चयनकर्ता HTML एंटिटी एन्कोडर मोर्स कोड अनुवादक वर्ण काउंटर