What is the difference between emoji, Unicode code points, and UTF-8?

Emoji are visual characters. Unicode code points (like U+1F600) are numeric identifiers. UTF-8 is the encoding format that stores these as bytes. This tool shows all three representations.

Can I convert skin tone variations and compound emojis?

Yes, this tool handles emoji variants with skin tone modifiers (U+1F3FB-1F3FF) and zero-width joiners that create compound emojis like 👨👩👧👦.

Do I need to install anything to use Emoji Unicode Converter?

No installation needed. Emoji Unicode Converter works directly in any modern web browser, Chrome, Firefox, Safari, or Edge.

What file size limits does this tool have?

Since all processing happens in your browser, there are no server upload limits. Performance depends on your device memory and processing power.

क्या फ़ाइल आकार की कोई सीमा है?

There is no hard server limit since all processing happens in your browser. However, very large files (over 50 MB) may be slower depending on your device memory and processor speed.

Emoji Unicode कनवर्टर

इमोजी को Unicode कोड पॉइंट (U+XXXX) में कनवर्ट करें या इमोजी प्राप्त करने के लिए कोड पॉइंट पेस्ट करें।

इमोजी → Unicode

इमोजी पेस्ट करें

Unicode → इमोजी

कोड पॉइंट पेस्ट करें

वर्ण विवरण

वर्ण विवरण देखने के लिए ऊपर एक इमोजी रूपांतरित करें।

कैसे उपयोग करें

इमोजी या कोड पॉइंट दर्ज करें: इमोजी वर्ण पेस्ट करें या इसका Unicode कोड पॉइंट टाइप करें (जैसे U+1F600)।
सभी प्रतिनिधित्व देखें: टूल दशमलव कोड, हेक्स मान, HTML एंटिटी, CSS एस्केप, UTF-8 बाइट्स आदि प्रदर्शित करता है।
कोई भी प्रारूप कॉपी करें: HTML, CSS या JavaScript में उपयोग के लिए तुरंत कॉपी करने हेतु परिणाम पर क्लिक करें।

इमोजी Unicode कन्वर्टर क्यों इस्तेमाल करें?

इमोजी Unicode कोड पॉइंट के रूप में एन्कोड होते हैं, लेकिन अलग-अलग सिस्टम अलग-अलग प्रारूपों का उपयोग करते हैं। HTML को 😀 या 😀 एंटिटी की आवश्यकता होती है। CSS pseudo-element के लिए एस्केप्ड रूप \1F600 चाहिए। JavaScript स्ट्रिंग के लिए \u{1F600} चाहिए। इन्हें मैन्युअली ढूँढना धीमा है, यह टूल एक ही इमोजी इनपुट से तुरंत हर प्रारूप तैयार कर देता है। डेवलपर्स, डिज़ाइनर और कंटेंट क्रिएटर इसका उपयोग कोडबेस में इमोजी को सुरक्षित रूप से जोड़ने के लिए करते हैं, जहाँ कच्चे अक्षरों को सीधे कॉपी-पेस्ट करने से एन्कोडिंग समस्याएँ हो सकती हैं।

समर्थित आउटपुट प्रारूप

Unicode पॉइंट, संदर्भ के लिए U+1F600 नोटेशन
HTML दशमलव एंटिटी, HTML पेज के लिए 😀
HTML हेक्स एंटिटी, वैकल्पिक HTML रूप 😀
CSS एस्केप, CSS content प्रॉपर्टी में उपयोग करने के लिए \1F600
JS एस्केप, JavaScript स्ट्रिंग लिटरल के लिए \u{1F600}
UTF-8 बाइट्स, निम्न-स्तरीय एन्कोडिंग कार्य के लिए कच्ची बाइट अनुक्रम

emoji का एक संक्षिप्त इतिहास, और वे भाग जो सभी गलत समझते हैं

Shigetaka Kurita को NTT DoCoMo में 1998-1999 में «पहला emoji» बनाने का श्रेय देने वाली origin story सबसे अधिक repeated है। वह कहानी सच है लेकिन अधूरी है। Kurita से पहले के दो developments का उल्लेख करना उचित है:

Sharp PA-8500 (अक्टूबर 1988)। «emoji» की modern definition को पूरा करने वाले pictographs का सबसे पुराना known set एक Japanese electronic organiser पर दिखाई दिया। इसमें 16×16 pixels पर 102 pictographs थे, Kurita के set से एक दशक पहले। Emojipedia ने 2024 में researchers द्वारा device की surviving units मिलने के बाद rediscovery को cover किया।
J-Phone DP-211SW (1997)। Kurita ने खुद जनवरी 2019 के एक social-media post में acknowledge किया कि emoji set वाला पहला mobile phone DoCoMo का नहीं था। उन्होंने J-Phone के DP-211SW की ओर इशारा किया, जिसमें 1997 के आसपास लगभग 90 monochrome pictographs थे। SoftBank ने बाद में J-Phone को absorb किया, इसीलिए Japan में Apple का पहला emoji rollout (नीचे देखें) specifically SoftBank SIM holders के लिए ship हुआ।
Shigetaka Kurita का NTT DoCoMo i-mode set (1998-1999)। Kurita ने 12×12 pixel grid पर drawn 176-emoji set का design lead किया: प्रति glyph लगभग 18 bytes, full set के लिए तीन kilobytes, NTT DoCoMo द्वारा फरवरी 1999 में launch किए गए bandwidth-limited i-mode platform के लिए एक critical constraint। उन्होंने Japanese manga symbols (manpu), weather pictograms, kanji और street signs से inspiration लिया। 2016 में New York के Museum of Modern Art (MoMA) ने Kurita के original 176-emoji set को अपने permanent design collection के लिए acquire किया।

emoji बाकी दुनिया तक कैसे पहुँचे

Kurita के set के बाद एक दशक तक, emoji एक Japanese carrier phenomenon थे, तीन competing और incompatible vendor sets (DoCoMo, KDDI, SoftBank) के साथ। crossover तीन stages में हुआ:

21 नवंबर 2008, iPhone OS 2.2। Apple ने Apple Color Emoji का पहला version release किया (launch पर 471 individual glyphs)। keyboard officially SoftBank SIM cards पर Japanese iPhone users तक restricted था। Apple Color Emoji को किसी भी major operating system में ship हुई पहली colour font के रूप में व्यापक रूप से उद्धृत किया जाता है।
12 अक्टूबर 2011, iOS 5। Apple ने iOS 5 worldwide release किया, और पहली बार emoji keyboard को Settings menu से कोई भी, कहीं भी, enable कर सकता था। अधिकांश historians इसे emoji के global takeoff की शुरुआत के रूप में cite करते हैं।
31 अक्टूबर 2013, Android 4.4 KitKat। full colour-emoji support और built-in emoji keyboard के साथ Google का पहला version। KitKat set में लगभग 850 emoji थे और Google का distinctive blob-style design introduce किया (जिसे तब से Android 8 Oreo में आज दिखने वाले अधिक conventional round design से replace किया गया है)।

Unicode Consortium का standardisation work parallel में चला। अक्टूबर 2010, Unicode 6.0 standard का पहला version था जिसने emoji को एक recognised set के रूप में add किया, Japanese carrier sets के union से लगभग 722 emoji contribute करते हुए। अगस्त 2014, Unicode Technical Report #51 प्रकाशित हुई (बाद में मई 2017 में UTS #51 में promoted), emoji को कैसे encode, sequence और present किया जाए इसकी formal specification।

अधिकांश emoji code points U+FFFF से ऊपर क्यों रहते हैं

Unicode हर character को 65,536 code points में से 17 «planes» में organize करता है। Plane 0 Basic Multilingual Plane (BMP) है, U+0000 से U+FFFF तक। अधिकांश everyday written language यहाँ रहती है। Planes 1-16 supplementary planes हैं (informally «astral planes»), U+10000 से U+10FFFF तक। अधिकांश emoji Plane 1, Supplementary Multilingual Plane में रहते हैं, specifically Emoticons (U+1F600-U+1F64F), Miscellaneous Symbols and Pictographs (U+1F300-U+1F5FF), Transport and Map Symbols (U+1F680-U+1F6FF), और Supplemental Symbols and Pictographs (U+1F900-U+1F9FF) जैसे blocks में। newer Symbols and Pictographs Extended-A block U+1FA70-U+1FAFF पर है।

यह developers के लिए UTF-16 की वजह से मायने रखता है। UTF-16, BMP code points को single 16-bit unit के रूप में encode करता है, लेकिन supplementary code points को surrogate pair के रूप में encode करना होगा: दो 16-bit units, एक high-surrogate range U+D800-U+DBFF से और एक low-surrogate range U+DC00-U+DFFF से। JavaScript का string type internally UTF-16 है, इसीलिए "😀".length 2 return करता है न कि 1: engine code units count कर रहा है, code points नहीं। Modern JS code grapheme clusters को correctly count करने के लिए Array.from("😀").length या Intl.Segmenter API का उपयोग करता है।

UTF-8 वही emoji को 4-byte sequence के रूप में handle करता है। character 😀 (U+1F600) UTF-8 में F0 9F 98 80 है। इसीलिए MySQL का पुराना utf8 charset (जो वास्तव में utf8mb3 है, 3-byte sequences तक capped) emoji store नहीं कर सकता, आपको utf8mb4 चाहिए। MySQL 8.0 ने utf8mb4 को default बनाया, लेकिन legacy databases अभी भी emoji store करने में fail होते हैं और SQL mode के आधार पर silently truncate या error करते हैं। यह एक frequent real-world bug है।

Variation selectors, एक ही heart काला या लाल क्यों दिख सकता है

कुछ Unicode characters की एक «dual personality» होती है: context के आधार पर वे plain monochrome text symbol या colourful emoji के रूप में दिख सकते हैं। Unicode 3.2 (मार्च 2002) में दो presentation selectors जोड़े गए: U+FE0F (Variation Selector-16, VS16) emoji presentation request करता है, और U+FE0E (VS15) text presentation request करता है। उदाहरण: ❤ (U+2764, «Heavy Black Heart») एक text-default symbol है; ❤️ (U+2764 U+FE0F) वह emoji-presentation red heart है जिसे अधिकांश apps colour में render करते हैं। VS16 के साथ और बिना VS16 के एक ही code point बिल्कुल अलग दिखता है।

एक प्रसिद्ध related example sun है। U+2600 «Black Sun With Rays» text-style monochrome पर default है; VS16 (U+2600 U+FE0F) जोड़ने पर colourful ☀️ मिलता है। इसके विपरीत, U+1F31E «Sun With Face» Unicode 6.0 (अक्टूबर 2010) में जोड़ा गया एक अलग code point है, default emoji presentation, और किसी selector की आवश्यकता के बिना smiling 🌞 render करता है। दो different code points, दो different histories, दोनों को informally «the sun emoji» कहा जाता है।

Skin-tone modifiers और Fitzpatrick scale

Unicode 8.0 (17 जून 2015 को released) में standard ने पाँच modifier characters जोड़े जो किसी भी human-presenting emoji का skin tone adjust करते हैं। modifiers Fitzpatrick scale पर based हैं, एक dermatological classification जो 1975 में Harvard में American dermatologist Thomas B. Fitzpatrick द्वारा विकसित की गई। medical scale में छह types (I से VI) हैं। emoji purposes के लिए, types I और II को एक single modifier में merge किया गया है, जिससे पाँच emoji modifiers बचते हैं:

U+1F3FB हल्का (Fitzpatrick I-II)
U+1F3FC मध्यम-हल्का (Fitzpatrick III)
U+1F3FD मध्यम (Fitzpatrick IV)
U+1F3FE मध्यम-गहरा (Fitzpatrick V)
U+1F3FF गहरा (Fitzpatrick VI)

usage positional है: modifier किसी supported human emoji के immediately बाद आता है। उदाहरण के लिए, 👋 (U+1F44B, waving hand) + U+1F3FD 👋🏽 produce करता है, medium-tone wave। यदि recipient का font कोई particular base+modifier combination support नहीं करता, तो modifier एक separate brown square के रूप में render होता है, पुराने systems पर एक common failure mode।

Zero-Width Joiner sequences, compound emoji कैसे बनाए जाते हैं

Zero-Width Joiner, code point U+200D, वह «glue» character है जो multiple emoji को एक composite glyph में combine करने देता है जब renderer sequence को recognize करता है। ZWJ invisible है और इसकी कोई width नहीं है, यह purely rendering engine को signal करने के लिए exists करता है कि surrounding characters को fuse होना चाहिए। तीन patterns dominate करते हैं:

Family sequences। 👨‍👩‍👧‍👦 («family: man, woman, girl, boy») जैसा family emoji U+1F468 U+200D U+1F469 U+200D U+1F467 U+200D U+1F466 के रूप में encode किया गया है: ZWJ से separated चार people emoji। यदि receiving device में specific composite glyph नहीं है, तो fallback हर component को side by side display करना है। यह cross-platform emoji rendering की सबसे common visible failures में से एक है।
Profession और role sequences। 👩‍💻 («woman technologist») U+1F469 U+200D U+1F4BB है: woman + ZWJ + laptop। current Unicode में अधिकांश profession emoji इस तरह से built हैं, जो standard को हर job-and-skin-tone combination के लिए एक अलग code point mint करने से बचाता है।
Identity और pride sequences। rainbow flag 🏳️‍🌈 U+1F3F3 U+FE0F U+200D U+1F308 है: white flag with VS16 + ZWJ + rainbow।

Unicode 15.1 (12 सितंबर 2023 को released) में heavily उपयोग किया गया: 15.1 में 118 new emoji जोड़े गए, जिनमें से 108 existing emoji के directional variants थे (default left के बजाय right facing people)। महत्वपूर्ण बात, 15.1 ने zero new base code points जोड़े: हर new emoji existing components से built एक sequence था।

Keycaps, regional indicators, और flag mechanism

Keycap sequences। 1️⃣ जैसा keycap emoji तीन code points से built है: एक digit (U+0031 = «1»), VS16 (U+FE0F), और Combining Enclosing Keycap character U+20E3। combining keycap को 1999 में Unicode 3.0 के भाग के रूप में approve किया गया था। keycap emoji का full set 0-9 plus # और * cover करता है। three-character sequence naive .length checks को हमेशा trip up करता है।

Regional indicator pairs (flags)। Unicode national flags को single characters के रूप में encode नहीं करता। इसके बजाय, यह 26 Regional Indicator Symbols define करता है, code points U+1F1E6 से U+1F1FF तक, प्रत्येक Latin letter A से Z के corresponding। एक flag regional indicators की एक pair है जो ISO 3166-1 alpha-2 country code spell करती है। French flag 🇫🇷 U+1F1EB U+1F1F7 है: regional-indicator letters F और R। 26 × 26 = 676 possible pairs में से, केवल लगभग 270 valid ISO country codes के corresponding हैं; बाकी अधिकांश platforms पर दो letter symbols के रूप में render होते हैं।

हाल के emoji versions, संक्षेप में

Unicode 15.0, 13 सितंबर 2022 को released। 31 new emoji जोड़े जिनमें pink heart 🩷, light-blue heart 🩵, grey heart 🩶, pushing-hand 🫷🫸, shaking face 🫨, jellyfish 🪼, moose 🫎, donkey 🫏, ginger root 🫚 शामिल हैं।
Unicode 15.1, 12 सितंबर 2023 को released। 118 new emoji जोड़े, सभी new base code points के बजाय ZWJ sequences। 108 directional variants थे; बाकी में phoenix 🐦‍🔥, lime 🍋‍🟩, edible brown mushroom 🍄‍🟫 और broken chain ⛓️‍💥 शामिल थे।
Unicode 16.0, 10 सितंबर 2024 को released। 8 new emoji जोड़े: आँखों के नीचे bags वाला चेहरा 🫩 (U+1FAE9), उँगली का निशान 🫆 (U+1FAC6), छींटा 🫟 (U+1FADF), जड़ वाली सब्ज़ी 🫜 (U+1FADC), पत्ती रहित पेड़ 🪾 (U+1FABE), वीणा 🪉 (U+1FA89), फावड़ा 🪏 (U+1FA8F), और Sark का झंडा 🇨🇶। note: नया चेहरा officially «Face with Bags Under Eyes,» है, «yawning face» नहीं (yawning-face emoji 🥱 U+1F971 2019 में Unicode 12.0 में जोड़ा गया था और असंबंधित है)।
Unicode 17.0, 9 सितंबर 2025 को released। 7 new code-point emoji जोड़े: Distorted Face, Fight Cloud, Hairy Creature (informally Bigfoot), Orca, Landslide, Trombone, और Treasure Chest। साथ ही 156 derivative skin-tone और gender variations, 17.0 में new emoji का total 163 करते हुए। अधिकांश major vendors 2026 की पहली छमाही में rollout plan करते हैं; Microsoft आमतौर पर एक-दो quarter और पीछे रहता है।

Vendor designs, एक ही code point, अलग artwork

Unicode meaning और code point को standardise करता है, artwork को कभी नहीं। हर platform अपना emoji font ship करता है, और visual differences इतने real हैं कि academic studies (Hecht et al., CSCW 2018, cross-platform emoji misinterpretation पर) में documented miscommunication cause हुई है। major fonts:

Apple Color Emoji iOS, iPadOS, macOS, tvOS पर ship होता है। पहली बार नवंबर 2008 में 471 glyphs के साथ shipped; सितंबर 2021 तक 3,633+ तक expanded। Proprietary; Apple platforms के बाहर legally redistribute नहीं किया जा सकता।
Noto Color Emoji (Google) Android (4.4 KitKat, अक्टूबर 2013 से), ChromeOS, Gmail पर ship होता है। SIL Open Font License के अंतर्गत open source।
Segoe UI Emoji (Microsoft) Windows 8.1 और उसके बाद ship होता है। 2021 में Fluent Emoji refresh ने Microsoft 365 में 3D-style designs introduce किए।
One UI Emoji (Samsung) Galaxy phones पर, default रूप से Noto use करने के बावजूद Google के Noto से distinct।
Twemoji Twitter द्वारा 6 नवंबर 2014 को 874 SVG designs (MIT code, CC-BY 4.0 graphics) के साथ open-source किया गया। original Twitter repo को X rebrand के बाद से actively maintain नहीं किया गया है; community forks (notably jdecked/twemoji) standard को आगे carry करते हैं।

जब किसी device का font किसी particular code point या sequence के लिए कोई glyph नहीं रखता, तो browsers और operating systems एक blank rectangle display करते हैं, जिसे commonly tofu कहा जाता है। Tofu सबसे मजबूत possible signal है कि recipient का device sender के device से पुराना है। New emoji आमतौर पर एक Unicode release से सभी major platforms तक propagate होने में छह से अठारह महीने लेते हैं।

Accessibility, content authors को क्या जानना चाहिए

Modern screen readers (NVDA, JAWS, VoiceOver, TalkBack) Unicode Common Locale Data Repository से हर emoji का CLDR short name read करते हैं, उदाहरण के लिए 😀 के लिए «grinning face», 👨‍👩‍👧‍👦 के लिए «family: man, woman, girl, boy»। Unicode CLDR 90+ languages में official short names और keywords maintain करता है, जिसे Apple और Microsoft platforms के हर major screen reader उपयोग करता है। WCAG technique H86 meaningful emoji को <span role="img" aria-label="thumbs up">👍</span> में wrap करने की recommendation करता है; decorative emoji को aria-hidden="true" से hide किया जाना चाहिए। तीन pitfalls: repeated emoji verbose हो जाते हैं (😂😂😂😂😂 पाँच बार «Face with tears of joy» पढ़ता है); text-style emoticons (:)) बिना Unicode short name के «colon close-paren» पढ़ते हैं; skin-tone modifiers ज़ोर से पढ़े जाते हैं (👋🏽 «waving hand: medium skin tone» पढ़ता है, informative लेकिन slower)।

Emojipedia और cultural infrastructure

Emojipedia 2013 में Jeremy Burge द्वारा founded, एक Australian designer जिन्होंने birthday dinner के बाद domain को whim पर register किया। यह अब emoji meanings, vendor designs और release coverage के लिए de facto reference site है, 2021 में लगभग 590 million page views serving। Burge Unicode Emoji Subcommittee में थे, 2022 तक Emojipedia के «Chief Emoji Officer» के रूप में serve किया, और World Emoji Day (17 July) बनाया: चुना गया क्योंकि Apple का calendar emoji 📅 date 17 July display करता है, जो 2002 में Macworld Expo में Apple के iCal के original launch date की ओर एक nod है। Emojipedia को अगस्त 2021 में Zedge, Inc. (NYSE: ZDGE) ने acquire किया और यह उसी brand के under operate करना जारी रखता है। Unicode Emoji Subcommittee, जो new emoji proposals evaluate करती है, currently Jennifer Daniel द्वारा chair की जाती है, एक former Google design lead, subcommittee chair बनने वाली पहली महिला।

Quick-reference संख्याएं

3,953: Unicode 17.0 (सितंबर 2025) तक कुल emoji
176: Kurita का original i-mode set (1999)
102: Sharp PA-8500 (1988) पर pictograph count
12×12: Kurita के i-mode emoji का pixel grid
5: skin-tone modifier count (Fitzpatrick I और II merged)
U+200D: शून्य-चौड़ाई संयोजक
U+FE0F / U+FE0E: emoji / text प्रस्तुति selectors
U+20E3: संयोजित आवरण Keycap
U+1F1E6 से U+1F1FF: flag pairs बनाने के लिए उपयोग किए जाने वाले regional indicator letters A-Z
F0 9F 98 80: U+1F600 (😀) के लिए UTF-8 bytes
17 जुलाई: World Emoji Day
21 नवंबर 2008: iPhone OS 2.2, पहला colour emoji font
12 अक्टूबर 2011: iOS 5, globally उपलब्ध emoji keyboard
अक्टूबर 2010: Unicode 6.0, emoji के साथ standard का पहला version
17 जून 2015: Unicode 8.0, skin-tone modifiers जोड़े गए