What is the difference between emoji, Unicode code points, and UTF-8?

Emoji are visual characters. Unicode code points (like U+1F600) are numeric identifiers. UTF-8 is the encoding format that stores these as bytes. This tool shows all three representations.

Can I convert skin tone variations and compound emojis?

Yes, this tool handles emoji variants with skin tone modifiers (U+1F3FB-1F3FF) and zero-width joiners that create compound emojis like 👨👩👧👦.

Do I need to install anything to use Emoji Unicode Converter?

No installation needed. Emoji Unicode Converter works directly in any modern web browser, Chrome, Firefox, Safari, or Edge.

What file size limits does this tool have?

Since all processing happens in your browser, there are no server upload limits. Performance depends on your device memory and processing power.

Y a-t-il une limite de taille de fichier ?

There is no hard server limit since all processing happens in your browser. However, very large files (over 50 MB) may be slower depending on your device memory and processor speed.

Convertisseur Emoji Unicode, gratuit

Convertissez des emoji en points de code Unicode (U+XXXX) ou collez des points de code pour obtenir l'emoji.

Emoji → Unicode

Collez un emoji

Unicode → Emoji

Collez les points de code

Détails des caractères

Convertissez un emoji ci-dessus pour voir les détails des caractères.

Comment utiliser

Saisissez un emoji ou un point de code : collez un caractère emoji ou tapez son point de code Unicode (par ex. U+1F600).
Voyez toutes les représentations : l'outil affiche le code décimal, la valeur hex, l'entité HTML, l'échappement CSS, les octets UTF-8 et la séquence d'échappement JavaScript.
Copiez n'importe quel format : cliquez sur un résultat pour le copier instantanément afin de l'utiliser en HTML, CSS ou JavaScript.

Pourquoi utiliser le convertisseur Emoji Unicode ?

Les emoji sont codés en points Unicode, mais chaque système utilise un format différent. Le HTML a besoin d'entités 😀 ou 😀. Les pseudo-éléments CSS ont besoin de la forme échappée \1F600. Les chaînes JavaScript ont besoin de \u{1F600}. Les retrouver à la main est fastidieux, cet outil génère chaque format instantanément depuis une simple saisie d'emoji. Développeurs, designers et créateurs de contenu l'utilisent pour intégrer des emoji en toute sécurité dans du code où le copier-coller de caractères bruts peut provoquer des problèmes de codage.

Formats de sortie pris en charge

Point Unicode, notation U+1F600 pour référence
Entité HTML décimale, 😀 pour les pages HTML
Entité HTML hex, 😀 forme HTML alternative
Échappement CSS, \1F600 à utiliser dans la propriété CSS content
Échappement JS, \u{1F600} pour les littéraux de chaîne JavaScript
Octets UTF-8, séquence d'octets brute pour le travail d'encodage bas niveau

Une brève histoire des emoji, et ce que tout le monde comprend de travers

L'histoire des origines la plus répétée attribue à Shigetaka Kurita, chez NTT DoCoMo, la création du « premier emoji » en 1998-1999. Cette histoire est vraie, mais incomplète. Deux développements antérieurs à Kurita méritent d'être mentionnés :

Sharp PA-8500 (octobre 1988). Le plus ancien ensemble connu de pictogrammes répondant à la définition moderne de l'« emoji » est apparu sur un agenda électronique japonais. Il comportait 102 pictogrammes en 16×16 pixels, une décennie avant l'ensemble de Kurita. Emojipedia a couvert cette redécouverte en 2024, après que des chercheurs ont trouvé des exemplaires survivants de l'appareil.
J-Phone DP-211SW (1997). Kurita lui-même a reconnu, dans une publication sur les réseaux sociaux en janvier 2019, que le premier téléphone mobile doté d'un jeu d'emoji n'était pas celui de DoCoMo. Il a désigné le DP-211SW de J-Phone, qui comportait environ 90 pictogrammes monochromes vers 1997. SoftBank a plus tard absorbé J-Phone, ce qui explique pourquoi le premier déploiement d'emoji d'Apple au Japon (voir plus bas) a été livré spécifiquement pour les détenteurs de cartes SIM SoftBank.
Le jeu i-mode de Shigetaka Kurita pour NTT DoCoMo (1998-1999). Kurita a dirigé la conception d'un jeu de 176 emoji dessinés sur une grille de 12×12 pixels : environ 18 octets par glyphe, trois kilo-octets pour l'ensemble complet, une contrainte critique pour la plateforme i-mode à bande passante limitée que NTT DoCoMo a lancée en février 1999. Il s'est inspiré des symboles du manga japonais (manpu), des pictogrammes météo, des kanji et des panneaux de signalisation. En 2016, le Museum of Modern Art (MoMA) de New York a acquis le jeu original de 176 emoji de Kurita pour sa collection permanente de design.

Comment les emoji ont gagné le reste du monde

Pendant une décennie après le jeu de Kurita, les emoji sont restés un phénomène des opérateurs japonais, avec trois jeux concurrents et incompatibles selon le fournisseur (DoCoMo, KDDI, SoftBank). Le passage au grand public s'est fait en trois étapes :

21 novembre 2008, iPhone OS 2.2. Apple a publié la première version d'Apple Color Emoji (471 glyphes individuels au lancement). Le clavier était officiellement réservé aux utilisateurs d'iPhone japonais munis de cartes SIM SoftBank. Apple Color Emoji est largement citée comme la première police en couleur livrée dans un système d'exploitation majeur.
12 octobre 2011, iOS 5. Apple a publié iOS 5 dans le monde entier, et pour la première fois le clavier d'emoji pouvait être activé par n'importe qui, n'importe où, depuis un menu Réglages. La plupart des historiens y voient le point de départ de l'envol mondial des emoji.
31 octobre 2013, Android 4.4 KitKat. La première version de Google dotée d'une prise en charge complète des emoji en couleur et d'un clavier d'emoji intégré. Le jeu KitKat contenait environ 850 emoji et a introduit le style blob caractéristique de Google, ces dessins en forme de goutte (depuis remplacés, dans Android 8 Oreo, par le dessin rond plus classique que nous voyons aujourd'hui).

Le travail de normalisation du Consortium Unicode s'est déroulé en parallèle. Octobre 2010, Unicode 6.0 a été la première version de la norme à ajouter les emoji comme ensemble reconnu, apportant environ 722 emoji issus de l'union des jeux des opérateurs japonais. Août 2014, le rapport technique Unicode #51 a été publié (plus tard promu au rang d'UTS #51 en mai 2017), la spécification formelle de la façon dont les emoji sont encodés, séquencés et présentés.

Pourquoi la plupart des points de code des emoji se trouvent au-dessus de U+FFFF

Unicode organise chaque caractère en 17 « plans » de 65 536 points de code chacun. Le plan 0 est le plan multilingue de base (BMP), de U+0000 à U+FFFF. La majeure partie de l'écriture courante s'y trouve. Les plans 1 à 16 sont des plans complémentaires (informellement les « plans astraux »), de U+10000 à U+10FFFF. La grande majorité des emoji résident dans le plan 1, le plan multilingue complémentaire, précisément dans des blocs comme Emoticons (U+1F600-U+1F64F), Miscellaneous Symbols and Pictographs (U+1F300-U+1F5FF), Transport and Map Symbols (U+1F680-U+1F6FF) et Supplemental Symbols and Pictographs (U+1F900-U+1F9FF). Le bloc plus récent Symbols and Pictographs Extended-A se situe à U+1FA70-U+1FAFF.

C'est important pour les développeurs à cause de l'UTF-16. L'UTF-16 encode les points de code du BMP sur une seule unité de 16 bits, mais les points de code complémentaires doivent être encodés sous forme de paire de substitution : deux unités de 16 bits, l'une dans la plage des substituts hauts U+D800-U+DBFF et l'autre dans la plage des substituts bas U+DC00-U+DFFF. Le type chaîne de JavaScript est en interne de l'UTF-16, ce qui explique pourquoi "😀".length renvoie 2 au lieu de 1 : le moteur compte les unités de code, et non les points de code. Le code JS moderne utilise Array.from("😀").length ou l'API Intl.Segmenter pour compter correctement les groupes de graphèmes.

L'UTF-8 traite le même emoji sous forme d'une séquence de 4 octets. Le caractère 😀 (U+1F600) s'écrit F0 9F 98 80 en UTF-8. C'est pourquoi l'ancien jeu de caractères utf8 de MySQL (qui est en réalité utf8mb3, plafonné aux séquences de 3 octets) ne peut pas stocker d'emoji ; il vous faut utf8mb4. MySQL 8.0 a fait de utf8mb4 la valeur par défaut, mais les bases de données héritées échouent encore à stocker les emoji et tronquent ou produisent une erreur en silence selon le mode SQL. C'est un bogue fréquent dans la pratique.

Les sélecteurs de variante, ou pourquoi le même cœur peut paraître noir ou rouge

Une poignée de caractères Unicode ont une « double personnalité » : ils peuvent apparaître comme un simple symbole texte monochrome ou comme un emoji coloré, selon le contexte. Deux sélecteurs de présentation ont été ajoutés à Unicode 3.2 (mars 2002) : U+FE0F (sélecteur de variante 16, VS16) demande la présentation emoji, et U+FE0E (VS15) demande la présentation texte. Exemple : ❤ (U+2764, « Heavy Black Heart ») est un symbole texte par défaut ; ❤️ (U+2764 U+FE0F) est le cœur rouge en présentation emoji que la plupart des applications affichent en couleur. Le même point de code, avec et sans VS16, a une apparence complètement différente.

Un exemple connexe célèbre est le soleil. U+2600 « Black Sun With Rays » s'affiche par défaut en style texte monochrome ; en ajoutant VS16 (U+2600 U+FE0F), on obtient le ☀️ coloré. En revanche, U+1F31E « Sun With Face » est un point de code distinct ajouté dans Unicode 6.0 (octobre 2010), en présentation emoji par défaut, qui s'affiche comme le 🌞 souriant sans nécessiter aucun sélecteur. Deux points de code différents, deux histoires différentes, tous deux informellement appelés « l'emoji soleil ».

Les modificateurs de teinte de peau et l'échelle de Fitzpatrick

Dans Unicode 8.0 (publié le 17 juin 2015), la norme a ajouté cinq caractères modificateurs qui ajustent la teinte de peau de tout emoji à présentation humaine. Les modificateurs reposent sur l'échelle de Fitzpatrick, une classification dermatologique mise au point en 1975 par le dermatologue américain Thomas B. Fitzpatrick, à Harvard. L'échelle médicale comporte six types (I à VI). Pour les emoji, les types I et II sont fusionnés en un seul modificateur, ce qui laisse cinq modificateurs d'emoji :

U+1F3FB Claire (Fitzpatrick I-II)
U+1F3FC Claire moyenne (Fitzpatrick III)
U+1F3FD Moyenne (Fitzpatrick IV)
U+1F3FE Mate moyenne (Fitzpatrick V)
U+1F3FF Foncée (Fitzpatrick VI)

L'usage est positionnel : le modificateur vient immédiatement après un emoji humain pris en charge. Par exemple, 👋 (U+1F44B, main qui salue) + U+1F3FD produit 👋🏽, le salut en teinte moyenne. Si la police du destinataire ne prend pas en charge une combinaison base+modificateur donnée, le modificateur s'affiche comme un carré brun distinct, un mode d'échec courant sur les systèmes plus anciens.

Les séquences de jointeur de largeur nulle (ZWJ) : comment sont construits les emoji composés

Le jointeur de largeur nulle (Zero-Width Joiner), point de code U+200D, est le caractère « colle » qui permet à plusieurs emoji de se combiner en un seul glyphe composite lorsque le moteur de rendu reconnaît la séquence. Le ZWJ est invisible et n'a aucune chasse ; il existe uniquement pour signaler au moteur de rendu que les caractères environnants doivent fusionner. Trois schémas dominent :

Les séquences de famille. Un emoji de famille comme 👨‍👩‍👧‍👦 (« famille : homme, femme, fille, garçon ») est encodé sous la forme U+1F468 U+200D U+1F469 U+200D U+1F467 U+200D U+1F466 : quatre emoji de personnes séparés par des ZWJ. Si l'appareil récepteur ne possède pas le glyphe composite précis, la solution de repli consiste à afficher chaque composant côte à côte. C'est l'un des échecs visibles les plus fréquents du rendu d'emoji multiplateforme.
Les séquences de profession et de rôle. 👩‍💻 (« femme informaticienne ») s'écrit U+1F469 U+200D U+1F4BB : femme + ZWJ + ordinateur portable. La plupart des emoji de profession de l'Unicode actuel sont construits ainsi, ce qui évite à la norme de créer un point de code distinct pour chaque combinaison de métier et de teinte de peau.
Les séquences d'identité et de fierté. Le drapeau arc-en-ciel 🏳️‍🌈 s'écrit U+1F3F3 U+FE0F U+200D U+1F308 : drapeau blanc avec VS16 + ZWJ + arc-en-ciel.

Largement utilisées dans Unicode 15.1 (publié le 12 septembre 2023) : 118 nouveaux emoji y ont été ajoutés, dont 108 étaient des variantes directionnelles d'emoji existants (des personnes tournées vers la droite plutôt que vers la gauche par défaut). Fait crucial, la version 15.1 n'a ajouté aucun nouveau point de code de base : chaque nouvel emoji était une séquence construite à partir de composants existants.

Les touches (keycaps), les indicateurs régionaux et le mécanisme des drapeaux

Les séquences de touche. Un emoji de touche comme 1️⃣ est constitué de trois points de code : un chiffre (U+0031 = « 1 »), VS16 (U+FE0F) et le caractère Combining Enclosing Keycap U+20E3. La touche combinatoire a été approuvée dans le cadre d'Unicode 3.0 en 1999. L'ensemble complet des emoji de touche couvre 0-9 ainsi que # et *. Cette séquence de trois caractères met régulièrement en défaut les vérifications naïves de .length.

Les paires d'indicateurs régionaux (drapeaux). Unicode n'encode pas les drapeaux nationaux comme des caractères uniques. Il définit plutôt 26 symboles indicateurs régionaux, les points de code U+1F1E6 à U+1F1FF, chacun correspondant à une lettre latine de A à Z. Un drapeau est une paire d'indicateurs régionaux qui épelle un code de pays ISO 3166-1 alpha-2. Le drapeau français 🇫🇷 s'écrit U+1F1EB U+1F1F7 : les lettres indicatrices régionales F et R. Sur les 26 × 26 = 676 paires possibles, seules 270 environ correspondent à des codes de pays ISO valides ; les autres s'affichent comme deux symboles de lettre sur la plupart des plateformes.

Les versions récentes d'emoji, en bref

Unicode 15.0, publié le 13 septembre 2022. Ajout de 31 nouveaux emoji, dont le cœur rose 🩷, le cœur bleu clair 🩵, le cœur gris 🩶, les mains qui poussent 🫷🫸, le visage qui tremble 🫨, la méduse 🪼, l'orignal 🫎, l'âne 🫏 et la racine de gingembre 🫚.
Unicode 15.1, publié le 12 septembre 2023. Ajout de 118 nouveaux emoji, tous des séquences ZWJ plutôt que de nouveaux points de code de base. 108 étaient des variantes directionnelles ; les autres comprenaient le phénix 🐦‍🔥, le citron vert 🍋‍🟩, le champignon brun comestible 🍄‍🟫 et la chaîne brisée ⛓️‍💥.
Unicode 16.0, publié le 10 septembre 2024. Ajout de 8 nouveaux emoji : Face with Bags Under Eyes 🫩 (U+1FAE9), Fingerprint 🫆 (U+1FAC6), Splatter 🫟 (U+1FADF), Root Vegetable 🫜 (U+1FADC), Leafless Tree 🪾 (U+1FABE), Harp 🪉 (U+1FA89), Shovel 🪏 (U+1FA8F) et Flag of Sark 🇨🇶. À noter : le nouveau visage s'appelle officiellement « Face with Bags Under Eyes », et non « yawning face » (l'emoji visage qui bâille 🥱 U+1F971 a été ajouté dans Unicode 12.0 en 2019 et n'a aucun rapport).
Unicode 17.0, publié le 9 septembre 2025. Ajout de 7 nouveaux emoji à part entière (nouveaux points de code) : Distorted Face, Fight Cloud, Hairy Creature (informellement Bigfoot), Orca, Landslide, Trombone et Treasure Chest. Plus 156 variations dérivées de teinte de peau et de genre, ce qui porte le total de nouveaux emoji de la version 17.0 à 163. La plupart des grands fournisseurs prévoient un déploiement au cours du premier semestre 2026 ; Microsoft accuse généralement un ou deux trimestres de retard.

Les dessins selon le fournisseur : même point de code, œuvre graphique différente

Unicode normalise le sens et le point de code, jamais l'œuvre graphique. Chaque plateforme livre sa propre police d'emoji, et les différences visuelles sont suffisamment réelles pour avoir causé des malentendus documentés dans des études universitaires (Hecht et al., CSCW 2018, sur la mauvaise interprétation des emoji multiplateforme). Les principales polices :

Apple Color Emoji est livrée sur iOS, iPadOS, macOS et tvOS. Livrée pour la première fois en novembre 2008 avec 471 glyphes ; portée à plus de 3 633 glyphes en septembre 2021. Propriétaire ; ne peut pas être redistribuée légalement hors des plateformes Apple.
Noto Color Emoji (Google) est livrée sur Android (depuis 4.4 KitKat, octobre 2013), ChromeOS et Gmail. Open source sous licence SIL Open Font License.
Segoe UI Emoji (Microsoft) est livrée à partir de Windows 8.1. La refonte Fluent Emoji de 2021 a introduit des dessins en style 3D dans Microsoft 365.
One UI Emoji (Samsung) sur les téléphones Galaxy, distincte de Noto de Google bien qu'Android utilise Noto par défaut.
Twemoji, passée en open source par Twitter le 6 novembre 2014 avec 874 dessins SVG (code sous licence MIT, graphismes CC-BY 4.0). Le dépôt Twitter d'origine n'est plus activement maintenu depuis le changement de marque en X ; des forks communautaires (notamment jdecked/twemoji) font avancer le standard.

Lorsque la police d'un appareil n'a aucun glyphe pour un point de code ou une séquence donnés, les navigateurs et les systèmes d'exploitation affichent un rectangle vide, communément appelé tofu. Le tofu est le signal le plus fort possible que l'appareil du destinataire est plus ancien que celui de l'expéditeur. Les nouveaux emoji mettent généralement six à dix-huit mois à se propager d'une publication Unicode à toutes les grandes plateformes.

L'accessibilité : ce que les auteurs de contenu devraient savoir

Les lecteurs d'écran modernes (NVDA, JAWS, VoiceOver, TalkBack) énoncent le nom court CLDR de chaque emoji, issu du Common Locale Data Repository d'Unicode, par exemple « visage souriant » pour 😀, « famille : homme, femme, fille, garçon » pour 👨‍👩‍👧‍👦. Le CLDR d'Unicode tient à jour des noms courts et des mots-clés officiels dans plus de 90 langues, ce qu'utilise tout lecteur d'écran majeur sur les plateformes Apple et Microsoft. La technique WCAG H86 recommande d'envelopper les emoji porteurs de sens dans <span role="img" aria-label="thumbs up">👍</span> ; les emoji décoratifs devraient être masqués avec aria-hidden="true". Trois pièges : les emoji répétés deviennent verbeux (😂😂😂😂😂 se lit « visage riant aux larmes » cinq fois) ; les émoticônes en style texte (:)) se lisent « deux-points parenthèse fermante » sans nom court Unicode ; les modificateurs de teinte de peau sont énoncés (👋🏽 se lit « main qui salue : peau légèrement mate », instructif mais plus lent).

Emojipedia et l'infrastructure culturelle

Emojipedia a été fondé en 2013 par Jeremy Burge, un designer australien qui a enregistré le domaine sur un coup de tête après un dîner d'anniversaire. C'est aujourd'hui le site de référence de facto pour le sens des emoji, les dessins selon le fournisseur et la couverture des nouveautés, totalisant environ 590 millions de pages vues en 2021. Burge a siégé au sous-comité Emoji d'Unicode, a occupé le poste de « Chief Emoji Officer » d'Emojipedia jusqu'en 2022, et a créé la Journée mondiale de l'emoji (17 juillet) : choisie parce que l'emoji calendrier d'Apple 📅 affiche la date du 17 juillet, elle-même un clin d'œil à la date de lancement initiale d'iCal d'Apple au Macworld Expo en 2002. Emojipedia a été racheté par Zedge, Inc. (NYSE : ZDGE) en août 2021 et continue d'opérer sous la même marque. Le sous-comité Emoji d'Unicode, qui évalue les propositions de nouveaux emoji, est actuellement présidé par Jennifer Daniel, ancienne responsable du design chez Google, première femme à présider le sous-comité.

Chiffres de référence rapide

3 953 : nombre total d'emoji à la version Unicode 17.0 (septembre 2025)
176 : le jeu i-mode original de Kurita (1999)
102 : nombre de pictogrammes du Sharp PA-8500 (1988)
12×12 : la grille de pixels des emoji i-mode de Kurita
5 : nombre de modificateurs de teinte de peau (Fitzpatrick I et II fusionnés)
U+200D : jointeur de largeur nulle (Zero-Width Joiner)
U+FE0F / U+FE0E : sélecteurs de présentation emoji / texte
U+20E3 : Combining Enclosing Keycap (touche englobante combinatoire)
U+1F1E6 à U+1F1FF : lettres indicatrices régionales A-Z servant à construire les paires de drapeaux
F0 9F 98 80 : octets UTF-8 de U+1F600 (😀)
17 juillet : Journée mondiale de l'emoji
21 novembre 2008 : iPhone OS 2.2, première police d'emoji en couleur
12 octobre 2011 : iOS 5, clavier d'emoji disponible dans le monde entier
octobre 2010 : Unicode 6.0, première version de la norme avec emoji
17 juin 2015 : Unicode 8.0, ajout des modificateurs de teinte de peau

Outils associés

Sélecteur d'emoji, gratuit Encodeur / décodeur d'entités HTML, gratuit Traducteur de code morse, gratuit Comptage de caractères en ligne, gratuit