What is the difference between emoji, Unicode code points, and UTF-8?

Emoji are visual characters. Unicode code points (like U+1F600) are numeric identifiers. UTF-8 is the encoding format that stores these as bytes. This tool shows all three representations.

Can I convert skin tone variations and compound emojis?

Yes, this tool handles emoji variants with skin tone modifiers (U+1F3FB-1F3FF) and zero-width joiners that create compound emojis like 👨👩👧👦.

Do I need to install anything to use Emoji Unicode Converter?

No installation needed. Emoji Unicode Converter works directly in any modern web browser, Chrome, Firefox, Safari, or Edge.

What file size limits does this tool have?

Since all processing happens in your browser, there are no server upload limits. Performance depends on your device memory and processing power.

Gibt es eine Dateigrößenbeschränkung?

There is no hard server limit since all processing happens in your browser. However, very large files (over 50 MB) may be slower depending on your device memory and processor speed.

Emoji Unicode Konverter

Wandeln Sie Emojis in Unicode-Codepunkte (U+XXXX) oder fügen Sie Codepunkte ein, um das Emoji zurückzubekommen.

Emoji → Unicode

Emoji einfügen

Unicode → Emoji

Codepunkte einfügen

Zeichendetails

Wandeln Sie oben ein Emoji um, um die Zeichendetails zu sehen.

So funktioniert es

Geben Sie ein Emoji oder einen Codepunkt ein: Fügen Sie ein Emoji-Zeichen ein oder tippen Sie seinen Unicode-Codepunkt (z. B. U+1F600).
Sehen Sie alle Darstellungen: Das Tool zeigt den Dezimalcode, den Hex-Wert, die HTML-Entität, den CSS-Escape, die UTF-8-Bytes und die JavaScript-Escape-Sequenz.
Beliebiges Format kopieren: Klicken Sie auf ein Ergebnis, um es sofort zur Verwendung in HTML-, CSS- oder JavaScript-Code zu kopieren.

Warum den Emoji-Unicode-Konverter nutzen?

Emojis werden als Unicode-Codepunkte kodiert, doch jedes System nutzt ein anderes Format. HTML-Inhalte brauchen 😀 oder 😀 als Entitäten. CSS-Pseudo-Elemente brauchen die Escape-Form \1F600. JavaScript-Strings brauchen \u{1F600}. Diese manuell nachzuschlagen ist mühsam, dieses Tool erzeugt jedes Format sofort aus einer einzigen Emoji-Eingabe. Entwickler, Designer und Inhaltsersteller nutzen es, um Emojis sicher in Codebasen einzubetten, in denen das Kopieren roher Zeichen Kodierungsprobleme verursachen kann.

Unterstützte Ausgabeformate

Unicode-Punkt, Notation U+1F600 zur Referenz
HTML-Dezimalentität, 😀 für HTML-Seiten
HTML-Hex-Entität, 😀 alternative HTML-Form
CSS-Escape, \1F600 zur Verwendung in der CSS-Eigenschaft content
JS-Escape, \u{1F600} für JavaScript-Stringliterale
UTF-8-Bytes, rohe Bytefolge für Low-Level-Kodierungsarbeit

Eine kurze Geschichte der Emoji und die Teile, die alle falsch verstehen

Die am häufigsten wiederholte Entstehungsgeschichte schreibt Shigetaka Kurita bei NTT DoCoMo die Erschaffung „des ersten Emoji“ in den Jahren 1998-1999 zu. Diese Geschichte ist wahr, aber unvollständig. Zwei Entwicklungen vor Kurita verdienen Erwähnung:

Sharp PA-8500 (Oktober 1988). Der früheste bekannte Satz von Piktogrammen, der der modernen Definition von „Emoji“ entspricht, erschien auf einem japanischen elektronischen Organizer. Er trug 102 Piktogramme zu je 16×16 Pixeln, ein Jahrzehnt vor Kuritas Satz. Emojipedia berichtete 2024 über die Wiederentdeckung, nachdem Forscher erhaltene Exemplare des Geräts gefunden hatten.
J-Phone DP-211SW (1997). Kurita selbst räumte in einem Beitrag in sozialen Medien vom Januar 2019 ein, dass das erste Mobiltelefon mit einem Emoji-Satz nicht das von DoCoMo war. Er verwies auf J-Phones DP-211SW, der um 1997 etwa 90 monochrome Piktogramme trug. SoftBank übernahm später J-Phone, weshalb Apples erste Emoji-Einführung in Japan (siehe unten) speziell für SoftBank-SIM-Inhaber ausgeliefert wurde.
Shigetaka Kuritas NTT-DoCoMo-i-mode-Satz (1998-1999). Kurita leitete den Entwurf eines 176-Emoji-Satzes, gezeichnet auf einem 12×12-Pixel-Raster: etwa 18 Byte pro Glyphe, drei Kilobyte für den gesamten Satz, eine entscheidende Beschränkung für die bandbreitenbegrenzte i-mode-Plattform, die NTT DoCoMo im Februar 1999 einführte. Er griff auf Symbole japanischer Manga (manpu), Wetterpiktogramme, Kanji und Verkehrsschilder zurück. 2016 erwarb das Museum of Modern Art (MoMA) in New York Kuritas ursprünglichen 176-Emoji-Satz für seine ständige Designsammlung.

Wie Emoji in den Rest der Welt übersprangen

Ein Jahrzehnt lang nach Kuritas Satz waren Emoji ein Phänomen japanischer Mobilfunkanbieter, mit drei konkurrierenden und inkompatiblen Anbietersätzen (DoCoMo, KDDI, SoftBank). Der Übersprung geschah in drei Phasen:

21. November 2008, iPhone OS 2.2. Apple veröffentlichte die erste Version von Apple Color Emoji (471 einzelne Glyphen beim Start). Die Tastatur war offiziell auf japanische iPhone-Nutzer mit SoftBank-SIM-Karten beschränkt. Apple Color Emoji wird weithin als die erste Farbschrift bezeichnet, die in einem großen Betriebssystem ausgeliefert wurde.
12. Oktober 2011, iOS 5. Apple veröffentlichte iOS 5 weltweit, und zum ersten Mal konnte die Emoji-Tastatur von jedem, überall, über ein Einstellungsmenü aktiviert werden. Die meisten Historiker nennen dies den Beginn des weltweiten Durchbruchs der Emoji.
31. Oktober 2013, Android 4.4 KitKat. Googles erste Version mit voller Farb-Emoji-Unterstützung und einer eingebauten Emoji-Tastatur. Der KitKat-Satz enthielt rund 850 Emoji und führte Googles unverwechselbares Blob-Design ein (in Android 8 Oreo seither durch das konventionellere runde Design ersetzt, das wir heute sehen).

Die Standardisierungsarbeit des Unicode-Konsortiums lief parallel. Oktober 2010, Unicode 6.0 war die erste Version des Standards, die Emoji als anerkannten Satz aufnahm und rund 722 Emoji aus der Vereinigung der japanischen Anbietersätze beisteuerte. August 2014, Unicode Technical Report #51 wurde veröffentlicht (im Mai 2017 später zu UTS #51 erhoben), die formale Spezifikation dafür, wie Emoji codiert, sequenziert und dargestellt werden.

Warum die meisten Emoji-Codepunkte oberhalb von U+FFFF liegen

Unicode ordnet jedes Zeichen in 17 „Ebenen“ (Planes) von je 65.536 Codepunkten ein. Ebene 0 ist die Basic Multilingual Plane (BMP), U+0000 bis U+FFFF. Die meiste alltägliche Schriftsprache lebt hier. Ebenen 1-16 sind ergänzende Ebenen (informell „astrale Ebenen“), U+10000 bis U+10FFFF. Die überwiegende Mehrheit der Emoji lebt in Ebene 1, der Supplementary Multilingual Plane, speziell in Blöcken wie Emoticons (U+1F600-U+1F64F), Miscellaneous Symbols and Pictographs (U+1F300-U+1F5FF), Transport and Map Symbols (U+1F680-U+1F6FF) und Supplemental Symbols and Pictographs (U+1F900-U+1F9FF). Der neuere Block Symbols and Pictographs Extended-A liegt bei U+1FA70-U+1FAFF.

Das ist für Entwickler wegen UTF-16 wichtig. UTF-16 codiert BMP-Codepunkte als eine einzelne 16-Bit-Einheit, aber ergänzende Codepunkte müssen als Surrogatpaar codiert werden: zwei 16-Bit-Einheiten, eine aus dem High-Surrogate-Bereich U+D800-U+DBFF und eine aus dem Low-Surrogate-Bereich U+DC00-U+DFFF. JavaScripts String-Typ ist intern UTF-16, weshalb "😀".length 2 statt 1 zurückgibt: Die Engine zählt Codeeinheiten, nicht Codepunkte. Moderner JS-Code verwendet Array.from("😀").length oder die Intl.Segmenter-API, um Graphemcluster korrekt zu zählen.

UTF-8 behandelt dasselbe Emoji als 4-Byte-Sequenz. Das Zeichen 😀 (U+1F600) ist F0 9F 98 80 in UTF-8. Deshalb kann MySQLs älterer Zeichensatz utf8 (der eigentlich utf8mb3 ist, auf 3-Byte-Sequenzen begrenzt) keine Emoji speichern, Sie brauchen utf8mb4. MySQL 8.0 machte utf8mb4 zum Standard, aber Altdatenbanken scheitern weiterhin daran, Emoji zu speichern, und kürzen sie stillschweigend oder geben je nach SQL-Modus einen Fehler aus. Das ist ein häufiger Fehler in der Praxis.

Variationsselektoren, warum dasselbe Herz schwarz oder rot aussehen kann

Eine Handvoll Unicode-Zeichen hat eine „Doppelnatur“: Sie können je nach Kontext als schlichtes monochromes Textsymbol oder als farbenfrohes Emoji erscheinen. Zwei Präsentationsselektoren wurden zu Unicode 3.2 (März 2002) hinzugefügt: U+FE0F (Variation Selector-16, VS16) fordert die Emoji-Darstellung an, und U+FE0E (VS15) fordert die Textdarstellung an. Beispiel: ❤ (U+2764, „Heavy Black Heart“) ist ein textstandardmäßiges Symbol; ❤️ (U+2764 U+FE0F) ist das rote Herz in Emoji-Darstellung, das die meisten Apps farbig wiedergeben. Derselbe Codepunkt mit und ohne VS16 sieht völlig anders aus.

Ein berühmtes verwandtes Beispiel ist die Sonne. U+2600 „Black Sun With Rays“ erscheint standardmäßig im monochromen Textstil; das Hinzufügen von VS16 (U+2600 U+FE0F) ergibt das farbenfrohe ☀️. Im Gegensatz dazu ist U+1F31E „Sun With Face“ ein eigener Codepunkt, der in Unicode 6.0 (Oktober 2010) hinzugefügt wurde, standardmäßig in Emoji-Darstellung, und wird als das lächelnde 🌞 wiedergegeben, ohne einen Selektor zu benötigen. Zwei verschiedene Codepunkte, zwei verschiedene Geschichten, beide informell „das Sonnen-Emoji“ genannt.

Hautton-Modifikatoren und die Fitzpatrick-Skala

In Unicode 8.0 (veröffentlicht am 17. Juni 2015) fügte der Standard fünf Modifikatorzeichen hinzu, die den Hautton jedes menschlich dargestellten Emoji anpassen. Die Modifikatoren basieren auf der Fitzpatrick-Skala, einer dermatologischen Klassifikation, die 1975 vom amerikanischen Dermatologen Thomas B. Fitzpatrick in Harvard entwickelt wurde. Die medizinische Skala hat sechs Typen (I bis VI). Für Emoji-Zwecke werden die Typen I und II zu einem einzigen Modifikator zusammengefasst, womit fünf Emoji-Modifikatoren übrig bleiben:

U+1F3FB Hell (Fitzpatrick I-II)
U+1F3FC Mittel-Hell (Fitzpatrick III)
U+1F3FD Mittel (Fitzpatrick IV)
U+1F3FE Mittel-Dunkel (Fitzpatrick V)
U+1F3FF Dunkel (Fitzpatrick VI)

Die Verwendung ist positionsabhängig: Der Modifikator kommt unmittelbar nach einem unterstützten menschlichen Emoji. Zum Beispiel ergibt 👋 (U+1F44B, winkende Hand) + U+1F3FD das 👋🏽, das Winken mit mittlerem Hautton. Wenn die Schrift eines Empfängers eine bestimmte Basis-plus-Modifikator-Kombination nicht unterstützt, wird der Modifikator als separates braunes Quadrat wiedergegeben, ein häufiges Fehlverhalten auf älteren Systemen.

Zero-Width-Joiner-Sequenzen) wie zusammengesetzte Emoji aufgebaut werden

Der Zero-Width Joiner, Codepunkt U+200D, ist das „Klebe“-Zeichen, das mehrere Emoji zu einer zusammengesetzten Glyphe verbinden lässt, wenn der Renderer die Sequenz erkennt. ZWJ ist unsichtbar und hat keine Breite, es existiert allein, um der Rendering-Engine zu signalisieren, dass die umgebenden Zeichen verschmelzen sollen. Drei Muster dominieren:

Familiensequenzen. Ein Familien-Emoji wie 👨‍👩‍👧‍👦 („Familie: Mann, Frau, Mädchen, Junge“) wird als U+1F468 U+200D U+1F469 U+200D U+1F467 U+200D U+1F466 codiert: vier Personen-Emoji, getrennt durch ZWJ. Wenn das empfangende Gerät die spezifische zusammengesetzte Glyphe nicht hat, ist die Rückfalldarstellung, jede Komponente nebeneinander anzuzeigen. Das ist eines der häufigsten sichtbaren Fehlverhalten der plattformübergreifenden Emoji-Darstellung.
Berufs- und Rollensequenzen. 👩‍💻 („Technologin“) ist U+1F469 U+200D U+1F4BB: Frau + ZWJ + Laptop. Die meisten Berufs-Emoji im aktuellen Unicode sind so aufgebaut, was den Standard davon abhält, für jede Kombination aus Beruf und Hautton einen eigenen Codepunkt zu prägen.
Identitäts- und Pride-Sequenzen. Die Regenbogenflagge 🏳️‍🌈 ist U+1F3F3 U+FE0F U+200D U+1F308: weiße Flagge mit VS16 + ZWJ + Regenbogen.

Stark genutzt in Unicode 15.1 (veröffentlicht am 12. September 2023): In 15.1 wurden 118 neue Emoji hinzugefügt, von denen 108 Richtungsvarianten bestehender Emoji waren (Personen, die nach rechts statt standardmäßig nach links blicken). Entscheidend ist, dass 15.1 keine einzigen neuen Basis-Codepunkte hinzufügte: Jedes neue Emoji war eine aus bestehenden Komponenten aufgebaute Sequenz.

Keycaps, Regionalindikatoren und der Flaggen-Mechanismus

Keycap-Sequenzen. Ein Keycap-Emoji wie 1️⃣ wird aus drei Codepunkten aufgebaut: einer Ziffer (U+0031 = „1“), VS16 (U+FE0F) und dem Zeichen Combining Enclosing Keycap U+20E3. Das kombinierende Keycap wurde als Teil von Unicode 3.0 im Jahr 1999 genehmigt. Der vollständige Satz der Keycap-Emoji umfasst 0-9 sowie # und *. Die Drei-Zeichen-Sequenz bringt naive .length-Prüfungen ständig durcheinander.

Regionalindikator-Paare (Flaggen). Unicode codiert Nationalflaggen nicht als einzelne Zeichen. Stattdessen definiert es 26 Regional Indicator Symbols, Codepunkte U+1F1E6 bis U+1F1FF, von denen jeder einem lateinischen Buchstaben A bis Z entspricht. Eine Flagge ist ein Paar von Regionalindikatoren, das einen ISO-3166-1-Alpha-2-Ländercode buchstabiert. Die französische Flagge 🇫🇷 ist U+1F1EB U+1F1F7: die Regionalindikator-Buchstaben F und R. Von den 26 × 26 = 676 möglichen Paaren entsprechen nur etwa 270 gültigen ISO-Ländercodes; der Rest wird auf den meisten Plattformen als zwei Buchstabensymbole wiedergegeben.

Aktuelle Emoji-Versionen, kurz gefasst

Unicode 15.0, veröffentlicht am 13. September 2022. Fügte 31 neue Emoji hinzu, darunter rosa Herz 🩷, hellblaues Herz 🩵, graues Herz 🩶, schiebende Hände 🫷🫸, schüttelndes Gesicht 🫨, Qualle 🪼, Elch 🫎, Esel 🫏, Ingwerwurzel 🫚.
Unicode 15.1, veröffentlicht am 12. September 2023. Fügte 118 neue Emoji hinzu, allesamt ZWJ-Sequenzen statt neuer Basis-Codepunkte. 108 waren Richtungsvarianten; der Rest umfasste den Phönix 🐦‍🔥, die Limette 🍋‍🟩, den essbaren braunen Pilz 🍄‍🟫 und die zerbrochene Kette ⛓️‍💥.
Unicode 16.0, veröffentlicht am 10. September 2024. Fügte 8 neue Emoji hinzu: Gesicht mit Tränensäcken 🫩 (U+1FAE9), Fingerabdruck 🫆 (U+1FAC6), Spritzer 🫟 (U+1FADF), Wurzelgemüse 🫜 (U+1FADC), Blattloser Baum 🪾 (U+1FABE), Harfe 🪉 (U+1FA89), Schaufel 🪏 (U+1FA8F) und Flagge von Sark 🇨🇶. Hinweis: Das neue Gesicht heißt offiziell „Gesicht mit Tränensäcken“, nicht „gähnendes Gesicht“ (das gähnende Gesicht 🥱 U+1F971 wurde 2019 in Unicode 12.0 hinzugefügt und hat damit nichts zu tun).
Unicode 17.0) veröffentlicht am 9. September 2025. Fügte 7 neue Codepunkt-Emoji hinzu: Verzerrtes Gesicht, Kampfwolke, Haarige Kreatur (informell Bigfoot), Orca, Erdrutsch, Posaune und Schatztruhe. Dazu 156 abgeleitete Hautton- und Geschlechtsvarianten, womit die Gesamtzahl der neuen Emoji in 17.0 auf 163 steigt. Die meisten großen Anbieter planen die Einführung im ersten Halbjahr 2026; Microsoft hinkt typischerweise um ein bis zwei weitere Quartale hinterher.

Anbieter-Designs, derselbe Codepunkt, andere Grafik

Unicode standardisiert die Bedeutung und den Codepunkt, nie die Grafik. Jede Plattform liefert ihre eigene Emoji-Schrift aus, und die visuellen Unterschiede sind real genug, um in wissenschaftlichen Studien dokumentierte Missverständnisse verursacht zu haben (Hecht et al., CSCW 2018, über plattformübergreifende Emoji-Fehlinterpretation). Die wichtigsten Schriften:

Apple Color Emoji wird auf iOS, iPadOS, macOS, tvOS ausgeliefert. Erstmals im November 2008 mit 471 Glyphen ausgeliefert; bis September 2021 auf über 3.633 erweitert. Proprietär; darf außerhalb von Apple-Plattformen nicht legal weiterverbreitet werden.
Noto Color Emoji (Google) wird auf Android (seit 4.4 KitKat, Oktober 2013), ChromeOS, Gmail ausgeliefert. Open Source unter der SIL Open Font License.
Segoe UI Emoji (Microsoft) wird ab Windows 8.1 ausgeliefert. Die Fluent-Emoji-Auffrischung 2021 führte Designs im 3D-Stil in Microsoft 365 ein.
One UI Emoji (Samsung) auf Galaxy-Telefonen, verschieden von Googles Noto, obwohl Android standardmäßig Noto verwendet.
Twemoji, von Twitter am 6. November 2014 quelloffen gemacht, mit 874 SVG-Designs (MIT-Code, CC-BY-4.0-Grafiken). Das ursprüngliche Twitter-Repository wird seit der Umbenennung in X nicht mehr aktiv gepflegt; Community-Forks (insbesondere jdecked/twemoji) führen den Standard weiter.

Wenn die Schrift eines Geräts keine Glyphe für einen bestimmten Codepunkt oder eine bestimmte Sequenz hat, zeigen Browser und Betriebssysteme ein leeres Rechteck an, gemeinhin Tofu genannt. Tofu ist das stärkstmögliche Signal dafür, dass das Gerät des Empfängers älter ist als das des Absenders. Neue Emoji brauchen typischerweise sechs bis achtzehn Monate, um sich von einer Unicode-Veröffentlichung auf alle großen Plattformen zu verbreiten.

Barrierefreiheit, was Inhaltsersteller wissen sollten

Moderne Screenreader (NVDA, JAWS, VoiceOver, TalkBack) lesen den CLDR-Kurznamen jedes Emoji aus dem Unicode Common Locale Data Repository vor, zum Beispiel „grinsendes Gesicht“ für 😀, „Familie: Mann, Frau, Mädchen, Junge“ für 👨‍👩‍👧‍👦. Das Unicode CLDR pflegt offizielle Kurznamen und Schlüsselwörter in über 90 Sprachen, was jeder große Screenreader auf Apple- und Microsoft-Plattformen verwendet. Die WCAG-Technik H86 empfiehlt, bedeutungstragende Emoji in <span role="img" aria-label="thumbs up">👍</span> einzuschließen; dekorative Emoji sollten mit aria-hidden="true" verborgen werden. Drei Fallstricke: wiederholte Emoji werden weitschweifig (😂😂😂😂😂 wird fünfmal als „Gesicht mit Freudentränen“ gelesen); textbasierte Emoticons (:)) werden als „Doppelpunkt schließende Klammer“ ohne Unicode-Kurznamen gelesen; Hautton-Modifikatoren werden mitgelesen (👋🏽 wird als „winkende Hand: mittlerer Hautton“ gelesen, informativ, aber langsamer).

Emojipedia und die kulturelle Infrastruktur

Emojipedia wurde 2013 von Jeremy Burge gegründet, einem australischen Designer, der die Domain nach einem Geburtstagsessen aus einer Laune heraus registrierte. Sie ist heute die De-facto-Referenzseite für Emoji-Bedeutungen, Anbieter-Designs und die Berichterstattung über Veröffentlichungen und verzeichnete 2021 rund 590 Millionen Seitenaufrufe. Burge saß im Unicode Emoji Subcommittee, war bis 2022 Emojipedias „Chief Emoji Officer“ und schuf den Welt-Emoji-Tag (17. Juli): gewählt, weil Apples Kalender-Emoji 📅 das Datum 17. Juli anzeigt, was selbst eine Anspielung auf das ursprüngliche Startdatum von Apples iCal auf der Macworld Expo 2002 ist. Emojipedia wurde im August 2021 von Zedge, Inc. (NYSE: ZDGE) übernommen und wird weiterhin unter derselben Marke betrieben. Das Unicode Emoji Subcommittee, das neue Emoji-Vorschläge bewertet, wird derzeit von Jennifer Daniel geleitet, einer ehemaligen Google-Designleiterin, der ersten Frau an der Spitze des Unterausschusses.

Zahlen zum schnellen Nachschlagen

3.953: Gesamtzahl der Emoji ab Unicode 17.0 (September 2025)
176: Kuritas ursprünglicher i-mode-Satz (1999)
102: Anzahl der Piktogramme auf dem Sharp PA-8500 (1988)
12×12: Pixelraster von Kuritas i-mode-Emoji
5: Anzahl der Hautton-Modifikatoren (Fitzpatrick I und II zusammengefasst)
U+200D: Zero-Width Joiner
U+FE0F / U+FE0E: Selektoren für Emoji- / Textdarstellung
U+20E3: Combining Enclosing Keycap
U+1F1E6 bis U+1F1FF: Regionalindikator-Buchstaben A-Z zum Aufbau von Flaggenpaaren
F0 9F 98 80: UTF-8-Bytes für U+1F600 (😀)
17. Juli: Welt-Emoji-Tag
21. November 2008: iPhone OS 2.2, erste Farb-Emoji-Schrift
12. Oktober 2011: iOS 5, Emoji-Tastatur weltweit verfügbar
Oktober 2010: Unicode 6.0, erste Standardversion mit Emoji
17. Juni 2015: Unicode 8.0, Hautton-Modifikatoren hinzugefügt