Emoji Unicode Konverter

Wandeln Sie Emojis in Unicode-Codepunkte (U+XXXX) oder fügen Sie Codepunkte ein, um das Emoji zurückzubekommen.

Emoji → Unicode

Unicode → Emoji

Zeichendetails

Wandeln Sie oben ein Emoji um, um die Zeichendetails zu sehen.

So funktioniert es

  1. Geben Sie ein Emoji oder einen Codepunkt ein: Fügen Sie ein Emoji-Zeichen ein oder tippen Sie seinen Unicode-Codepunkt (z. B. U+1F600).
  2. Sehen Sie alle Darstellungen: Das Tool zeigt den Dezimalcode, den Hex-Wert, die HTML-Entität, den CSS-Escape, die UTF-8-Bytes und die JavaScript-Escape-Sequenz.
  3. Beliebiges Format kopieren: Klicken Sie auf ein Ergebnis, um es sofort zur Verwendung in HTML-, CSS- oder JavaScript-Code zu kopieren.

Warum den Emoji-Unicode-Konverter nutzen?

Emojis werden als Unicode-Codepunkte kodiert, doch jedes System nutzt ein anderes Format. HTML-Inhalte brauchen 😀 oder 😀 als Entitäten. CSS-Pseudo-Elemente brauchen die Escape-Form \1F600. JavaScript-Strings brauchen \u{1F600}. Diese manuell nachzuschlagen ist mühsam, dieses Tool erzeugt jedes Format sofort aus einer einzigen Emoji-Eingabe. Entwickler, Designer und Inhaltsersteller nutzen es, um Emojis sicher in Codebasen einzubetten, in denen das Kopieren roher Zeichen Kodierungsprobleme verursachen kann.

Unterstützte Ausgabeformate

Eine kurze Geschichte der Emoji und die Teile, die alle falsch verstehen

Die am häufigsten wiederholte Entstehungsgeschichte schreibt Shigetaka Kurita bei NTT DoCoMo die Erschaffung „des ersten Emoji“ in den Jahren 1998-1999 zu. Diese Geschichte ist wahr, aber unvollständig. Zwei Entwicklungen vor Kurita verdienen Erwähnung:

Wie Emoji in den Rest der Welt übersprangen

Ein Jahrzehnt lang nach Kuritas Satz waren Emoji ein Phänomen japanischer Mobilfunkanbieter, mit drei konkurrierenden und inkompatiblen Anbietersätzen (DoCoMo, KDDI, SoftBank). Der Übersprung geschah in drei Phasen:

Die Standardisierungsarbeit des Unicode-Konsortiums lief parallel. Oktober 2010, Unicode 6.0 war die erste Version des Standards, die Emoji als anerkannten Satz aufnahm und rund 722 Emoji aus der Vereinigung der japanischen Anbietersätze beisteuerte. August 2014, Unicode Technical Report #51 wurde veröffentlicht (im Mai 2017 später zu UTS #51 erhoben), die formale Spezifikation dafür, wie Emoji codiert, sequenziert und dargestellt werden.

Warum die meisten Emoji-Codepunkte oberhalb von U+FFFF liegen

Unicode ordnet jedes Zeichen in 17 „Ebenen“ (Planes) von je 65.536 Codepunkten ein. Ebene 0 ist die Basic Multilingual Plane (BMP), U+0000 bis U+FFFF. Die meiste alltägliche Schriftsprache lebt hier. Ebenen 1-16 sind ergänzende Ebenen (informell „astrale Ebenen“), U+10000 bis U+10FFFF. Die überwiegende Mehrheit der Emoji lebt in Ebene 1, der Supplementary Multilingual Plane, speziell in Blöcken wie Emoticons (U+1F600-U+1F64F), Miscellaneous Symbols and Pictographs (U+1F300-U+1F5FF), Transport and Map Symbols (U+1F680-U+1F6FF) und Supplemental Symbols and Pictographs (U+1F900-U+1F9FF). Der neuere Block Symbols and Pictographs Extended-A liegt bei U+1FA70-U+1FAFF.

Das ist für Entwickler wegen UTF-16 wichtig. UTF-16 codiert BMP-Codepunkte als eine einzelne 16-Bit-Einheit, aber ergänzende Codepunkte müssen als Surrogatpaar codiert werden: zwei 16-Bit-Einheiten, eine aus dem High-Surrogate-Bereich U+D800-U+DBFF und eine aus dem Low-Surrogate-Bereich U+DC00-U+DFFF. JavaScripts String-Typ ist intern UTF-16, weshalb "😀".length 2 statt 1 zurückgibt: Die Engine zählt Codeeinheiten, nicht Codepunkte. Moderner JS-Code verwendet Array.from("😀").length oder die Intl.Segmenter-API, um Graphemcluster korrekt zu zählen.

UTF-8 behandelt dasselbe Emoji als 4-Byte-Sequenz. Das Zeichen 😀 (U+1F600) ist F0 9F 98 80 in UTF-8. Deshalb kann MySQLs älterer Zeichensatz utf8 (der eigentlich utf8mb3 ist, auf 3-Byte-Sequenzen begrenzt) keine Emoji speichern, Sie brauchen utf8mb4. MySQL 8.0 machte utf8mb4 zum Standard, aber Altdatenbanken scheitern weiterhin daran, Emoji zu speichern, und kürzen sie stillschweigend oder geben je nach SQL-Modus einen Fehler aus. Das ist ein häufiger Fehler in der Praxis.

Variationsselektoren, warum dasselbe Herz schwarz oder rot aussehen kann

Eine Handvoll Unicode-Zeichen hat eine „Doppelnatur“: Sie können je nach Kontext als schlichtes monochromes Textsymbol oder als farbenfrohes Emoji erscheinen. Zwei Präsentationsselektoren wurden zu Unicode 3.2 (März 2002) hinzugefügt: U+FE0F (Variation Selector-16, VS16) fordert die Emoji-Darstellung an, und U+FE0E (VS15) fordert die Textdarstellung an. Beispiel: (U+2764, „Heavy Black Heart“) ist ein textstandardmäßiges Symbol; ❤️ (U+2764 U+FE0F) ist das rote Herz in Emoji-Darstellung, das die meisten Apps farbig wiedergeben. Derselbe Codepunkt mit und ohne VS16 sieht völlig anders aus.

Ein berühmtes verwandtes Beispiel ist die Sonne. U+2600 „Black Sun With Rays“ erscheint standardmäßig im monochromen Textstil; das Hinzufügen von VS16 (U+2600 U+FE0F) ergibt das farbenfrohe ☀️. Im Gegensatz dazu ist U+1F31E „Sun With Face“ ein eigener Codepunkt, der in Unicode 6.0 (Oktober 2010) hinzugefügt wurde, standardmäßig in Emoji-Darstellung, und wird als das lächelnde 🌞 wiedergegeben, ohne einen Selektor zu benötigen. Zwei verschiedene Codepunkte, zwei verschiedene Geschichten, beide informell „das Sonnen-Emoji“ genannt.

Hautton-Modifikatoren und die Fitzpatrick-Skala

In Unicode 8.0 (veröffentlicht am 17. Juni 2015) fügte der Standard fünf Modifikatorzeichen hinzu, die den Hautton jedes menschlich dargestellten Emoji anpassen. Die Modifikatoren basieren auf der Fitzpatrick-Skala, einer dermatologischen Klassifikation, die 1975 vom amerikanischen Dermatologen Thomas B. Fitzpatrick in Harvard entwickelt wurde. Die medizinische Skala hat sechs Typen (I bis VI). Für Emoji-Zwecke werden die Typen I und II zu einem einzigen Modifikator zusammengefasst, womit fünf Emoji-Modifikatoren übrig bleiben:

Die Verwendung ist positionsabhängig: Der Modifikator kommt unmittelbar nach einem unterstützten menschlichen Emoji. Zum Beispiel ergibt 👋 (U+1F44B, winkende Hand) + U+1F3FD das 👋🏽, das Winken mit mittlerem Hautton. Wenn die Schrift eines Empfängers eine bestimmte Basis-plus-Modifikator-Kombination nicht unterstützt, wird der Modifikator als separates braunes Quadrat wiedergegeben, ein häufiges Fehlverhalten auf älteren Systemen.

Zero-Width-Joiner-Sequenzen) wie zusammengesetzte Emoji aufgebaut werden

Der Zero-Width Joiner, Codepunkt U+200D, ist das „Klebe“-Zeichen, das mehrere Emoji zu einer zusammengesetzten Glyphe verbinden lässt, wenn der Renderer die Sequenz erkennt. ZWJ ist unsichtbar und hat keine Breite, es existiert allein, um der Rendering-Engine zu signalisieren, dass die umgebenden Zeichen verschmelzen sollen. Drei Muster dominieren:

Stark genutzt in Unicode 15.1 (veröffentlicht am 12. September 2023): In 15.1 wurden 118 neue Emoji hinzugefügt, von denen 108 Richtungsvarianten bestehender Emoji waren (Personen, die nach rechts statt standardmäßig nach links blicken). Entscheidend ist, dass 15.1 keine einzigen neuen Basis-Codepunkte hinzufügte: Jedes neue Emoji war eine aus bestehenden Komponenten aufgebaute Sequenz.

Keycaps, Regionalindikatoren und der Flaggen-Mechanismus

Keycap-Sequenzen. Ein Keycap-Emoji wie 1️⃣ wird aus drei Codepunkten aufgebaut: einer Ziffer (U+0031 = „1“), VS16 (U+FE0F) und dem Zeichen Combining Enclosing Keycap U+20E3. Das kombinierende Keycap wurde als Teil von Unicode 3.0 im Jahr 1999 genehmigt. Der vollständige Satz der Keycap-Emoji umfasst 0-9 sowie # und *. Die Drei-Zeichen-Sequenz bringt naive .length-Prüfungen ständig durcheinander.

Regionalindikator-Paare (Flaggen). Unicode codiert Nationalflaggen nicht als einzelne Zeichen. Stattdessen definiert es 26 Regional Indicator Symbols, Codepunkte U+1F1E6 bis U+1F1FF, von denen jeder einem lateinischen Buchstaben A bis Z entspricht. Eine Flagge ist ein Paar von Regionalindikatoren, das einen ISO-3166-1-Alpha-2-Ländercode buchstabiert. Die französische Flagge 🇫🇷 ist U+1F1EB U+1F1F7: die Regionalindikator-Buchstaben F und R. Von den 26 × 26 = 676 möglichen Paaren entsprechen nur etwa 270 gültigen ISO-Ländercodes; der Rest wird auf den meisten Plattformen als zwei Buchstabensymbole wiedergegeben.

Aktuelle Emoji-Versionen, kurz gefasst

Anbieter-Designs, derselbe Codepunkt, andere Grafik

Unicode standardisiert die Bedeutung und den Codepunkt, nie die Grafik. Jede Plattform liefert ihre eigene Emoji-Schrift aus, und die visuellen Unterschiede sind real genug, um in wissenschaftlichen Studien dokumentierte Missverständnisse verursacht zu haben (Hecht et al., CSCW 2018, über plattformübergreifende Emoji-Fehlinterpretation). Die wichtigsten Schriften:

Wenn die Schrift eines Geräts keine Glyphe für einen bestimmten Codepunkt oder eine bestimmte Sequenz hat, zeigen Browser und Betriebssysteme ein leeres Rechteck an, gemeinhin Tofu genannt. Tofu ist das stärkstmögliche Signal dafür, dass das Gerät des Empfängers älter ist als das des Absenders. Neue Emoji brauchen typischerweise sechs bis achtzehn Monate, um sich von einer Unicode-Veröffentlichung auf alle großen Plattformen zu verbreiten.

Barrierefreiheit, was Inhaltsersteller wissen sollten

Moderne Screenreader (NVDA, JAWS, VoiceOver, TalkBack) lesen den CLDR-Kurznamen jedes Emoji aus dem Unicode Common Locale Data Repository vor, zum Beispiel „grinsendes Gesicht“ für 😀, „Familie: Mann, Frau, Mädchen, Junge“ für 👨‍👩‍👧‍👦. Das Unicode CLDR pflegt offizielle Kurznamen und Schlüsselwörter in über 90 Sprachen, was jeder große Screenreader auf Apple- und Microsoft-Plattformen verwendet. Die WCAG-Technik H86 empfiehlt, bedeutungstragende Emoji in <span role="img" aria-label="thumbs up">👍</span> einzuschließen; dekorative Emoji sollten mit aria-hidden="true" verborgen werden. Drei Fallstricke: wiederholte Emoji werden weitschweifig (😂😂😂😂😂 wird fünfmal als „Gesicht mit Freudentränen“ gelesen); textbasierte Emoticons (:)) werden als „Doppelpunkt schließende Klammer“ ohne Unicode-Kurznamen gelesen; Hautton-Modifikatoren werden mitgelesen (👋🏽 wird als „winkende Hand: mittlerer Hautton“ gelesen, informativ, aber langsamer).

Emojipedia und die kulturelle Infrastruktur

Emojipedia wurde 2013 von Jeremy Burge gegründet, einem australischen Designer, der die Domain nach einem Geburtstagsessen aus einer Laune heraus registrierte. Sie ist heute die De-facto-Referenzseite für Emoji-Bedeutungen, Anbieter-Designs und die Berichterstattung über Veröffentlichungen und verzeichnete 2021 rund 590 Millionen Seitenaufrufe. Burge saß im Unicode Emoji Subcommittee, war bis 2022 Emojipedias „Chief Emoji Officer“ und schuf den Welt-Emoji-Tag (17. Juli): gewählt, weil Apples Kalender-Emoji 📅 das Datum 17. Juli anzeigt, was selbst eine Anspielung auf das ursprüngliche Startdatum von Apples iCal auf der Macworld Expo 2002 ist. Emojipedia wurde im August 2021 von Zedge, Inc. (NYSE: ZDGE) übernommen und wird weiterhin unter derselben Marke betrieben. Das Unicode Emoji Subcommittee, das neue Emoji-Vorschläge bewertet, wird derzeit von Jennifer Daniel geleitet, einer ehemaligen Google-Designleiterin, der ersten Frau an der Spitze des Unterausschusses.

Zahlen zum schnellen Nachschlagen

Verwandte Tools

Kostenlose Emoji-Auswahl HTML-Entity Encoder / Decoder Morsecode-Übersetzer Zeichenzähler