How can I search for a specific character?

Use the search box to find characters by name (e.g., "arrow", "heart", "copyright"). You can also filter by Unicode category (Letters, Symbols, Punctuation, etc.) to browse specific types of characters.

What does the HTML entity code do?

The HTML entity code (like © for ©) can be used in HTML/CSS to display special characters. This is useful when typing the character directly isn't possible or for cross-browser compatibility.

Is Unicode Character Map free to use?

Yes, Unicode Character Map is completely free with no sign-up required. All processing happens in your browser for maximum privacy.

Is my data safe when using Unicode Character Map?

Absolutely. Unicode Character Map runs 100% in your browser. No files are uploaded to any server, your data never leaves your device.

Do I need to install anything to use Unicode Character Map?

No installation needed. Unicode Character Map works directly in any modern web browser, Chrome, Firefox, Safari, or Edge.

Kostenlose Zeichentabelle

Durchsuchen Sie Unicode-Zeichen nach Kategorie, suchen Sie nach Name oder Codepunkt und kopieren Sie sie in die Zwischenablage.

Ihre Daten verlassen niemals Ihr Gerät

So funktioniert es

Klicken Sie auf einen Kategorie-Tab, um Zeichen dieser Gruppe anzuzeigen.
Klicken Sie auf ein beliebiges Zeichen, um seine Details und Kopier-Optionen zu sehen.
Nutzen Sie das Suchfeld, um Zeichen nach Name (z. B. „heart") oder Hex-Code (z. B. „2665") zu finden.
Klicken Sie auf Zeichen kopieren, um das ausgewählte Zeichen in Ihre Zwischenablage zu kopieren.

Häufige Fragen

Was ist ein Unicode-Codepunkt?

Ein Unicode-Codepunkt ist eine eindeutige Nummer, die jedem Zeichen im Unicode-Standard zugeordnet ist. Er wird im Hexadezimalformat geschrieben, oft mit dem Präfix U+ (z. B. U+2665 für ♥).

Was ist eine HTML-Entität?

Eine HTML-Entität ist ein spezieller Code, der ein Zeichen in HTML repräsentiert. Beispielsweise steht ♥ für ♥. Entitäten sind nützlich, wenn Sie ein Zeichen nicht direkt eingeben können.

Was ist CSS-Code?

CSS-Code nutzt die \-Notation, um ein Zeichen über seinen Unicode-Codepunkt in Stylesheets einzufügen. Beispielsweise fügt .heart::before { content: "\2665"; } ♥ ein.

Eine kurze Geschichte von Unicode

Vor Unicode hatte jede Region ihre eigene, inkompatible Zeichenkodierung: ASCII für Englisch, die ISO-8859-Familie für europäische Sprachen (8859-1 Latin-1, 8859-5 Kyrillisch, 8859-6 Arabisch), die Windows-Codepages 1252 / 1251 / 1253-1258, Mehrbyte-Sätze für ostasiatische Sprachen (Shift-JIS für Japanisch, Big5 für Traditionelles Chinesisch, GB2312 für Vereinfachtes Chinesisch, EUC-KR für Koreanisch). Nicht zusammenpassende Kodierungen erzeugten verstümmelten Text, der unter dem japanischen Begriff mojibake (文字化け, „Zeichenverwandlung“) bekannt ist; öffnete man eine japanische Seite in der falschen Kodierung, erhielt man Reihen von Fragezeichen oder zufällige Latin-1-Buchstaben.

Die Arbeit begann 1987 bei Xerox. Joe Becker begann zusammen mit Lee Collins und Mark Davis bei Apple, einen einzigen universellen Zeichensatz zu untersuchen, der den Flickenteppich ersetzen könnte. Beckers Entwurfsvorschlag vom August 1988, „Unicode 88“, erklärte: „Der Name ‚Unicode’ soll eine einzigartige, einheitliche, universelle Kodierung nahelegen.“ Das Unicode-Konsortium wurde im Januar 1991 gegründet und veröffentlichte im Oktober desselben Jahres Unicode 1.0 mit etwa 7.100 Zeichen aus 24 Schriften.

Mit Unicode 17.0 (veröffentlicht am 9. September 2025) enthält der Standard etwa 159.801 Zeichen aus 172 Schriften, mit Coderaum für 1.112.064 gültige Codepunkte, das heißt, Unicode hat rund 14 % seines möglichen Raums vergeben und hat noch Jahrzehnte an Spielraum. Wichtige jüngere Meilensteine: Unicode 6.0 (2010) war die erste Version, die Emoji formal kodierte (722 davon, übernommen von den japanischen Mobilfunkanbietern); Unicode 17.0 fügte vier neue Schriften hinzu (Sidetic, Tolong Siki, Beria Erfe, Tai Yo) und brachte die Gesamtzahl der CJK-Ideogramme über 100.000.

Codepunkte, Ebenen und Kodierungen

Ein Codepunkt ist einfach eine Zahl, hexadezimal geschrieben mit dem Präfix U+, etwa U+2665 für ♥. Codepunkte sind in 17 Ebenen zu je 65.536 Codepunkten gruppiert. Fast alles, was Sie je gelesen haben, liegt auf Ebene 0, der Basic Multilingual Plane (BMP, U+0000 bis U+FFFF). Ebene 1 (die Supplementary Multilingual Plane) enthält historische Schriften (Linear B, ägyptische Hieroglyphen, Keilschrift), Notenschrift und fast alle Emoji. Die Ebenen 2 und 3 sind CJK-Ideogramm-Erweiterungen. Die Ebenen 4 bis 13 sind nicht zugewiesen, für die Zukunft reserviert. Ebene 14 trägt Variationsselektoren und Emoji-Modifikatoren. Die Ebenen 15 und 16 sind Bereiche zur privaten Nutzung, in denen Schriften und Apps ihre eigenen Bedeutungen vergeben.

Ein Codepunkt ist einfach eine Zahl; eine Kodierung ist die Art, wie diese Zahl als Bytes gespeichert wird. Unicode definiert drei:

UTF-8: variable Breite, 1 bis 4 Bytes pro Zeichen. 1992 von Ken Thompson und Rob Pike bei den Bell Labs entworfen (auf einem Platzdeckchen in einem Diner in New Jersey skizziert). Die ersten 128 Codepunkte (ASCII) belegen genau 1 Byte mit demselben Binärwert wie ASCII, sodass eine reine ASCII-Datei bereits eine gültige UTF-8-Datei ist. Stand Januar 2026 wird UTF-8 von rund 98,9 % der Websites verwendet, die von der WHATWG empfohlene Kodierung und der Standard für neue Textprotokolle.
UTF-16: variable Breite, 2 oder 4 Bytes. BMP-Zeichen belegen 2 Bytes; Zeichen in den Ergänzungsebenen belegen 4 Bytes über Surrogatpaare (ein High-Surrogate U+D800-U+DBFF plus ein Low-Surrogate U+DC00-U+DFFF). Intern verwendet von Windows-APIs, Java, JavaScript (die String-.length zählt UTF-16-Codeeinheiten, weshalb ein Emoji oft „als 2 zählt“) und Qt. Weniger als 0,004 % der öffentlichen Webseiten verwenden es als Transportformat.
UTF-32: feste Breite, 4 Bytes pro Codepunkt. Einfach zu indizieren, aber platzineffizient. Intern von einigen Unix-Laufzeitumgebungen für die direkte Codepunkt-Indizierung verwendet; selten auf Datenträger oder Leitung.

Die 25 unsichtbaren Leerraumzeichen

Unicode kennzeichnet genau 25 Zeichen formal mit der Eigenschaft White_Space=yes: das normale Leerzeichen (U+0020), Tabulator, Zeilenvorschub, Wagenrücklauf, das geschützte Leerzeichen (U+00A0, das berühmte, das identisch zu einem normalen Leerzeichen aussieht, aber keinen Zeilenumbruch zulässt), die typografischen Breiten in U+2000-U+200A, die Zeilen- bzw. Absatztrennzeichen (U+2028 / U+2029), das schmale geschützte Leerzeichen, das in der französischen Typografie üblich ist (U+202F), das mittlere mathematische Leerzeichen (U+205F) und das vollbreite ideografische Leerzeichen (U+3000), das in CJK-Text verwendet wird.

Mehrere Zeichen sehen unsichtbar aus, sind aber nicht als Leerraum klassifiziert und verhalten sich anders als ein normales Leerzeichen:

U+200B Zero-Width Space: erlaubt einen Zeilenumbruch ohne sichtbare Lücke; nach Unicode-Klassifikation kein Leerraum.
U+200D Zero-Width Joiner: der Klebstoff in mehrteiligen Emoji wie Familien- oder Berufssequenzen.
U+200C Zero-Width Non-Joiner: steuert die Ligaturbildung.
U+00AD Soft Hyphen: unsichtbar, bis der Renderer die Zeile umbricht.
U+FEFF Byte Order Mark: am Dateianfang deklariert es die Bytereihenfolge; in der Mitte ein unsichtbares geschütztes Leerzeichen. Excels UTF-8-CSV-Exporte stellen eines voran, was in nachgelagerten Werkzeugen oft als unerwartetes führendes Zeichen in der ersten Spaltenüberschrift auftaucht.

Diese unsichtbaren Zeichen sind regelmäßig die Ursache von „Warum passt dieser String nicht?“-Debugging-Sitzungen; fügen Sie ein beliebiges Zeichen in die Suche einer Zeichentabelle ein, und sie nennt Ihnen den tatsächlichen Codepunkt, sodass Sie bestätigen können, ob Sie ein typografisches Anführungszeichen vor sich haben, das sich als gerades ausgibt, oder ein geschütztes Leerzeichen, wo ein normales stehen sollte.

Nützliche Zeichenbereiche

Block	Bereich	Beispiele
Latin-1-Ergänzung	U+0080-U+00FF	à ñ ü © ® ¥ § ° ¶
Griechisch	U+0370-U+03FF	α β γ π Σ Ω
Kyrillisch	U+0400-U+04FF	Russisch / Ukrainisch / Bulgarisch usw.
Allgemeine Interpunktion	U+2000-U+206F	-, … " " ' ' • † NBSP ZWSP
Währungssymbole	U+20A0-U+20CF	€ £ ¥ ₩ ₽ ₹ ₿
Buchstabenähnliche Symbole	U+2100-U+214F	™ ℠ № ℃ ℉ ℗
Pfeile	U+2190-U+21FF	← → ↑ ↓ ↔ ⇒ ⇐
Mathematische Operatoren	U+2200-U+22FF	∑ ∫ ∞ √ ≠ ≤ ≥ ± ∂ ∇ ∈ ∪ ∩
Rahmenzeichen	U+2500-U+257F	─ │ ┌ ┐ └ ┘ ├ ┤ ┬ ┴ ┼ ═ ║ ╔ ╗
Mathematische alphanumerische Zeichen	U+1D400-U+1D7FF	„Schmucktext“-Generatoren (𝓗𝓮𝓵𝓵𝓸) schöpfen hieraus.

Sonderzeichen im Alltagstext

Der Anwendungsfall „Ich muss nur ein einziges Symbol eintippen“, eine Schnellreferenz dessen, was dieses Werkzeug in zwei Klicks liefern soll:

Geviertstrich - U+2014 (—), Einschnitt auf Satzebene.
Halbgeviertstrich - U+2013 (–), Bereiche (1950-1975) und Paarungen (Boston-Hartford).
Auslassungspunkte … U+2026 (…), drei Punkte als ein einziges Zeichen.
Typografische Anführungszeichen: öffnend “ U+201C, schließend ” U+201D, öffnend ‘ U+2018, schließend ’ U+2019.
Geschütztes Leerzeichen U+00A0 ( ), hält „100 km“ zusammen.
Paragraf § U+00A7, Absatzzeichen ¶ U+00B6, Grad ° U+00B0.
Multiplikation × U+00D7, Division ÷ U+00F7, keines davon ist der Buchstabe x oder ein Schrägstrich.

Wann Sie zu einer Zeichentabelle greifen würden

Akzentbuchstaben tippen ohne das passende Tastaturlayout: résumé, jalapeño, fiancée, naïve.
Mathematik und Naturwissenschaft: ∑, ∫, ≠, π, ±, ∞, μ, Ω in ein Dokument einfügen, ohne den Formeleditor zu öffnen.
Währung: Das benötigte Symbol ist selten auf Ihrer Tastatur. Euro €, Yen ¥, Peso ₱, Rupie ₹.
Interpunktion in Rechts- und akademischen Texten: Geviertstriche, typografische Anführungszeichen, das Paragrafzeichen §, das Kreuz †.
Schmuck-Anzeigetext für Social-Media-Profile und Branding: Mathematische alphanumerische Symbole (U+1D400-U+1D7FF) lassen Sie Text stilisieren, ohne ein Bild zu verwenden.
CLI- und TUI-Design: Rahmenzeichen für ASCII-Art-Ränder, ncurses-Programme und README-Diagramme.
Kodierungsfehler debuggen: Fügen Sie ein Zeichen ein, um seinen tatsächlichen Codepunkt zu sehen, und bestätigen Sie, ob Sie ein typografisches Anführungszeichen vor sich haben, das sich als gerades ausgibt.

Sicherheit: das Homograph-Problem

Viele Unicode-Zeichen sehen über Schriften hinweg identisch aus. Das kyrillische Kleinbuchstaben-„а“ (U+0430) ist optisch nicht vom lateinischen „a“ (U+0061) zu unterscheiden. Angreifer registrieren internationalisierte Domainnamen, die wie legitime aussehen (zum Beispiel ein „apple.com“ mit einem kyrillischen а anstelle des lateinischen a) und nutzen sie für Phishing. Ein Angriff von 2017 auf adoḅe.com verwendete das ḅ mit untergesetztem Punkt (U+1E05), um Schadsoftware zu verbreiten. Moderne Browser entschärfen das mit restriktiven Regeln zur Schriftmischung und fallen auf die ASCII-Punycode-Form (xn--…) zurück, wenn eine Domain Schriften mischt; Safari ist besonders konservativ. Dieselbe Ähnlichkeitseigenschaft, die Unicode für menschliches Schreiben so reich macht, macht es in Domains gefährlich, und eine Zeichentabelle ist eine Möglichkeit, den tatsächlichen Codepunkt jedes Zeichens auf einen Blick zu bestätigen.

Weitere Fragen

Was ist der Unterschied zwischen einem Zeichen und einer Glyphe?

Ein Zeichen ist die abstrakte Einheit, die Unicode kodiert, der Buchstabe A, unabhängig von der Schriftart. Eine Glyphe ist die konkrete Darstellung dieses Zeichens in einer bestimmten Schrift: A in Helvetica, A in Garamond, A in Comic Sans sind alle dasselbe Zeichen, aber drei verschiedene Glyphen. Unicode kodiert Zeichen; Schriften liefern Glyphen.

Warum hat „1.0“ 7.000 Zeichen, „17.0“ aber 160.000?

Unicode 1.0 deckte 24 Schriften ab, die meisten der damals im regulären Computereinsatz befindlichen lebenden Schriftsysteme der Welt. Das Wachstum seither stammt aus drei Quellen: einer enormen Ausweitung der CJK-Ideogramm-Abdeckung (Aufnahme historischer chinesischer Schriftzeichen und seltener regionaler Varianten, Extension J fügte allein in Version 17.0 4.298 hinzu), der formalen Kodierung historischer Schriften (Linear B, Keilschrift, ägyptische Hieroglyphen, Phönizisch) und der Standardisierung von Emoji ab 2010.

Was ist eine HTML-Entität?

Eine Möglichkeit, ein Zeichen innerhalb von HTML mit einer speziellen Escape-Syntax zu kodieren. Es gibt benannte Entitäten für häufige Zeichen (© für ©, — für -) und numerische Entitäten für jeden Codepunkt (♥ oder ♥ für ♥). Sie sind nützlich, wenn das direkte Eintippen des Zeichens umständlich ist, etwa in Quellcode mit gemischten Kodierungen oder in einem System, das Nicht-ASCII entfernt.

Und CSS-Escapes?

CSS verwendet einen Backslash plus den hexadezimalen Codepunkt: .heart::before { content: "\2665"; } fügt ♥ ein. Nützlich in über ::before / ::after generierten Inhalten, in CSS-Zählerstilen und überall dort, wo man sich auf die Kodierung der Quelldatei nicht verlassen kann.

Werden Daten an einen Server gesendet?

Nein. Die Zeichendaten sind mit der Seite gebündelt; die Suche und die Kategoriefilterung laufen lokal in JavaScript; das Kopieren nutzt die Clipboard-API des Browsers. Nichts verlässt Ihr Gerät, und die Seite funktioniert offline, sobald sie geladen ist.