Kostenlose Zeichentabelle

Durchsuchen Sie Unicode-Zeichen nach Kategorie, suchen Sie nach Name oder Codepunkt und kopieren Sie sie in die Zwischenablage.

Ihre Daten verlassen niemals Ihr Gerät

So funktioniert es

  1. Klicken Sie auf einen Kategorie-Tab, um Zeichen dieser Gruppe anzuzeigen.
  2. Klicken Sie auf ein beliebiges Zeichen, um seine Details und Kopier-Optionen zu sehen.
  3. Nutzen Sie das Suchfeld, um Zeichen nach Name (z. B. „heart") oder Hex-Code (z. B. „2665") zu finden.
  4. Klicken Sie auf Zeichen kopieren, um das ausgewählte Zeichen in Ihre Zwischenablage zu kopieren.

Häufige Fragen

Was ist ein Unicode-Codepunkt?

Ein Unicode-Codepunkt ist eine eindeutige Nummer, die jedem Zeichen im Unicode-Standard zugeordnet ist. Er wird im Hexadezimalformat geschrieben, oft mit dem Präfix U+ (z. B. U+2665 für ♥).

Was ist eine HTML-Entität?

Eine HTML-Entität ist ein spezieller Code, der ein Zeichen in HTML repräsentiert. Beispielsweise steht ♥ für ♥. Entitäten sind nützlich, wenn Sie ein Zeichen nicht direkt eingeben können.

Was ist CSS-Code?

CSS-Code nutzt die \-Notation, um ein Zeichen über seinen Unicode-Codepunkt in Stylesheets einzufügen. Beispielsweise fügt .heart::before { content: "\2665"; } ♥ ein.

Eine kurze Geschichte von Unicode

Vor Unicode hatte jede Region ihre eigene, inkompatible Zeichenkodierung: ASCII für Englisch, die ISO-8859-Familie für europäische Sprachen (8859-1 Latin-1, 8859-5 Kyrillisch, 8859-6 Arabisch), die Windows-Codepages 1252 / 1251 / 1253-1258, Mehrbyte-Sätze für ostasiatische Sprachen (Shift-JIS für Japanisch, Big5 für Traditionelles Chinesisch, GB2312 für Vereinfachtes Chinesisch, EUC-KR für Koreanisch). Nicht zusammenpassende Kodierungen erzeugten verstümmelten Text, der unter dem japanischen Begriff mojibake (文字化け, „Zeichenverwandlung“) bekannt ist; öffnete man eine japanische Seite in der falschen Kodierung, erhielt man Reihen von Fragezeichen oder zufällige Latin-1-Buchstaben.

Die Arbeit begann 1987 bei Xerox. Joe Becker begann zusammen mit Lee Collins und Mark Davis bei Apple, einen einzigen universellen Zeichensatz zu untersuchen, der den Flickenteppich ersetzen könnte. Beckers Entwurfsvorschlag vom August 1988, „Unicode 88“, erklärte: „Der Name ‚Unicode’ soll eine einzigartige, einheitliche, universelle Kodierung nahelegen.“ Das Unicode-Konsortium wurde im Januar 1991 gegründet und veröffentlichte im Oktober desselben Jahres Unicode 1.0 mit etwa 7.100 Zeichen aus 24 Schriften.

Mit Unicode 17.0 (veröffentlicht am 9. September 2025) enthält der Standard etwa 159.801 Zeichen aus 172 Schriften, mit Coderaum für 1.112.064 gültige Codepunkte, das heißt, Unicode hat rund 14 % seines möglichen Raums vergeben und hat noch Jahrzehnte an Spielraum. Wichtige jüngere Meilensteine: Unicode 6.0 (2010) war die erste Version, die Emoji formal kodierte (722 davon, übernommen von den japanischen Mobilfunkanbietern); Unicode 17.0 fügte vier neue Schriften hinzu (Sidetic, Tolong Siki, Beria Erfe, Tai Yo) und brachte die Gesamtzahl der CJK-Ideogramme über 100.000.

Codepunkte, Ebenen und Kodierungen

Ein Codepunkt ist einfach eine Zahl, hexadezimal geschrieben mit dem Präfix U+, etwa U+2665 für ♥. Codepunkte sind in 17 Ebenen zu je 65.536 Codepunkten gruppiert. Fast alles, was Sie je gelesen haben, liegt auf Ebene 0, der Basic Multilingual Plane (BMP, U+0000 bis U+FFFF). Ebene 1 (die Supplementary Multilingual Plane) enthält historische Schriften (Linear B, ägyptische Hieroglyphen, Keilschrift), Notenschrift und fast alle Emoji. Die Ebenen 2 und 3 sind CJK-Ideogramm-Erweiterungen. Die Ebenen 4 bis 13 sind nicht zugewiesen, für die Zukunft reserviert. Ebene 14 trägt Variationsselektoren und Emoji-Modifikatoren. Die Ebenen 15 und 16 sind Bereiche zur privaten Nutzung, in denen Schriften und Apps ihre eigenen Bedeutungen vergeben.

Ein Codepunkt ist einfach eine Zahl; eine Kodierung ist die Art, wie diese Zahl als Bytes gespeichert wird. Unicode definiert drei:

Die 25 unsichtbaren Leerraumzeichen

Unicode kennzeichnet genau 25 Zeichen formal mit der Eigenschaft White_Space=yes: das normale Leerzeichen (U+0020), Tabulator, Zeilenvorschub, Wagenrücklauf, das geschützte Leerzeichen (U+00A0, das berühmte, das identisch zu einem normalen Leerzeichen aussieht, aber keinen Zeilenumbruch zulässt), die typografischen Breiten in U+2000-U+200A, die Zeilen- bzw. Absatztrennzeichen (U+2028 / U+2029), das schmale geschützte Leerzeichen, das in der französischen Typografie üblich ist (U+202F), das mittlere mathematische Leerzeichen (U+205F) und das vollbreite ideografische Leerzeichen (U+3000), das in CJK-Text verwendet wird.

Mehrere Zeichen sehen unsichtbar aus, sind aber nicht als Leerraum klassifiziert und verhalten sich anders als ein normales Leerzeichen:

Diese unsichtbaren Zeichen sind regelmäßig die Ursache von „Warum passt dieser String nicht?“-Debugging-Sitzungen; fügen Sie ein beliebiges Zeichen in die Suche einer Zeichentabelle ein, und sie nennt Ihnen den tatsächlichen Codepunkt, sodass Sie bestätigen können, ob Sie ein typografisches Anführungszeichen vor sich haben, das sich als gerades ausgibt, oder ein geschütztes Leerzeichen, wo ein normales stehen sollte.

Nützliche Zeichenbereiche

BlockBereichBeispiele
Latin-1-ErgänzungU+0080-U+00FFà ñ ü © ® ¥ § ° ¶
GriechischU+0370-U+03FFα β γ π Σ Ω
KyrillischU+0400-U+04FFRussisch / Ukrainisch / Bulgarisch usw.
Allgemeine InterpunktionU+2000-U+206F-, … " " ' ' • † NBSP ZWSP
WährungssymboleU+20A0-U+20CF€ £ ¥ ₩ ₽ ₹ ₿
Buchstabenähnliche SymboleU+2100-U+214F™ ℠ № ℃ ℉ ℗
PfeileU+2190-U+21FF← → ↑ ↓ ↔ ⇒ ⇐
Mathematische OperatorenU+2200-U+22FF∑ ∫ ∞ √ ≠ ≤ ≥ ± ∂ ∇ ∈ ∪ ∩
RahmenzeichenU+2500-U+257F─ │ ┌ ┐ └ ┘ ├ ┤ ┬ ┴ ┼ ═ ║ ╔ ╗
Mathematische alphanumerische ZeichenU+1D400-U+1D7FF„Schmucktext“-Generatoren (𝓗𝓮𝓵𝓵𝓸) schöpfen hieraus.

Sonderzeichen im Alltagstext

Der Anwendungsfall „Ich muss nur ein einziges Symbol eintippen“, eine Schnellreferenz dessen, was dieses Werkzeug in zwei Klicks liefern soll:

Wann Sie zu einer Zeichentabelle greifen würden

Sicherheit: das Homograph-Problem

Viele Unicode-Zeichen sehen über Schriften hinweg identisch aus. Das kyrillische Kleinbuchstaben-„а“ (U+0430) ist optisch nicht vom lateinischen „a“ (U+0061) zu unterscheiden. Angreifer registrieren internationalisierte Domainnamen, die wie legitime aussehen (zum Beispiel ein „apple.com“ mit einem kyrillischen а anstelle des lateinischen a) und nutzen sie für Phishing. Ein Angriff von 2017 auf adoḅe.com verwendete das ḅ mit untergesetztem Punkt (U+1E05), um Schadsoftware zu verbreiten. Moderne Browser entschärfen das mit restriktiven Regeln zur Schriftmischung und fallen auf die ASCII-Punycode-Form (xn--…) zurück, wenn eine Domain Schriften mischt; Safari ist besonders konservativ. Dieselbe Ähnlichkeitseigenschaft, die Unicode für menschliches Schreiben so reich macht, macht es in Domains gefährlich, und eine Zeichentabelle ist eine Möglichkeit, den tatsächlichen Codepunkt jedes Zeichens auf einen Blick zu bestätigen.

Weitere Fragen

Was ist der Unterschied zwischen einem Zeichen und einer Glyphe?

Ein Zeichen ist die abstrakte Einheit, die Unicode kodiert, der Buchstabe A, unabhängig von der Schriftart. Eine Glyphe ist die konkrete Darstellung dieses Zeichens in einer bestimmten Schrift: A in Helvetica, A in Garamond, A in Comic Sans sind alle dasselbe Zeichen, aber drei verschiedene Glyphen. Unicode kodiert Zeichen; Schriften liefern Glyphen.

Warum hat „1.0“ 7.000 Zeichen, „17.0“ aber 160.000?

Unicode 1.0 deckte 24 Schriften ab, die meisten der damals im regulären Computereinsatz befindlichen lebenden Schriftsysteme der Welt. Das Wachstum seither stammt aus drei Quellen: einer enormen Ausweitung der CJK-Ideogramm-Abdeckung (Aufnahme historischer chinesischer Schriftzeichen und seltener regionaler Varianten, Extension J fügte allein in Version 17.0 4.298 hinzu), der formalen Kodierung historischer Schriften (Linear B, Keilschrift, ägyptische Hieroglyphen, Phönizisch) und der Standardisierung von Emoji ab 2010.

Was ist eine HTML-Entität?

Eine Möglichkeit, ein Zeichen innerhalb von HTML mit einer speziellen Escape-Syntax zu kodieren. Es gibt benannte Entitäten für häufige Zeichen (© für ©, — für -) und numerische Entitäten für jeden Codepunkt (♥ oder ♥ für ♥). Sie sind nützlich, wenn das direkte Eintippen des Zeichens umständlich ist, etwa in Quellcode mit gemischten Kodierungen oder in einem System, das Nicht-ASCII entfernt.

Und CSS-Escapes?

CSS verwendet einen Backslash plus den hexadezimalen Codepunkt: .heart::before { content: "\2665"; } fügt ♥ ein. Nützlich in über ::before / ::after generierten Inhalten, in CSS-Zählerstilen und überall dort, wo man sich auf die Kodierung der Quelldatei nicht verlassen kann.

Werden Daten an einen Server gesendet?

Nein. Die Zeichendaten sind mit der Seite gebündelt; die Suche und die Kategoriefilterung laufen lokal in JavaScript; das Kopieren nutzt die Clipboard-API des Browsers. Nichts verlässt Ihr Gerät, und die Seite funktioniert offline, sobald sie geladen ist.

Verwandte Tools

HTML-Entity Encoder / Decoder Groß-/Kleinschreibungskonverter HTML-Entity Encoder / Decoder