How can I search for a specific character?

Use the search box to find characters by name (e.g., "arrow", "heart", "copyright"). You can also filter by Unicode category (Letters, Symbols, Punctuation, etc.) to browse specific types of characters.

What does the HTML entity code do?

The HTML entity code (like © for ©) can be used in HTML/CSS to display special characters. This is useful when typing the character directly isn't possible or for cross-browser compatibility.

Is Unicode Character Map free to use?

Yes, Unicode Character Map is completely free with no sign-up required. All processing happens in your browser for maximum privacy.

Is my data safe when using Unicode Character Map?

Absolutely. Unicode Character Map runs 100% in your browser. No files are uploaded to any server, your data never leaves your device.

Do I need to install anything to use Unicode Character Map?

No installation needed. Unicode Character Map works directly in any modern web browser, Chrome, Firefox, Safari, or Edge.

Mapa de caracteres gratuito

Explora caracteres Unicode por categoría, busca por nombre o punto de código, y cópialos al portapapeles.

Tus datos no salen de tu dispositivo

Cómo usar

Haz clic en una pestaña de categoría para mostrar los caracteres de ese grupo.
Haz clic en un carácter para ver sus detalles y las opciones de copia.
Usa la barra de búsqueda para encontrar caracteres por nombre (p. ej. «heart») o código hex (p. ej. «2665»).
Haz clic en Copiar el carácter para copiar el carácter seleccionado al portapapeles.

Preguntas frecuentes

¿Qué es un punto de código Unicode?

Un punto de código Unicode es un número único asignado a cada carácter del estándar Unicode. Se escribe en formato hexadecimal, a menudo con el prefijo U+ (p. ej. U+2665 para ♥).

¿Qué es una entidad HTML?

Una entidad HTML es un código especial que representa un carácter en HTML. Por ejemplo, ♥ representa ♥. Las entidades son útiles cuando no se puede teclear directamente un carácter.

¿Qué es el código CSS?

El código CSS usa la notación \\ para insertar un carácter a partir de su punto de código Unicode en las hojas de estilo. Por ejemplo, .heart::before { content: "\\2665"; } inserta ♥.

Una breve historia de Unicode

Antes de Unicode, cada región tenía su propia codificación de caracteres incompatible: ASCII para el inglés, la familia ISO 8859 para las lenguas europeas (8859-1 Latin-1, 8859-5 cirílico, 8859-6 árabe), las páginas de códigos de Windows 1252 / 1251 / 1253-1258, los conjuntos multibyte para las lenguas de Asia Oriental (Shift-JIS para el japonés, Big5 para el chino tradicional, GB2312 para el chino simplificado, EUC-KR para el coreano). Las codificaciones no coincidentes producían un texto ilegible conocido por el término japonés mojibake (文字化け, «transformación de caracteres»): abrir una página japonesa con la codificación equivocada te daba filas de signos de interrogación o letras Latin-1 aleatorias.

El trabajo comenzó en 1987 en Xerox. Joe Becker, con Lee Collins y Mark Davis en Apple, empezó a investigar un único conjunto universal de caracteres que pudiera reemplazar el mosaico. La propuesta de borrador de Becker de agosto de 1988, «Unicode 88», explicaba: «el nombre 'Unicode' pretende sugerir una codificación única, unificada y universal». El Consorcio Unicode se constituyó en enero de 1991 y lanzó Unicode 1.0 en octubre de ese año con unos 7100 caracteres en 24 sistemas de escritura.

A fecha de Unicode 17.0 (publicado el 9 de septiembre de 2025), el estándar contiene unos 159.801 caracteres en 172 sistemas de escritura, con espacio de código asignado para 1.112.064 puntos de código válidos, lo que significa que Unicode ha asignado aproximadamente el 14 % de su espacio posible y tiene décadas de margen. Hitos recientes importantes: Unicode 6.0 (2010) fue la primera versión en codificar formalmente los emojis (722 de ellos, tomados de los operadores japoneses); Unicode 17.0 añadió cuatro sistemas de escritura nuevos (sidético, tolong siki, beria erfe, tai yo) y elevó el recuento total de ideogramas CJK por encima de 100.000.

Puntos de código, planos y codificaciones

Un punto de código es simplemente un número, escrito en hexadecimal con un prefijo U+, como U+2665 para ♥. Los puntos de código se agrupan en 17 planos de 65.536 puntos de código cada uno. Casi todo lo que has leído en tu vida vive en el Plano 0, el Plano Multilingüe Básico (BMP, de U+0000 a U+FFFF). El Plano 1 (el Plano Multilingüe Suplementario) contiene los sistemas de escritura históricos (lineal B, jeroglíficos egipcios, cuneiforme), la notación musical y casi todos los emojis. Los planos 2 y 3 son extensiones de ideogramas CJK. Los planos del 4 al 13 están sin asignar, reservados para el futuro. El plano 14 lleva los selectores de variación y los modificadores de emoji. Los planos 15 y 16 son áreas de uso privado donde las fuentes y las aplicaciones asignan sus propios significados.

Un punto de código es simplemente un número; una codificación es cómo ese número se almacena como bytes. Unicode define tres:

UTF-8: ancho variable, de 1 a 4 bytes por carácter. Diseñada por Ken Thompson y Rob Pike en los Bell Labs en 1992 (esbozada en el mantel de un restaurante de Nueva Jersey). Los primeros 128 puntos de código (ASCII) ocupan exactamente 1 byte con el mismo valor binario que ASCII, así que un archivo de ASCII puro ya es un archivo UTF-8 válido. A fecha de enero de 2026, UTF-8 lo usa aproximadamente el 98,9 % de los sitios web, la codificación recomendada por el WHATWG y la predeterminada para los nuevos protocolos de texto.
UTF-16: ancho variable, 2 o 4 bytes. Los caracteres del BMP ocupan 2 bytes; los caracteres de los planos suplementarios ocupan 4 bytes mediante pares sustitutos (un sustituto alto U+D800-U+DBFF más un sustituto bajo U+DC00-U+DFFF). Lo usan internamente las API de Windows, Java, JavaScript (la .length de una cadena cuenta unidades de código UTF-16, razón por la cual un emoji a menudo «cuenta como 2») y Qt. Menos del 0,004 % de las páginas web públicas lo usan como transporte.
UTF-32: ancho fijo, 4 bytes por punto de código. Sencillo de indexar, pero poco eficiente en espacio. Lo usan internamente algunos entornos de ejecución de Unix para la indexación directa de puntos de código; raro en disco o en transmisión.

Los 25 caracteres invisibles de espacio en blanco

Unicode etiqueta formalmente exactamente 25 caracteres con la propiedad White_Space=yes: el espacio normal (U+0020), el tabulador, el salto de línea, el retorno de carro, el espacio de no separación (U+00A0, el famoso que se ve idéntico a un espacio normal pero no se rompe entre líneas), las anchuras tipográficas de U+2000 a U+200A, los separadores de línea y de párrafo (U+2028 / U+2029), el espacio fino de no separación común en la tipografía francesa (U+202F), el espacio matemático medio (U+205F) y el espacio ideográfico de ancho completo (U+3000) usado en el texto CJK.

Varios caracteres parecen invisibles, pero no están clasificados como espacio en blanco y se comportan de forma diferente a un espacio normal:

U+200B, espacio de ancho cero: permite un salto de línea sin un hueco visible; no es espacio en blanco según la clasificación de Unicode.
U+200D, ensamblador de ancho cero: el pegamento dentro de los emojis de varios caracteres, como las secuencias de familia o de profesión.
U+200C, no ensamblador de ancho cero: controla la unión de ligaduras.
U+00AD, guion discrecional: invisible hasta que el renderizador rompe la línea.
U+FEFF, marca de orden de bytes: al principio de un archivo declara el orden de bytes (endianness); en medio, un espacio de no separación invisible. Las exportaciones CSV en UTF-8 de Excel anteponen una, que a menudo aparece en las herramientas posteriores como un carácter inicial inesperado en el encabezado de la primera columna.

Estos caracteres invisibles son habitualmente la causa de las sesiones de depuración del tipo «¿por qué no coincide esta cadena?»: pega cualquier carácter en la búsqueda de un mapa de caracteres y te dirá el punto de código real, para que puedas confirmar si estás mirando una comilla tipográfica que se hace pasar por una recta, o un NBSP donde debería haber un espacio normal.

Rangos de caracteres útiles

Bloque	Rango	Ejemplos
Suplemento Latin-1	U+0080-U+00FF	à ñ ü © ® ¥ § ° ¶
Griego	U+0370-U+03FF	α β γ π Σ Ω
Cirílico	U+0400-U+04FF	Ruso / ucraniano / búlgaro, etc.
Puntuación general	U+2000-U+206F	-, … " " ' ' • † NBSP ZWSP
Símbolos de moneda	U+20A0-U+20CF	€ £ ¥ ₩ ₽ ₹ ₿
Símbolos similares a letras	U+2100-U+214F	™ ℠ № ℃ ℉ ℗
Flechas	U+2190-U+21FF	← → ↑ ↓ ↔ ⇒ ⇐
Operadores matemáticos	U+2200-U+22FF	∑ ∫ ∞ √ ≠ ≤ ≥ ± ∂ ∇ ∈ ∪ ∩
Dibujo de cajas	U+2500-U+257F	─ │ ┌ ┐ └ ┘ ├ ┤ ┬ ┴ ┼ ═ ║ ╔ ╗
Alfanuméricos matemáticos	U+1D400-U+1D7FF	Los generadores de «texto elegante» (𝓗𝓮𝓵𝓵𝓸) se nutren de aquí.

Caracteres especiales en la escritura cotidiana

El caso de uso de «solo necesito escribir un símbolo»: una referencia rápida de lo que esta herramienta existe para ofrecer en dos clics:

Raya - U+2014 (—), corte a nivel de oración.
Semirraya - U+2013 (–): rangos (1950-1975) y emparejamientos (Boston-Hartford).
Puntos suspensivos … U+2026 (…), tres puntos como un solo carácter.
Comillas tipográficas: apertura " U+201C, cierre " U+201D, apertura ' U+2018, cierre ' U+2019.
Espacio de no separación U+00A0 ( ), mantiene «100 km» juntos.
Sección § U+00A7, Calderón ¶ U+00B6, Grado ° U+00B0.
Multiplicación × U+00D7, División ÷ U+00F7; ninguno es la letra x ni una barra.

Cuándo recurrirías a un mapa de caracteres

Escribir letras acentuadas sin la distribución de teclado adecuada: résumé, jalapeño, fiancée, naïve.
Matemáticas y ciencia: pegar ∑, ∫, ≠, π, ±, ∞, μ, Ω en un documento sin abrir el editor de ecuaciones.
Moneda: el símbolo que necesitas rara vez está en tu teclado. Euro €, yen ¥, peso ₱, rupia ₹.
Puntuación en la escritura jurídica y académica: rayas, comillas tipográficas, el signo de sección §, la cruz †.
Texto decorativo para biografías de redes sociales y branding: los símbolos alfanuméricos matemáticos (U+1D400-U+1D7FF) te permiten estilizar el texto sin usar una imagen.
Diseño de CLI y TUI: los caracteres de dibujo de cajas para los bordes de arte ASCII, los programas ncurses y los diagramas de README.
Depurar errores de codificación: pega un carácter para ver su punto de código real y confirmar si tienes una comilla tipográfica que se hace pasar por una recta.

Seguridad: el problema de los homógrafos

Muchos caracteres Unicode se ven idénticos entre alfabetos. La «а» minúscula cirílica (U+0430) es visualmente indistinguible de la «a» latina (U+0061). Los atacantes registran nombres de dominio internacionalizados que se parecen a los legítimos (por ejemplo, un «apple.com» con una а cirílica en lugar de la a latina) y los usan para el phishing. Un ataque de 2017 a adoḅe.com usó la ḅ con punto inferior (U+1E05) para distribuir malware. Los navegadores modernos lo mitigan con reglas restrictivas de mezcla de alfabetos, recurriendo a la forma ASCII Punycode (xn--…) cuando un dominio mezcla alfabetos; Safari es especialmente conservador. La misma propiedad de parecido que hace que Unicode sea rico para la escritura humana lo hace peligroso en los dominios, y un mapa de caracteres es una forma de confirmar de un vistazo el punto de código real de cada carácter.

Más preguntas

¿Cuál es la diferencia entre un carácter y un glifo?

Un carácter es la unidad abstracta que Unicode codifica, la letra A, con independencia del tipo de letra. Un glifo es el dibujo específico de ese carácter en una fuente concreta: A en Helvetica, A en Garamond, A en Comic Sans son todos el mismo carácter, pero tres glifos diferentes. Unicode codifica caracteres; las fuentes incluyen glifos.

¿Por qué «1.0» tiene 7000 caracteres pero «17.0» tiene 160.000?

Unicode 1.0 cubría 24 sistemas de escritura, la mayoría de los sistemas de escritura vivos del mundo que entonces estaban en uso informático habitual. El crecimiento desde entonces ha venido de tres lugares: la ampliación enorme de la cobertura de ideogramas CJK (incorporando caracteres chinos históricos y variantes regionales raras; la Extensión J añadió 4298 solo en la versión 17.0), la codificación formal de sistemas de escritura históricos (lineal B, cuneiforme, jeroglíficos egipcios, fenicio) y la estandarización de los emojis a partir de 2010.

¿Qué es una entidad HTML?

Una forma de codificar un carácter dentro de HTML usando una sintaxis de escape especial. Hay entidades con nombre para los caracteres comunes (© para ©, — para -) y entidades numéricas para cualquier punto de código (♥ o ♥ para ♥). Son útiles cuando escribir el carácter directamente resulta incómodo, por ejemplo, en código fuente con codificaciones mezcladas, o en un sistema que elimina lo que no es ASCII.

¿Y las secuencias de escape de CSS?

CSS usa una barra invertida más el punto de código hexadecimal: .heart::before { content: "\2665"; } inserta ♥. Es útil dentro del contenido generado con ::before / ::after, en los estilos de contador de CSS y en cualquier lugar donde no se pueda confiar en la codificación del archivo de origen.

¿Se envía algo a un servidor?

No. Los datos de los caracteres se incluyen con la página; la búsqueda y el filtrado por categorías se ejecutan localmente en JavaScript; Copiar usa la API Clipboard del navegador. Nada sale de tu dispositivo, y la página funciona sin conexión una vez cargada.

Herramientas relacionadas

Codificador / Decodificador de entidades HTML Convertidor de mayúsculas y minúsculas Codificador / Decodificador de entidades HTML