Conversor Unicode Emoji

Convierte emojis en puntos de código Unicode (U+XXXX) o pega puntos de código para obtener el emoji.

Emoji → Unicode

Unicode → Emoji

Detalles de los caracteres

Convierte un emoji arriba para ver los detalles de los caracteres.

Cómo usar

  1. Introduce un emoji o un punto de código: pega un carácter emoji o escribe su punto de código Unicode (p. ej. U+1F600).
  2. Visualiza todas las representaciones: la herramienta muestra el código decimal, el valor hex, la entidad HTML, el escape CSS, los bytes UTF-8 y la secuencia de escape JavaScript.
  3. Copia cualquier formato: haz clic en un resultado para copiarlo al instante y usarlo en HTML, CSS o JavaScript.

¿Por qué usar el convertidor Emoji Unicode?

Los emojis se codifican en puntos Unicode, pero cada sistema usa un formato distinto. HTML necesita entidades 😀 o 😀. Los pseudoelementos CSS necesitan la forma escapada \1F600. Las cadenas JavaScript necesitan \u{1F600}. Buscarlos a mano es tedioso, esta herramienta genera cada formato al instante a partir de una simple entrada de emoji. Desarrolladores, diseñadores y creadores de contenido la usan para integrar emojis con seguridad en código donde el copiar-pegar de caracteres en bruto puede provocar problemas de codificación.

Formatos de salida admitidos

Una breve historia del emoji y las partes en las que todo el mundo se equivoca

La historia de origen más repetida atribuye a Shigetaka Kurita, de NTT DoCoMo, la creación del «primer emoji» en 1998-1999. Esa historia es cierta, pero incompleta. Dos avances anteriores a Kurita merecen una mención:

Cómo el emoji dio el salto al resto del mundo

Durante una década tras el conjunto de Kurita, el emoji fue un fenómeno de las operadoras japonesas, con tres conjuntos de proveedores rivales e incompatibles (DoCoMo, KDDI, SoftBank). El salto se produjo en tres etapas:

El trabajo de normalización del Consorcio Unicode avanzó en paralelo. Octubre de 2010, Unicode 6.0 fue la primera versión del estándar en añadir el emoji como conjunto reconocido, aportando unos 722 emoji procedentes de la unión de los conjuntos de las operadoras japonesas. En agosto de 2014 se publicó el Informe Técnico de Unicode n.º 51 (más tarde promovido a UTS n.º 51 en mayo de 2017), la especificación formal de cómo se codifican, secuencian y presentan los emoji.

Por qué la mayoría de los puntos de código de los emoji están por encima de U+FFFF

Unicode organiza cada carácter en 17 «planos» de 65.536 puntos de código cada uno. El plano 0 es el Plano Multilingüe Básico (BMP), de U+0000 a U+FFFF. Aquí vive la mayor parte de la lengua escrita cotidiana. Los planos 1-16 son planos suplementarios (informalmente, «planos astrales»), de U+10000 a U+10FFFF. La inmensa mayoría de los emoji vive en el plano 1, el Plano Multilingüe Suplementario, en concreto en bloques como Emoticonos (U+1F600-U+1F64F), Símbolos y Pictogramas Diversos (U+1F300-U+1F5FF), Símbolos de Transporte y Mapas (U+1F680-U+1F6FF) y Símbolos y Pictogramas Suplementarios (U+1F900-U+1F9FF). El bloque más reciente, Símbolos y Pictogramas Extendido-A, se sitúa en U+1FA70-U+1FAFF.

Esto importa a los desarrolladores por culpa de UTF-16. UTF-16 codifica los puntos de código del BMP como una sola unidad de 16 bits, pero los puntos de código suplementarios deben codificarse como un par sustituto: dos unidades de 16 bits, una del rango de sustitutos altos U+D800-U+DBFF y otra del rango de sustitutos bajos U+DC00-U+DFFF. El tipo cadena de JavaScript es internamente UTF-16, razón por la cual "😀".length devuelve 2 en lugar de 1: el motor cuenta unidades de código, no puntos de código. El código JS moderno usa Array.from("😀").length o la API Intl.Segmenter para contar correctamente los grupos de grafemas.

UTF-8 maneja el mismo emoji como una secuencia de 4 bytes. El carácter 😀 (U+1F600) es F0 9F 98 80 en UTF-8. Por eso el antiguo juego de caracteres utf8 de MySQL (que en realidad es utf8mb3, limitado a secuencias de 3 bytes) no puede almacenar emoji: necesitas utf8mb4. MySQL 8.0 hizo de utf8mb4 el valor predeterminado, pero las bases de datos heredadas siguen siendo incapaces de almacenar emoji y truncan o dan error en silencio según el modo SQL. Este es un error frecuente en el mundo real.

Selectores de variación: por qué el mismo corazón puede verse negro o rojo

Un puñado de caracteres Unicode tiene una «doble personalidad»: pueden aparecer como un símbolo de texto monocromo o como un emoji colorido, según el contexto. A Unicode 3.2 (marzo de 2002) se añadieron dos selectores de presentación: U+FE0F (selector de variación 16, VS16) solicita la presentación de emoji, y U+FE0E (VS15) solicita la presentación de texto. Ejemplo: (U+2764, «corazón negro grueso») es un símbolo de texto por defecto; ❤️ (U+2764 U+FE0F) es el corazón rojo en presentación de emoji que la mayoría de las apps representan en color. El mismo punto de código con y sin VS16 se ve completamente distinto.

Un ejemplo relacionado famoso es el sol. U+2600 «sol negro con rayos» es por defecto monocromo de estilo texto; al añadir VS16 (U+2600 U+FE0F) se obtiene el colorido ☀️. En cambio, U+1F31E «sol con cara» es un punto de código aparte añadido en Unicode 6.0 (octubre de 2010), con presentación de emoji por defecto, y se representa como el sonriente 🌞 sin necesidad de ningún selector. Dos puntos de código distintos, dos historias distintas, ambos llamados informalmente «el emoji del sol».

Los modificadores de tono de piel y la escala de Fitzpatrick

En Unicode 8.0 (publicado el 17 de junio de 2015), el estándar añadió cinco caracteres modificadores que ajustan el tono de piel de cualquier emoji de aspecto humano. Los modificadores se basan en la escala de Fitzpatrick, una clasificación dermatológica desarrollada en 1975 por el dermatólogo estadounidense Thomas B. Fitzpatrick en Harvard. La escala médica tiene seis tipos (del I al VI). Para los emoji, los tipos I y II se fusionan en un único modificador, lo que deja cinco modificadores de emoji:

El uso es posicional: el modificador va inmediatamente después de un emoji humano compatible. Por ejemplo, 👋 (U+1F44B, mano saludando) + U+1F3FD produce 👋🏽, el saludo de tono medio. Si la fuente del destinatario no admite una combinación concreta de base y modificador, el modificador se representa como un cuadrado marrón separado, un modo de fallo habitual en los sistemas más antiguos.

Las secuencias de unión de ancho cero: cómo se construyen los emoji compuestos

La unión de ancho cero (Zero-Width Joiner), punto de código U+200D, es el carácter de «pegamento» que permite que varios emoji se combinen en un único glifo compuesto cuando el motor de representación reconoce la secuencia. El ZWJ es invisible y no tiene anchura; existe únicamente para indicar al motor de representación que los caracteres circundantes deben fusionarse. Predominan tres patrones:

Se usó mucho en Unicode 15.1 (publicado el 12 de septiembre de 2023): en la 15.1 se añadieron 118 emoji nuevos, de los cuales 108 eran variantes direccionales de emoji existentes (personas mirando a la derecha en lugar de a la izquierda por defecto). Y algo crucial: la 15.1 añadió cero puntos de código base nuevos: cada emoji nuevo era una secuencia construida a partir de componentes existentes.

Teclas, indicadores regionales y el mecanismo de las banderas

Secuencias de tecla. Un emoji de tecla como 1️⃣ se construye a partir de tres puntos de código: un dígito (U+0031 = «1»), VS16 (U+FE0F) y el carácter de tecla envolvente combinante U+20E3. La tecla combinante se aprobó como parte de Unicode 3.0 en 1999. El conjunto completo de emoji de tecla cubre del 0 al 9 más # y *. La secuencia de tres caracteres confunde constantemente a las comprobaciones ingenuas de .length.

Pares de indicadores regionales (banderas). Unicode no codifica las banderas nacionales como caracteres únicos. En su lugar, define 26 símbolos indicadores regionales, los puntos de código U+1F1E6 a U+1F1FF, cada uno correspondiente a una letra latina de la A a la Z. Una bandera es un par de indicadores regionales que deletrea un código de país ISO 3166-1 alfa-2. La bandera francesa 🇫🇷 es U+1F1EB U+1F1F7: las letras indicadoras regionales F y R. De los 26 × 26 = 676 pares posibles, solo unos 270 corresponden a códigos de país ISO válidos; el resto se representa como dos símbolos de letra en la mayoría de las plataformas.

Versiones recientes de emoji, en breve

Diseños de cada proveedor: el mismo punto de código, distinta ilustración

Unicode normaliza el significado y el punto de código, nunca la ilustración. Cada plataforma distribuye su propia fuente de emoji, y las diferencias visuales son lo bastante reales como para haber causado problemas de comunicación documentados en estudios académicos (Hecht et al., CSCW 2018, sobre la mala interpretación de emoji entre plataformas). Las fuentes principales:

Cuando la fuente de un dispositivo no tiene glifo para un punto de código o una secuencia concretos, los navegadores y los sistemas operativos muestran un rectángulo en blanco, llamado comúnmente tofu. El tofu es la señal más clara posible de que el dispositivo del destinatario es más antiguo que el del remitente. Los emoji nuevos suelen tardar de seis a dieciocho meses en propagarse desde una versión de Unicode a todas las plataformas principales.

Accesibilidad: lo que deberían saber los autores de contenido

Los lectores de pantalla modernos (NVDA, JAWS, VoiceOver, TalkBack) leen en voz alta el nombre corto de CLDR de cada emoji del Repositorio Común de Datos Locales de Unicode, por ejemplo «cara sonriente» para 😀 o «familia: hombre, mujer, niña, niño» para 👨‍👩‍👧‍👦. El CLDR de Unicode mantiene nombres cortos y palabras clave oficiales en más de 90 idiomas, que es lo que usa todo lector de pantalla importante en las plataformas de Apple y Microsoft. La técnica H86 de las WCAG recomienda envolver los emoji con significado en <span role="img" aria-label="thumbs up">👍</span>; los emoji decorativos deberían ocultarse con aria-hidden="true". Tres trampas: los emoji repetidos se vuelven prolijos (😂😂😂😂😂 se lee como «cara con lágrimas de alegría» cinco veces); los emoticonos de estilo texto (:)) se leen como «dos puntos paréntesis de cierre» sin ningún nombre corto de Unicode; los modificadores de tono de piel se leen en voz alta (👋🏽 se lee como «mano saludando: tono de piel medio», informativo pero más lento).

Emojipedia y la infraestructura cultural

Emojipedia fue fundada en 2013 por Jeremy Burge, un diseñador australiano que registró el dominio por capricho tras una cena de cumpleaños. Hoy es el sitio de referencia de facto para los significados de los emoji, los diseños de cada proveedor y la cobertura de los lanzamientos, con unos 590 millones de páginas vistas en 2021. Burge formó parte del Subcomité de Emoji de Unicode, ejerció de «Chief Emoji Officer» de Emojipedia hasta 2022 y creó el Día Mundial del Emoji (17 de julio): elegido porque el emoji de calendario de Apple 📅 muestra la fecha del 17 de julio, a su vez un guiño a la fecha de lanzamiento original del iCal de Apple en la Macworld Expo de 2002. Emojipedia fue adquirida por Zedge, Inc. (NYSE: ZDGE) en agosto de 2021 y sigue operando bajo la misma marca. El Subcomité de Emoji de Unicode, que evalúa las propuestas de nuevos emoji, está presidido actualmente por Jennifer Daniel, antigua responsable de diseño de Google, la primera mujer en presidir el subcomité.

Cifras de referencia rápida

Herramientas relacionadas

Selector de Emoji gratuito Codificador / Decodificador de entidades HTML Traductor de código Morse Contador de caracteres