What is the difference between emoji, Unicode code points, and UTF-8?

Emoji are visual characters. Unicode code points (like U+1F600) are numeric identifiers. UTF-8 is the encoding format that stores these as bytes. This tool shows all three representations.

Can I convert skin tone variations and compound emojis?

Yes, this tool handles emoji variants with skin tone modifiers (U+1F3FB-1F3FF) and zero-width joiners that create compound emojis like 👨👩👧👦.

Do I need to install anything to use Emoji Unicode Converter?

No installation needed. Emoji Unicode Converter works directly in any modern web browser, Chrome, Firefox, Safari, or Edge.

What file size limits does this tool have?

Since all processing happens in your browser, there are no server upload limits. Performance depends on your device memory and processing power.

¿Hay un límite de tamaño de archivo?

There is no hard server limit since all processing happens in your browser. However, very large files (over 50 MB) may be slower depending on your device memory and processor speed.

Conversor Unicode Emoji

Convierte emojis en puntos de código Unicode (U+XXXX) o pega puntos de código para obtener el emoji.

Emoji → Unicode

Pega un emoji

Unicode → Emoji

Pega los puntos de código

Detalles de los caracteres

Convierte un emoji arriba para ver los detalles de los caracteres.

Cómo usar

Introduce un emoji o un punto de código: pega un carácter emoji o escribe su punto de código Unicode (p. ej. U+1F600).
Visualiza todas las representaciones: la herramienta muestra el código decimal, el valor hex, la entidad HTML, el escape CSS, los bytes UTF-8 y la secuencia de escape JavaScript.
Copia cualquier formato: haz clic en un resultado para copiarlo al instante y usarlo en HTML, CSS o JavaScript.

¿Por qué usar el convertidor Emoji Unicode?

Los emojis se codifican en puntos Unicode, pero cada sistema usa un formato distinto. HTML necesita entidades 😀 o 😀. Los pseudoelementos CSS necesitan la forma escapada \1F600. Las cadenas JavaScript necesitan \u{1F600}. Buscarlos a mano es tedioso, esta herramienta genera cada formato al instante a partir de una simple entrada de emoji. Desarrolladores, diseñadores y creadores de contenido la usan para integrar emojis con seguridad en código donde el copiar-pegar de caracteres en bruto puede provocar problemas de codificación.

Formatos de salida admitidos

Punto Unicode, notación U+1F600 para referencia
Entidad HTML decimal, 😀 para páginas HTML
Entidad HTML hex, 😀 forma HTML alternativa
Escape CSS, \1F600 para usar en la propiedad CSS content
Escape JS, \u{1F600} para literales de cadena JavaScript
Bytes UTF-8, secuencia de bytes en bruto para el trabajo de codificación de bajo nivel

Una breve historia del emoji y las partes en las que todo el mundo se equivoca

La historia de origen más repetida atribuye a Shigetaka Kurita, de NTT DoCoMo, la creación del «primer emoji» en 1998-1999. Esa historia es cierta, pero incompleta. Dos avances anteriores a Kurita merecen una mención:

Sharp PA-8500 (octubre de 1988). El primer conjunto conocido de pictogramas que cumplen la definición moderna de «emoji» apareció en una agenda electrónica japonesa. Llevaba 102 pictogramas de 16×16 píxeles, una década antes que el conjunto de Kurita. Emojipedia cubrió el redescubrimiento en 2024 después de que unos investigadores encontraran unidades supervivientes del dispositivo.
J-Phone DP-211SW (1997). El propio Kurita reconoció en una publicación en redes sociales de enero de 2019 que el primer teléfono móvil con un conjunto de emoji no fue el de DoCoMo. Señaló el DP-211SW de J-Phone, que llevaba unos 90 pictogramas monocromos alrededor de 1997. SoftBank absorbió más tarde J-Phone, razón por la cual el primer despliegue de emoji de Apple en Japón (véase más abajo) se distribuyó específicamente para los titulares de SIM de SoftBank.
El conjunto i-mode de NTT DoCoMo de Shigetaka Kurita (1998-1999). Kurita dirigió el diseño de un conjunto de 176 emoji dibujados sobre una cuadrícula de 12×12 píxeles: unos 18 bytes por glifo, tres kilobytes para el conjunto completo, una restricción crítica para la plataforma i-mode, limitada en ancho de banda, que NTT DoCoMo lanzó en febrero de 1999. Se inspiró en los símbolos del manga japonés (manpu), los pictogramas meteorológicos, los kanji y las señales de tráfico. En 2016, el Museo de Arte Moderno (MoMA) de Nueva York adquirió el conjunto original de 176 emoji de Kurita para su colección permanente de diseño.

Cómo el emoji dio el salto al resto del mundo

Durante una década tras el conjunto de Kurita, el emoji fue un fenómeno de las operadoras japonesas, con tres conjuntos de proveedores rivales e incompatibles (DoCoMo, KDDI, SoftBank). El salto se produjo en tres etapas:

21 de noviembre de 2008, iPhone OS 2.2. Apple lanzó la primera versión de Apple Color Emoji (471 glifos individuales en el lanzamiento). El teclado estaba oficialmente restringido a los usuarios de iPhone en Japón con tarjetas SIM de SoftBank. Apple Color Emoji se cita ampliamente como la primera fuente en color distribuida en un sistema operativo importante.
12 de octubre de 2011, iOS 5. Apple lanzó iOS 5 en todo el mundo y, por primera vez, cualquiera podía activar el teclado de emoji en cualquier lugar desde un menú de Ajustes. La mayoría de los historiadores citan esto como el inicio del despegue mundial del emoji.
31 de octubre de 2013, Android 4.4 KitKat. La primera versión de Google con compatibilidad total con emoji en color y un teclado de emoji integrado. El conjunto de KitKat contenía unos 850 emoji e introdujo el característico diseño tipo gota de Google (sustituido desde Android 8 Oreo por el diseño redondo más convencional que vemos hoy).

El trabajo de normalización del Consorcio Unicode avanzó en paralelo. Octubre de 2010, Unicode 6.0 fue la primera versión del estándar en añadir el emoji como conjunto reconocido, aportando unos 722 emoji procedentes de la unión de los conjuntos de las operadoras japonesas. En agosto de 2014 se publicó el Informe Técnico de Unicode n.º 51 (más tarde promovido a UTS n.º 51 en mayo de 2017), la especificación formal de cómo se codifican, secuencian y presentan los emoji.

Por qué la mayoría de los puntos de código de los emoji están por encima de U+FFFF

Unicode organiza cada carácter en 17 «planos» de 65.536 puntos de código cada uno. El plano 0 es el Plano Multilingüe Básico (BMP), de U+0000 a U+FFFF. Aquí vive la mayor parte de la lengua escrita cotidiana. Los planos 1-16 son planos suplementarios (informalmente, «planos astrales»), de U+10000 a U+10FFFF. La inmensa mayoría de los emoji vive en el plano 1, el Plano Multilingüe Suplementario, en concreto en bloques como Emoticonos (U+1F600-U+1F64F), Símbolos y Pictogramas Diversos (U+1F300-U+1F5FF), Símbolos de Transporte y Mapas (U+1F680-U+1F6FF) y Símbolos y Pictogramas Suplementarios (U+1F900-U+1F9FF). El bloque más reciente, Símbolos y Pictogramas Extendido-A, se sitúa en U+1FA70-U+1FAFF.

Esto importa a los desarrolladores por culpa de UTF-16. UTF-16 codifica los puntos de código del BMP como una sola unidad de 16 bits, pero los puntos de código suplementarios deben codificarse como un par sustituto: dos unidades de 16 bits, una del rango de sustitutos altos U+D800-U+DBFF y otra del rango de sustitutos bajos U+DC00-U+DFFF. El tipo cadena de JavaScript es internamente UTF-16, razón por la cual "😀".length devuelve 2 en lugar de 1: el motor cuenta unidades de código, no puntos de código. El código JS moderno usa Array.from("😀").length o la API Intl.Segmenter para contar correctamente los grupos de grafemas.

UTF-8 maneja el mismo emoji como una secuencia de 4 bytes. El carácter 😀 (U+1F600) es F0 9F 98 80 en UTF-8. Por eso el antiguo juego de caracteres utf8 de MySQL (que en realidad es utf8mb3, limitado a secuencias de 3 bytes) no puede almacenar emoji: necesitas utf8mb4. MySQL 8.0 hizo de utf8mb4 el valor predeterminado, pero las bases de datos heredadas siguen siendo incapaces de almacenar emoji y truncan o dan error en silencio según el modo SQL. Este es un error frecuente en el mundo real.

Selectores de variación: por qué el mismo corazón puede verse negro o rojo

Un puñado de caracteres Unicode tiene una «doble personalidad»: pueden aparecer como un símbolo de texto monocromo o como un emoji colorido, según el contexto. A Unicode 3.2 (marzo de 2002) se añadieron dos selectores de presentación: U+FE0F (selector de variación 16, VS16) solicita la presentación de emoji, y U+FE0E (VS15) solicita la presentación de texto. Ejemplo: ❤ (U+2764, «corazón negro grueso») es un símbolo de texto por defecto; ❤️ (U+2764 U+FE0F) es el corazón rojo en presentación de emoji que la mayoría de las apps representan en color. El mismo punto de código con y sin VS16 se ve completamente distinto.

Un ejemplo relacionado famoso es el sol. U+2600 «sol negro con rayos» es por defecto monocromo de estilo texto; al añadir VS16 (U+2600 U+FE0F) se obtiene el colorido ☀️. En cambio, U+1F31E «sol con cara» es un punto de código aparte añadido en Unicode 6.0 (octubre de 2010), con presentación de emoji por defecto, y se representa como el sonriente 🌞 sin necesidad de ningún selector. Dos puntos de código distintos, dos historias distintas, ambos llamados informalmente «el emoji del sol».

Los modificadores de tono de piel y la escala de Fitzpatrick

En Unicode 8.0 (publicado el 17 de junio de 2015), el estándar añadió cinco caracteres modificadores que ajustan el tono de piel de cualquier emoji de aspecto humano. Los modificadores se basan en la escala de Fitzpatrick, una clasificación dermatológica desarrollada en 1975 por el dermatólogo estadounidense Thomas B. Fitzpatrick en Harvard. La escala médica tiene seis tipos (del I al VI). Para los emoji, los tipos I y II se fusionan en un único modificador, lo que deja cinco modificadores de emoji:

U+1F3FB Claro (Fitzpatrick I-II)
U+1F3FC Claro medio (Fitzpatrick III)
U+1F3FD Medio (Fitzpatrick IV)
U+1F3FE Oscuro medio (Fitzpatrick V)
U+1F3FF Oscuro (Fitzpatrick VI)

El uso es posicional: el modificador va inmediatamente después de un emoji humano compatible. Por ejemplo, 👋 (U+1F44B, mano saludando) + U+1F3FD produce 👋🏽, el saludo de tono medio. Si la fuente del destinatario no admite una combinación concreta de base y modificador, el modificador se representa como un cuadrado marrón separado, un modo de fallo habitual en los sistemas más antiguos.

Las secuencias de unión de ancho cero: cómo se construyen los emoji compuestos

La unión de ancho cero (Zero-Width Joiner), punto de código U+200D, es el carácter de «pegamento» que permite que varios emoji se combinen en un único glifo compuesto cuando el motor de representación reconoce la secuencia. El ZWJ es invisible y no tiene anchura; existe únicamente para indicar al motor de representación que los caracteres circundantes deben fusionarse. Predominan tres patrones:

Secuencias de familia. Un emoji de familia como 👨‍👩‍👧‍👦 («familia: hombre, mujer, niña, niño») se codifica como U+1F468 U+200D U+1F469 U+200D U+1F467 U+200D U+1F466: cuatro emoji de persona separados por ZWJ. Si el dispositivo receptor no tiene el glifo compuesto específico, la solución de reserva es mostrar cada componente uno al lado del otro. Este es uno de los fallos visibles más comunes de la representación de emoji entre plataformas.
Secuencias de profesión y rol. 👩‍💻 («mujer tecnóloga») es U+1F469 U+200D U+1F4BB: mujer + ZWJ + portátil. La mayoría de los emoji de profesión del Unicode actual se construyen así, lo que evita que el estándar tenga que acuñar un punto de código aparte para cada combinación de trabajo y tono de piel.
Secuencias de identidad y orgullo. La bandera del arcoíris 🏳️‍🌈 es U+1F3F3 U+FE0F U+200D U+1F308: bandera blanca con VS16 + ZWJ + arcoíris.

Se usó mucho en Unicode 15.1 (publicado el 12 de septiembre de 2023): en la 15.1 se añadieron 118 emoji nuevos, de los cuales 108 eran variantes direccionales de emoji existentes (personas mirando a la derecha en lugar de a la izquierda por defecto). Y algo crucial: la 15.1 añadió cero puntos de código base nuevos: cada emoji nuevo era una secuencia construida a partir de componentes existentes.

Teclas, indicadores regionales y el mecanismo de las banderas

Secuencias de tecla. Un emoji de tecla como 1️⃣ se construye a partir de tres puntos de código: un dígito (U+0031 = «1»), VS16 (U+FE0F) y el carácter de tecla envolvente combinante U+20E3. La tecla combinante se aprobó como parte de Unicode 3.0 en 1999. El conjunto completo de emoji de tecla cubre del 0 al 9 más # y *. La secuencia de tres caracteres confunde constantemente a las comprobaciones ingenuas de .length.

Pares de indicadores regionales (banderas). Unicode no codifica las banderas nacionales como caracteres únicos. En su lugar, define 26 símbolos indicadores regionales, los puntos de código U+1F1E6 a U+1F1FF, cada uno correspondiente a una letra latina de la A a la Z. Una bandera es un par de indicadores regionales que deletrea un código de país ISO 3166-1 alfa-2. La bandera francesa 🇫🇷 es U+1F1EB U+1F1F7: las letras indicadoras regionales F y R. De los 26 × 26 = 676 pares posibles, solo unos 270 corresponden a códigos de país ISO válidos; el resto se representa como dos símbolos de letra en la mayoría de las plataformas.

Versiones recientes de emoji, en breve

Unicode 15.0, publicado el 13 de septiembre de 2022. Añadió 31 emoji nuevos, entre ellos el corazón rosa 🩷, el corazón azul claro 🩵, el corazón gris 🩶, la mano que empuja 🫷🫸, la cara que tiembla 🫨, la medusa 🪼, el alce 🫎, el burro 🫏 y la raíz de jengibre 🫚.
Unicode 15.1, publicado el 12 de septiembre de 2023. Añadió 118 emoji nuevos, todos secuencias ZWJ en lugar de nuevos puntos de código base. 108 eran variantes direccionales; el resto incluía el fénix 🐦‍🔥, la lima 🍋‍🟩, el champiñón marrón comestible 🍄‍🟫 y la cadena rota ⛓️‍💥.
Unicode 16.0, publicado el 10 de septiembre de 2024. Añadió 8 emoji nuevos: cara con ojeras 🫩 (U+1FAE9), huella dactilar 🫆 (U+1FAC6), salpicadura 🫟 (U+1FADF), tubérculo 🫜 (U+1FADC), árbol sin hojas 🪾 (U+1FABE), arpa 🪉 (U+1FA89), pala 🪏 (U+1FA8F) y bandera de Sark 🇨🇶. Nota: la nueva cara se llama oficialmente «cara con ojeras», no «cara con bostezo» (el emoji de la cara bostezando 🥱 U+1F971 se añadió en Unicode 12.0 en 2019 y no tiene relación).
Unicode 17.0, publicado el 9 de septiembre de 2025. Añadió 7 emoji nuevos con punto de código propio: cara distorsionada, nube de pelea, criatura peluda (informalmente, Pie Grande), orca, deslizamiento de tierra, trombón y cofre del tesoro. Más 156 variaciones derivadas de tono de piel y género, lo que eleva el total de emoji nuevos de la 17.0 a 163. La mayoría de los grandes proveedores planean el despliegue a lo largo del primer semestre de 2026; Microsoft suele ir con un trimestre o dos de retraso.

Diseños de cada proveedor: el mismo punto de código, distinta ilustración

Unicode normaliza el significado y el punto de código, nunca la ilustración. Cada plataforma distribuye su propia fuente de emoji, y las diferencias visuales son lo bastante reales como para haber causado problemas de comunicación documentados en estudios académicos (Hecht et al., CSCW 2018, sobre la mala interpretación de emoji entre plataformas). Las fuentes principales:

Apple Color Emoji se distribuye en iOS, iPadOS, macOS y tvOS. Se lanzó por primera vez en noviembre de 2008 con 471 glifos; se amplió a más de 3.633 en septiembre de 2021. Es propietaria; no puede redistribuirse legalmente fuera de las plataformas de Apple.
Noto Color Emoji (Google) se distribuye en Android (desde la 4.4 KitKat, octubre de 2013), ChromeOS y Gmail. Es de código abierto bajo la licencia SIL Open Font License.
Segoe UI Emoji (Microsoft) se distribuye desde Windows 8.1 en adelante. La renovación Fluent Emoji de 2021 introdujo diseños de estilo 3D en Microsoft 365.
One UI Emoji (Samsung) en los teléfonos Galaxy, distinta de la Noto de Google a pesar de que Android usa Noto por defecto.
Twemoji, liberada como código abierto por Twitter el 6 de noviembre de 2014 con 874 diseños SVG (código con licencia MIT, gráficos con CC-BY 4.0). El repositorio original de Twitter no se mantiene de forma activa desde el cambio de marca a X; las bifurcaciones comunitarias (en especial jdecked/twemoji) llevan el estándar adelante.

Cuando la fuente de un dispositivo no tiene glifo para un punto de código o una secuencia concretos, los navegadores y los sistemas operativos muestran un rectángulo en blanco, llamado comúnmente tofu. El tofu es la señal más clara posible de que el dispositivo del destinatario es más antiguo que el del remitente. Los emoji nuevos suelen tardar de seis a dieciocho meses en propagarse desde una versión de Unicode a todas las plataformas principales.

Accesibilidad: lo que deberían saber los autores de contenido

Los lectores de pantalla modernos (NVDA, JAWS, VoiceOver, TalkBack) leen en voz alta el nombre corto de CLDR de cada emoji del Repositorio Común de Datos Locales de Unicode, por ejemplo «cara sonriente» para 😀 o «familia: hombre, mujer, niña, niño» para 👨‍👩‍👧‍👦. El CLDR de Unicode mantiene nombres cortos y palabras clave oficiales en más de 90 idiomas, que es lo que usa todo lector de pantalla importante en las plataformas de Apple y Microsoft. La técnica H86 de las WCAG recomienda envolver los emoji con significado en <span role="img" aria-label="thumbs up">👍</span>; los emoji decorativos deberían ocultarse con aria-hidden="true". Tres trampas: los emoji repetidos se vuelven prolijos (😂😂😂😂😂 se lee como «cara con lágrimas de alegría» cinco veces); los emoticonos de estilo texto (:)) se leen como «dos puntos paréntesis de cierre» sin ningún nombre corto de Unicode; los modificadores de tono de piel se leen en voz alta (👋🏽 se lee como «mano saludando: tono de piel medio», informativo pero más lento).

Emojipedia y la infraestructura cultural

Emojipedia fue fundada en 2013 por Jeremy Burge, un diseñador australiano que registró el dominio por capricho tras una cena de cumpleaños. Hoy es el sitio de referencia de facto para los significados de los emoji, los diseños de cada proveedor y la cobertura de los lanzamientos, con unos 590 millones de páginas vistas en 2021. Burge formó parte del Subcomité de Emoji de Unicode, ejerció de «Chief Emoji Officer» de Emojipedia hasta 2022 y creó el Día Mundial del Emoji (17 de julio): elegido porque el emoji de calendario de Apple 📅 muestra la fecha del 17 de julio, a su vez un guiño a la fecha de lanzamiento original del iCal de Apple en la Macworld Expo de 2002. Emojipedia fue adquirida por Zedge, Inc. (NYSE: ZDGE) en agosto de 2021 y sigue operando bajo la misma marca. El Subcomité de Emoji de Unicode, que evalúa las propuestas de nuevos emoji, está presidido actualmente por Jennifer Daniel, antigua responsable de diseño de Google, la primera mujer en presidir el subcomité.

Cifras de referencia rápida

3.953: total de emoji a fecha de Unicode 17.0 (septiembre de 2025)
176: el conjunto i-mode original de Kurita (1999)
102: número de pictogramas del Sharp PA-8500 (1988)
12×12: cuadrícula de píxeles de los emoji i-mode de Kurita
5: número de modificadores de tono de piel (Fitzpatrick I y II fusionados)
U+200D: unión de ancho cero (Zero-Width Joiner)
U+FE0F / U+FE0E: selectores de presentación de emoji / texto
U+20E3: tecla envolvente combinante
U+1F1E6 a U+1F1FF: letras indicadoras regionales de la A a la Z usadas para construir pares de banderas
F0 9F 98 80: bytes UTF-8 de U+1F600 (😀)
17 de julio: Día Mundial del Emoji
21 de noviembre de 2008: iPhone OS 2.2, primera fuente de emoji en color
12 de octubre de 2011: iOS 5, teclado de emoji disponible en todo el mundo
octubre de 2010: Unicode 6.0, primera versión del estándar con emoji
17 de junio de 2015: Unicode 8.0, modificadores de tono de piel añadidos

Herramientas relacionadas

Selector de Emoji gratuito Codificador / Decodificador de entidades HTML Traductor de código Morse Contador de caracteres