Convertidor de binario a texto

Convierte al instante entre binario y texto.

Ningún dato sale de tu dispositivo

Una breve historia de la representación binaria

El binario es la lengua fundamental de las computadoras, cada carácter, número e instrucción se representa en última instancia como una secuencia de 0 y 1, pero la idea precede a la computadora en 250 años. Gottfried Wilhelm Leibniz escribió la «Explication de l'Arithmétique Binaire» (presentada a la Academia Francesa de Ciencias en 1703, impresa en las Mémoires en 1705), la primera descripción formal occidental de la aritmética binaria. Leibniz se inspiró en parte en los trigramas y hexagramas del I Ching chino, que codifican cada patrón divinatorio como una pila de seis líneas enteras o partidas (esencialmente binario de 6 bits). El An Investigation of the Laws of Thought de George Boole (1854) dio al binario los fundamentos algebraicos (Y, O, NO, o-exclusivo) que aún sustentan todo circuito digital. La tesis de máster en el MIT de Claude Shannon, «A Symbolic Analysis of Relay and Switching Circuits» (presentada en agosto de 1937) dio el salto que conectó el álgebra booleana con la ingeniería eléctrica: cada circuito de relés e interruptores corresponde a una expresión booleana, y viceversa. La tesis de Shannon es ampliamente considerada la tesis de máster más influyente del siglo XX. Las primeras computadoras electrónicas mezclaban decimal (la ENIAC, 1945, usaba contadores decimales internamente) y binario (la Manchester Baby, junio de 1948, primera computadora binaria con programa almacenado; la EDSAC, mayo de 1949, la primera práctica); a principios de los años 1950 el binario era el predeterminado universal.

El byte de 8 bits llegó después. La palabra «byte» fue acuñada por Werner Buchholz en IBM en junio de 1956 durante el diseño de la IBM Stretch, originalmente con varias anchuras (6, 8, 9 bits). El byte de 8 bits fue estandarizado por IBM con el anuncio del System/360 el 7 de abril de 1964; a partir de ahí, «un byte» significaba 8 bits en toda la industria. (La literatura más antigua aclara a veces «octeto» para evitar ambigüedad, las especificaciones de la IETF aún prefieren «octeto» por esa razón.)

Codificaciones de caracteres, convertir letras en bits

El binario es la capa de fondo; la capa por encima es la codificación de caracteres que mapea letras y símbolos a patrones de bits específicos. El código Baudot (Émile Baudot, inventado en 1870, patentado en 1874) fue la primera codificación textual binaria de uso amplio, 5 bits por carácter, usado por teleimpresores y redes Telex durante más de un siglo. 5 bits dan solo 32 códigos, lo que obligó al código Baudot a usar caracteres de cambio (uno para letras, otro para números y puntuación) para ampliar el conjunto direccionable. El ASCII (American Standard Code for Information Interchange) se publicó como ASA X3.4-1963 el 17 de junio de 1963 por la American Standards Association (el organismo se renombró ANSI en 1969, por lo que la misma norma aparece después como ANSI X3.4-1986). ASCII usa 7 bits para codificar 128 caracteres: códigos de control (0-31), puntuación y dígitos (32-64), mayúsculas (65-90), más puntuación (91-96), minúsculas (97-122), puntuación final (123-127). La anchura de 7 bits se eligió por compatibilidad con el hardware telegráfico de cinta perforada. ASCII pasó a ser la codificación angloparlante dominante durante las dos décadas siguientes; la revisión canónica ANSI X3.4-1986 es esencialmente idéntica y es lo que hoy se quiere decir con «ASCII».

La familia ASCII extendido / ISO 8859 (ISO 8859-1 publicado en 1987, el resto durante los noventa) llenó los 128 caracteres altos de un byte de 8 bits con alfabetos regionales: Latin-1 cubría las lenguas de Europa occidental, Latin-2 las de Europa oriental, Latin-5 el turco, Cirílico-1, Griego-1, Árabe-1, Hebreo-1, Tailandés-1. Esto produjo quince codificaciones de 8 bits incompatibles entre sí: 0xE9 significaba é en Latin-1, pero un carácter distinto en Cirílico-1, indefinido en ASCII estricto, y otro carácter más en Mac Roman. El desajuste produjo la famosa condición mojibake (japonés: 文字化け, «transformación de caracteres», texto con apariencia corrupta por desajuste de codificación).

El proyecto Unicode nació como respuesta. El Consorcio Unicode se constituyó el 3 de enero de 1991; Unicode 1.0 se publicó en octubre de 1991 con unos 7.000 caracteres. Para Unicode 16.0 (publicado el 10 de septiembre de 2024) la norma cubre más de 154.000 caracteres en 168 escrituras. Unicode es un sistema de puntos de código, un identificador numérico único para cada carácter, pero no es directamente una codificación binaria. Existen varias codificaciones de Unicode: UTF-32 (4 bytes por carácter, anchura fija), UTF-16 (2 o 4 bytes, variable) y la dominante en la web moderna: UTF-8.

UTF-8 fue diseñado por Ken Thompson con Rob Pike en un mantel individual de un diner de Nueva Jersey alrededor del 2 de septiembre de 1992; Plan 9 ya corría sobre él el 8 de septiembre. UTF-8 es de longitud variable: 1 byte para caracteres ASCII (U+0000 a U+007F), 2 bytes para U+0080 a U+07FF, 3 bytes para U+0800 a U+FFFF, 4 bytes para U+10000 a U+10FFFF. Los bits altos de cada byte indican su posición en una secuencia multi-byte (0xxxxxxx = ASCII de 1 byte, 110xxxxx = primer byte de secuencia de 2 bytes, 10xxxxxx = byte de continuación, etc.) lo que hace a UTF-8 autosincronizante: puedes empezar a decodificar desde cualquier posición y encontrar la siguiente frontera de carácter mirando los siguientes pocos bytes. UTF-8 también es retrocompatible con ASCII: todo archivo ASCII es un archivo UTF-8 válido. En 2026, W3Techs informa que aproximadamente el 98,9 % de todas las páginas web declaran UTF-8 como su codificación, es de lejos la codificación textual del mundo.

Ejemplos binarios en ASCII

Algunos caracteres ASCII representativos en su forma binaria de 8 bits (con el 0 inicial porque ASCII es técnicamente de 7 bits pero alineado al byte):

«Hello» en ASCII se vuelve 01001000 01100101 01101100 01101100 01101111, cinco bytes, uno por carácter. En UTF-8 es idéntico porque cada carácter ASCII también es un carácter UTF-8 válido de 1 byte. «Café» en UTF-8 es 01000011 01100001 01100110 11000011 10101001, cuatro caracteres, pero cinco bytes, porque é (U+00E9) requiere dos bytes (11000011 10101001) en UTF-8.

La codificación multi-byte de UTF-8, mecánicamente

Las reglas de codificación de UTF-8 usan patrones específicos de bits altos para indicar la posición del byte. 1 byte (rango ASCII U+0000 a U+007F): 0xxxxxxx, el bit alto es 0, los 7 bits restantes son el punto de código. 2 bytes (U+0080 a U+07FF): 110xxxxx 10xxxxxx, el primer byte empieza por 110, el byte de continuación por 10; los bits x se combinan para dar el punto de código de 11 bits. 3 bytes (U+0800 a U+FFFF): 1110xxxx 10xxxxxx 10xxxxxx, el primer byte empieza por 1110, dos bytes de continuación; punto de código de 16 bits. 4 bytes (U+10000 a U+10FFFF): 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx, cubre todo el espacio Unicode incluyendo emojis. La letra rusa п (U+043F) necesita 2 bytes en UTF-8 (11010000 10111111); el carácter chino (U+4E2D) necesita 3 bytes; el emoji 🎉 (U+1F389) necesita 4 bytes. Codificar texto como binario UTF-8 produce siempre una secuencia válida; decodificar exige comprobar que los bytes de continuación tengan el prefijo 10 (de lo contrario la entrada es UTF-8 inválido y el decodificador suele reemplazar la secuencia errónea por el carácter de reemplazo U+FFFD).

Convenciones de notación

El texto binario aparece en la naturaleza con varias convenciones, todas refiriéndose a los mismos bytes subyacentes. Bytes separados por espacios: 01001000 01100101 01101100 01101100 01101111, la forma más legible, común en tutoriales y enigmas. Continuo sin espacios: 0100100001100101011011000110110001101111, más compacto, exige al lector saber que las fronteras de byte caen cada 8 dígitos. Separado por comas: 01001000,01100101,01101100,01101100,01101111, común en datos de prueba codificados en CSV. Pares hexadecimales (Base16): 48 65 6c 6c 6f, los mismos bytes mostrados con dos dígitos hex cada uno en lugar de ocho binarios; mucho más compacto y común en herramientas para programadores (hexdump, editores hex). Decimal: 72 101 108 108 111, el valor entero subyacente de cada byte. Esta herramienta acepta entrada binaria separada por espacios, comas o continua para conversión binario-a-texto; produce binario de 8 bits separado por espacios para la conversión texto-a-binario.

Usos habituales

Trampas de codificación que conviene conocer

Mojibake por desajuste de codificación. La misma secuencia de bytes interpretada bajo codificaciones distintas produce texto distinto (y normalmente confuso). 0xE9 es é en Latin-1 pero el comienzo de una secuencia UTF-8 inválida (todo byte ≥ 0x80 debe ser un byte de continuación o el inicio de una secuencia multi-byte). Cuando un archivo UTF-8 se abre como Latin-1, cada carácter UTF-8 multi-byte se convierte en 2-4 caracteres Latin-1 confusos, el modo de fallo canónico «Café» → «Café». BOM (marca de orden de bytes). Una secuencia de 2-3 bytes al inicio mismo de un archivo Unicode que indica el orden de los bytes: UTF-16 little-endian empieza por FF FE, UTF-16 big-endian por FE FF, BOM UTF-8 (raramente usado, a veces llamado «UTF-8 con BOM») por EF BB BF. El BOM ayuda a distinguir codificaciones Unicode pero solo es obligatorio para UTF-16 y UTF-32; la IETF desaconseja añadirlo a archivos UTF-8 porque rompe herramientas que esperan ver el contenido normal al inicio del archivo. El endianness importa para UTF-16 y UTF-32 (que ordenan los bytes de una unidad de código multi-byte) pero no para UTF-8 (codificado en flujo de bytes, el orden lo fija la spec, no el hardware).

Tabla de referencia ASCII

Privacidad: por qué solo navegador importa incluso aquí

Las conversiones binarias parecen inocuas, pero el texto que se convierte es justo el tipo de cosa donde la privacidad importa: enigmas con mensajes ocultos entre amigos, frases confidenciales codificadas para experimentos de esteganografía, cadenas sensibles depuradas por problemas de codificación o, simplemente, cualquier cosa donde el lector espera que el binario sea una representación privada. Esta herramienta corre por completo en tu navegador vía JavaScript, verifica en la pestaña Network de las DevTools mientras conviertes, o pon la página en modo avión después de cargar y el conversor sigue funcionando. Seguro para pistas de enigmas, cadenas sensibles de depuración o cualquier texto que no querrías ver copiado en el disco duro de un desconocido.

Preguntas frecuentes

¿Qué formato debe tener la entrada binaria?

Introduce valores binarios de 8 bits separados por espacios (p. ej. «01001000 01101001»). La herramienta también acepta valores sin espacio si cada byte tiene exactamente 8 dígitos, o separados por comas.

¿Admite emojis o caracteres no latinos?

La dirección texto→binario admite cualquier carácter Unicode · cada carácter se despliega en su representación binaria completa en codificación UTF-8. Para binario→texto, cada grupo de 8 bits se decodifica como un byte ASCII (0-255).

¿Por qué 8 dígitos por carácter?

Cada grupo de 8 dígitos binarios (bits) representa un byte. ASCII usa 7 bits (valores 0-127) pero suele mostrarse en 8 bits con un 0 inicial. Un byte puede representar 256 valores distintos (0-255), lo que cubre todos los caracteres estándar del teclado.

¿De dónde viene realmente el binario?

La idea matemática precede a las computadoras en 250 años. Gottfried Wilhelm Leibniz escribió la primera descripción formal occidental de la aritmética binaria en 1703 («Explication de l'Arithmétique Binaire»), inspirada en parte en los hexagramas del I Ching chino. Las Laws of Thought de George Boole (1854) dieron al binario sus fundamentos algebraicos (Y, O, NO). La tesis de Claude Shannon en el MIT (1937) conectó el álgebra booleana con los circuitos eléctricos de relés, el momento fundacional de la electrónica digital. Las primeras computadoras binarias electrónicas llegaron a finales de los 1940 (Manchester Baby junio de 1948, EDSAC mayo de 1949).

¿Cuál es la diferencia entre ASCII y UTF-8?

ASCII (1963) es una codificación de 7 bits y anchura fija que cubre 128 caracteres: alfabeto inglés básico, dígitos, puntuación común, códigos de control. UTF-8 (Thompson + Pike, 1992) es una codificación de longitud variable de toda la norma Unicode (~155.000 caracteres a partir de Unicode 16.0 en septiembre de 2024). UTF-8 es retrocompatible con ASCII: toda secuencia de bytes ASCII válida es también UTF-8 válido. La diferencia importa por encima del rango ASCII, é, , 🎉 todos necesitan varios bytes en UTF-8. En 2026, ~98,9 % de las páginas web declaran UTF-8 como su codificación (W3Techs).

¿Mis conversiones se envían a algún sitio?

No. La conversión corre por completo en tu navegador vía JavaScript. El texto y el binario que pegas no cruzan la red, verifica en la pestaña Network de las DevTools mientras pulsas Convertir, o pon la página en modo avión después de cargar y la herramienta sigue funcionando.

Herramientas relacionadas