Convertidor Word a PDF

Convierte tus archivos Word (.docx) en PDF al instante. Sin registro. Tus archivos nunca salen de tu dispositivo.

Tus archivos nunca salen de tu dispositivo
Suelta un archivo de Word aquí o haz clic para navegar

Admite .docx · hasta 25 MB

Nota: los formatos complejos como tablas, imágenes y columnas pueden simplificarse durante la conversión.

Cómo funciona

  1. Importa un archivo de Word: suelta o selecciona un archivo .docx para convertir.
  2. Configura las opciones: elige el tamaño de página y los márgenes deseados.
  3. Convierte: haz clic en «Convertir a PDF» para generar tu PDF. La conversión se realiza al instante en tu navegador.

¿Por qué convertir a PDF?

El PDF es el formato universal de documento. Convertir documentos de Word a PDF garantiza un formato coherente en todos los dispositivos y sistemas operativos, hace que los documentos sean de solo lectura para evitar modificaciones accidentales, reduce el tamaño del archivo y resulta idóneo para compartir, archivar y envíos profesionales. Los PDF son compatibles en todas partes y preservan tu formato original.

Qué significa realmente «DOCX a PDF»

Un archivo `.docx` no es un único documento como aparece en Word. Es un archivo ZIP (el contenedor Open Packaging Conventions definido en ISO/IEC 29500-2) que guarda un árbol de archivos XML, imágenes incrustadas y metadatos de relaciones. El texto principal del documento vive en word/document.xml como marcado WordprocessingML; los estilos de párrafo en word/styles.xml; la numeración de listas en word/numbering.xml; las imágenes incrustadas en word/media/. Renombra cualquier `.docx` como `.zip` y descomprímelo para ver la estructura con un editor de texto. El formato se introdujo con Microsoft Office 2007, se normalizó como ECMA-376 en diciembre de 2006 y como ISO/IEC 29500 en 2008, y hoy es el formato Word por defecto usado por cientos de millones de autores.

Un PDF (Portable Document Format) describe el paradigma opuesto: páginas de maquetación fija con glifos en coordenadas exactas, fuentes incrustadas y posicionamiento absoluto. Donde DOCX es basado en flujo (el texto se redistribuye al cambiar el tamaño de página, los márgenes o las fuentes), PDF es posicionado al píxel (cada carácter ocupa un punto concreto del sistema de coordenadas de la página). Convertir entre ambos es, estructuralmente, traducir entre paradigmas: un formato de redacción flexible se vuelve un formato de presentación congelado. Toda herramienta de conversión, desde el propio Microsoft Word, pasando por el convertidor sin interfaz de LibreOffice, el motor en la nube de Smallpdf, hasta esta herramienta de navegador, enfrenta la misma brecha inherente: la fuente describe la intención, el destino describe la apariencia, y la intención debe quedar fijada a una apariencia concreta durante la conversión.

Las distintas estrategias de conversión aceptan distintos compromisos ante esa brecha. El propio «Guardar como PDF» de Word usa el mismo motor de renderizado que muestra el documento en pantalla, así que la conversión es esencialmente «renderizar a una superficie PDF en lugar de a una superficie de pantalla»; la fidelidad es excelente y el texto se selecciona en la salida. Los servicios en la nube suelen usar LibreOffice en servidor o un motor propietario; la fidelidad es alta, el texto se selecciona, el archivo se sube. Esta herramienta del navegador usa otra canalización (descrita en la sección siguiente) que optimiza para privacidad y alcance (cualquier navegador, cualquier dispositivo, sin instalación, sin subida) y acepta una pérdida de fidelidad a cambio. Ningún enfoque es universalmente el mejor; cada uno encaja con flujos de trabajo distintos.

Cómo funciona esta herramienta por dentro

La conversión se ejecuta totalmente en tu navegador a través de una canalización de tres etapas: mammoth.js analiza el DOCX para producir HTML semántico, html2canvas (invocada por html2pdf.js) pinta ese HTML sobre un elemento `<canvas>` fuera de pantalla usando las primitivas de renderizado del propio navegador, y jsPDF (también invocada por html2pdf.js) envuelve el canvas como datos de imagen JPEG, lo coloca en una página PDF y añade los saltos de página en las fronteras que implican el tamaño de página y los márgenes configurados. El PDF de salida es una secuencia de imágenes de mapa de bits a toda página, una o varias por página fuente, más la cabecera de metadatos del PDF.

Una consecuencia importante de esta canalización merece declararse con franqueza desde el principio: el PDF de salida está basado en mapa de bits, no en texto. Los caracteres visibles en el cuerpo del PDF son píxeles dentro de una imagen, no operadores de posicionamiento de texto con datos de fuente incrustados. En la práctica, esto significa: la búsqueda dentro del PDF no encontrará palabras; el copiar y pegar desde el cuerpo de la página no devuelve nada; los lectores de pantalla no pueden leer el contenido como texto; hace falta OCR si el PDF se procesa después con herramientas de tratamiento de texto. Para flujos donde alguno de estos puntos importe (descubrimiento legal, presentaciones de accesibilidad, archivos documentales destinados a búsqueda, cualquier cosa que vaya a ser analizada por software), la herramienta adecuada es «Archivo → Guardar como PDF» de Microsoft Word o «Archivo → Exportar a PDF» de LibreOffice, ambas producen PDF basados en texto con texto seleccionable, buscable y accesible para lectores de pantalla. El propósito de esta herramienta es entregar un PDF visual limpio desde un documento Word sin subir el documento a ningún sitio; la salida en mapa de bits es el precio de esa garantía de privacidad.

Cuando seleccionas un `.docx`, la API File del navegador pasa los bytes a mammoth.js. mammoth trata el DOCX como un paquete OPC, extrae word/document.xml y recorre el árbol WordprocessingML: `<w:p>` se convierte en `<p>`, `<w:tbl>` en `<table>`, las series con negrita o cursiva pasan a marcado en línea, los hipervínculos a `<a>`, las imágenes incrustadas en `word/media/` a etiquetas `<img>` en línea codificadas en base64. Después, la herramienta renderiza el HTML dentro de un contenedor DOM oculto, aplica como CSS el tamaño de página y los márgenes elegidos e invoca html2pdf sobre ese contenedor. html2pdf recorre el contenedor, lo divide en páginas virtuales en las fronteras de página CSS, llama a html2canvas en cada fragmento del tamaño de una página y ensambla los mapas de bits resultantes en un documento jsPDF. Toda la canalización no hace ninguna petición de red después de la carga inicial de las bibliotecas.

Las tres bibliotecas detrás de la conversión

mammoth.js es el analizador de DOCX. Creado por Michael Williamson bajo licencia BSD-2-Clause y mantenido en GitHub en mwilliamson/mammoth.js. La filosofía de diseño, explicada por el propio Williamson, es que la conversión debe preservar el contenido semántico (párrafos, encabezados, listas, tablas, notas al pie, hipervínculos, imágenes incrustadas) en lugar de la presentación directa (fuentes concretas, tamaños, colores, espaciado). El autor argumenta que los documentos se mueven entre contextos (Word, web, ePub, PDF) y que el estilo visual adecuado para uno rara vez lo es para otro; mantener la estructura semántica es más útil que mantener la apariencia exacta. El bundle para navegador pesa unos 600 KB minificados.

jsPDF es el escritor de PDF. Creado por James Hall (GitHub: MrRio) en 2010, ahora con co-mantenimiento de yWorks GmbH, bajo licencia MIT, en GitHub en parallax/jsPDF. jsPDF puede escribir PDFs a partir de texto, gráficos vectoriales, imágenes y canvas HTML; en esta herramienta consume los mapas de bits de canvas que produce html2canvas y los ensambla en páginas PDF. html2canvas, de Niklas von Hertzen (licencia MIT), es el renderizador HTML-a-canvas que pinta los nodos del DOM sobre un `<canvas>` usando el CSS calculado de cada elemento. html2pdf.js de Erik Koopmans (licencia MIT) es el pegamento: orquesta html2canvas y jsPDF, gestiona la paginación, expone una API de configuración limpia y empaqueta todo en un único bundle de unos 350 KB minificados.

La huella combinada en la primera carga ronda los 950 KB. Las dos bibliotecas son almacenadas en caché por el navegador tras la primera visita, así que las visitas posteriores son instantáneas desde el punto de vista de la red. Los cuatro proyectos (mammoth.js, html2canvas, jsPDF, html2pdf.js) son de código abierto, con licencias MIT o BSD, y se han desplegado en decenas de miles de proyectos en producción. La canalización es madura, está bien entendida y se ha curtido en combate para el caso que sirve: conversión DOCX a PDF con fidelidad visual sin renderizado en servidor.

Una breve historia de DOCX y del estándar OOXML

Flujos del mundo real que motivan convertir Word a PDF

Errores comunes y su significado

Privacidad: el documento se queda en tu dispositivo

Cada servicio mayor de Word a PDF en la nube (Smallpdf, iLovePDF, Adobe Acrobat Online, PDF24, Sejda, Soda PDF) sube tu archivo a los servidores del operador, lo analiza en servidor mediante LibreOffice o un motor propietario, renderiza el PDF y te lo devuelve como descarga. Las implicaciones de privacidad no son triviales porque los documentos Word son habitualmente personales o sensibles: los CV y cartas de presentación contienen direcciones particulares, teléfonos e historial laboral; las cartas de presentación y los ensayos personales contienen confidencias; los formularios de RR. HH. contienen expectativas salariales; los contratos contienen términos comerciales; las cartas de historia clínica contienen información sanitaria protegida; los borradores legales contienen contenido amparado por el secreto profesional. Los grandes proveedores publican políticas de privacidad que se comprometen a borrar en una o dos horas y a cifrar en tránsito con TLS, y los más grandes mantienen certificación ISO/IEC 27001 y alineamiento con el RGPD. Tienen fuertes razones comerciales para cumplir esos compromisos. Pero «borrado en una hora» no es «nunca visto»: durante esa hora el contenido del archivo reside en su infraestructura, accesible a cualquier proceso o persona con permisos adecuados, y visible en los registros y copias de seguridad según la retención aplicable.

Este conversor no sube nada. mammoth.js y html2pdf.js se ejecutan por completo en tu pestaña del navegador; los bytes del archivo se leen mediante la API File, se procesan en JavaScript, y el PDF de salida se devuelve como Blob para descargar. Puedes verificar la ausencia de subida abriendo las herramientas de desarrollo del navegador en la pestaña Red antes de pulsar Convertir: no se realizan peticiones con el contenido de tu archivo. El único tráfico de red es la única carga desde el CDN de las dos bibliotecas (unos 950 KB en total minificados), que sucede una vez al abrir la página por primera vez y luego permanece en la caché del navegador. Activa el modo avión tras cargar la página y el conversor sigue funcionando sobre archivos locales. El compromiso, como se indica en la sección sobre cómo funciona la herramienta, es que el PDF de salida está basado en mapa de bits: pierde la seleccionabilidad y la búsqueda de texto que conservan los conversores en servidor. Para la mayoría de flujos personales Word a PDF (CV, cartas de presentación, memorandos internos, borradores de contrato, formularios de candidatura), la salida en mapa de bits está perfectamente bien y la garantía de privacidad compensa el compromiso. Para documentos que necesitan texto seleccionable en la salida, la respuesta correcta es «Guardar como PDF» de Word o «Exportar a PDF» de LibreOffice, ambos también sin conexión y privados si el documento nunca tiene que salir del equipo local.

Cuándo otra herramienta es la elección correcta

Funcionalidades

Preguntas frecuentes

¿Qué formatos de Word se admiten?

Este conversor admite archivos .docx (Microsoft Word 2007 y posteriores). Los archivos .doc antiguos no se admiten; puedes convertirlos a .docx en Microsoft Word y luego usar esta herramienta.

¿Se conservará mi formato?

La mayoría del formato se conserva, incluidas fuentes, tamaños, colores y diseño básico. En cambio, los elementos complejos como tablas avanzadas, diseños de varias columnas y objetos incrustados pueden simplificarse o ajustarse durante la conversión.

¿Se envía mi documento de Word a un servidor?

No. Toda la conversión se realiza localmente en tu navegador mediante las bibliotecas Mammoth y html2pdf. Tu archivo de Word nunca sale de tu dispositivo, para una privacidad y seguridad totales.

¿Puedo convertir varios archivos a la vez?

Esta herramienta convierte un archivo de Word a la vez. Para cada conversión, simplemente importa un nuevo archivo .docx y conviértelo.

¿Cuál es el límite de tamaño del archivo?

Se admiten archivos de hasta 25 MB. Los archivos muy grandes pueden tardar más en función de la memoria disponible en tu navegador.

¿Puedo ajustar los márgenes y el tamaño de página?

Sí. Antes de convertir, puedes seleccionar el tamaño de página (A4 o Letter) y el ancho de los márgenes (Normales, Estrechos o Amplios).

Más preguntas frecuentes

¿Por qué el texto del PDF no se puede seleccionar?

Esta herramienta produce un PDF basado en mapa de bits: renderiza el documento Word a HTML, pinta ese HTML sobre un canvas fuera de pantalla usando el navegador y luego incrusta el canvas como imagen dentro del PDF. El PDF resultante contiene fotos de páginas, no caracteres con posiciones. Copiar y pegar desde el cuerpo de la página no devuelve nada útil, y la función de búsqueda dentro del PDF no encontrará palabras. Para flujos que necesitan texto seleccionable (descubrimiento legal, bases de datos de investigación, accesibilidad), usa «Archivo → Guardar como PDF» de Microsoft Word o «Archivo → Exportar a PDF» de LibreOffice; ambas producen PDF basados en texto a partir de fuentes DOCX.

¿Por qué la fuente es distinta a la de mi documento Word original?

mammoth.js, la biblioteca con la que se analiza el DOCX, se centra intencionadamente en el contenido semántico (párrafos, encabezados, listas, tablas) en lugar de en la presentación directa (fuentes concretas, tamaños exactos, colores). El navegador renderiza el HTML resultante usando las fuentes que tengas instaladas localmente. Si tu documento Word usaba una fuente corporativa o de marca instalada solo en tu equipo de trabajo, el PDF se mostrará con la fuente de reserva del navegador (típicamente una sans-serif genérica). Para preservar las fuentes, o instala las mismas fuentes en tu dispositivo, o usa el «Guardar como PDF» propio de Word, que incrusta las fuentes que tu documento referencia.

¿Funciona esta herramienta sin conexión?

Sí, tras la primera visita. Las bibliotecas (mammoth unos 600 KB, html2pdf unos 350 KB) se cargan una vez desde un CDN y el navegador las guarda en caché. Las visitas posteriores al conversor funcionan completamente sin conexión, siempre que la caché del navegador no se haya borrado. La conversión en sí nunca necesitó red; solo la carga inicial de la biblioteca. Puedes verificarlo activando el modo avión tras cargar la página una vez y convirtiendo un DOCX local.

¿Puedo convertir archivos .doc antiguos (Word 97-2003)?

No. Esta herramienta solo acepta .docx (Office Open XML), el formato introducido con Word 2007. El antiguo formato binario .doc requiere un analizador distinto (mammoth solo gestiona el .docx basado en XML). Para convertir un archivo .doc, ábrelo primero en Word o LibreOffice y guárdalo como .docx, después conviértelo aquí. La conversión de .doc a .docx es una operación de un clic en cualquiera de las dos herramientas y preserva el contenido.

¿Los hipervínculos serán clicables en el PDF resultante?

Los hipervínculos del documento origen aparecen como texto con estilo visual (azul, subrayado) en el PDF, pero no son interactivos: como el cuerpo del PDF es una imagen en mapa de bits del HTML renderizado, hacer clic en el texto del enlace en un lector de PDF no llevará a ningún sitio. Si necesitas enlaces clicables en el PDF de salida, usa el «Guardar como PDF» de Word (que conserva las anotaciones de enlace PDF) o el «Exportar a PDF» de LibreOffice. Ambos producen PDF en los que los hipervínculos siguen funcionando tras la conversión.

¿Existe un equivalente de escritorio o de línea de comandos?

Sí, varios. El enfoque estándar en servidor y línea de comandos es el modo sin interfaz de LibreOffice: soffice --headless --convert-to pdf input.docx --outdir output/ convierte el archivo en su lugar, es apto para lotes y no necesita interfaz gráfica. LibreOffice se instala en Linux, macOS y Windows; la misma línea de comandos funciona en todos. Para salida píxel-idéntica a Word de forma programática, Microsoft Word + automatización COM por PowerShell en Windows es el patrón de referencia (requiere tener Word instalado). Las mismas bibliotecas mammoth.js y html2pdf.js que usa esta herramienta también corren en Node.js para una conversión scriptada sin navegador con el mismo perfil de fidelidad. Pandoc con un motor LaTeX es otra opción para flujos de publicación académica.

Herramientas relacionadas