Conversor Word para PDF

Converta seus arquivos Word (.docx) em PDF instantaneamente. Sem cadastro. Seus arquivos nunca saem do seu dispositivo.

Seus arquivos nunca saem do seu dispositivo
Solte um arquivo Word aqui ou clique para navegar

Suporta .docx · até 25 MB

Nota : formatações complexas como tabelas, imagens e colunas podem ser simplificadas durante a conversão.

Como funciona

  1. Importe um arquivo Word : solte ou selecione um arquivo .docx para converter.
  2. Configure as opções : escolha o tamanho de página e as margens desejadas.
  3. Converta : clique em « Converter para PDF » para gerar seu PDF. A conversão é instantânea no seu navegador.

Por que converter em PDF ?

O PDF é o formato de documento universal. Converter documentos Word em PDF garante uma formatação consistente em todos os dispositivos e sistemas operacionais, torna os documentos somente leitura para evitar modificações acidentais, reduz o tamanho do arquivo e é ideal para compartilhamento, arquivamento e envios profissionais. PDFs são compatíveis em todo lugar e preservam sua formatação original.

O que «DOCX para PDF» realmente significa

Um arquivo `.docx` não é um único documento como aparece no Word. É um arquivo ZIP (o contêiner Open Packaging Conventions definido em ISO/IEC 29500-2) que abriga uma árvore de arquivos XML, imagens incorporadas e metadados de relacionamento. O texto principal do documento vive em word/document.xml como marcação WordprocessingML; estilos de parágrafo em word/styles.xml; numeração de listas em word/numbering.xml; imagens incorporadas em word/media/. Renomeie qualquer `.docx` como `.zip` e descompacte-o para ver a estrutura com qualquer editor de texto. O formato foi introduzido com o Microsoft Office 2007, padronizado como ECMA-376 em dezembro de 2006 e como ISO/IEC 29500 em 2008, e é hoje o formato Word padrão usado por centenas de milhões de autores.

Um PDF (Portable Document Format) descreve o paradigma oposto: páginas de layout fixo com glifos em coordenadas exatas, fontes incorporadas e posicionamento absoluto. Onde o DOCX é baseado em fluxo (o texto se remaneja quando o tamanho da página, as margens ou as fontes mudam), o PDF é posicionado em pixel (cada caractere ocupa um ponto específico no sistema de coordenadas da página). Converter entre os dois é, estruturalmente, traduzir entre paradigmas: um formato de autoria flexível torna-se um formato de apresentação congelado. Toda ferramenta de conversão, seja o próprio Microsoft Word, o conversor sem interface do LibreOffice, o motor em nuvem da Smallpdf ou esta ferramenta de navegador, enfrenta a mesma lacuna inerente: a origem descreve a intenção, o destino descreve a aparência, e a intenção precisa ser fixada em uma aparência específica durante a conversão.

Diferentes abordagens de conversão aceitam compromissos diferentes diante dessa lacuna. O próprio «Salvar como PDF» do Word usa o mesmo motor de renderização que exibe o documento na tela, então a conversão é essencialmente «renderizar para uma superfície PDF em vez de para uma superfície de tela»; a fidelidade é excelente e o texto fica selecionável na saída. Serviços em nuvem geralmente usam LibreOffice do lado do servidor ou um motor proprietário; a fidelidade é alta, o texto fica selecionável, o arquivo é enviado. Esta ferramenta de navegador usa um pipeline diferente (descrito na próxima seção) que otimiza para privacidade e alcance (qualquer navegador, qualquer dispositivo, sem instalação, sem envio) e aceita uma penalidade de fidelidade em troca. Nenhuma dessas abordagens é universalmente a melhor; cada uma se encaixa em fluxos diferentes.

Como esta ferramenta funciona por dentro

A conversão é executada inteiramente no seu navegador através de um pipeline em três estágios: mammoth.js analisa o DOCX em HTML semântico, html2canvas (chamado por html2pdf.js) pinta esse HTML em um elemento `<canvas>` fora da tela usando as primitivas de renderização do próprio navegador, e jsPDF (também chamado por html2pdf.js) embrulha o canvas como dados de imagem JPEG, coloca-o em uma página PDF e adiciona quebras de página nas fronteiras que o tamanho de página e as margens configuradas implicam. O PDF de saída é uma sequência de imagens em mapa de bits em página inteira, uma ou mais por página de origem, mais o cabeçalho de metadados do PDF.

Uma consequência importante desse pipeline merece uma declaração franca logo de início: o PDF de saída é baseado em mapa de bits, não em texto. Os caracteres visíveis no corpo do PDF são pixels dentro de uma imagem, não operadores de posicionamento de texto com dados de fonte incorporados. Na prática, isso significa: a busca dentro do PDF não encontrará palavras; copiar e colar do corpo da página não retorna nada útil; leitores de tela não conseguem ler o conteúdo como texto; é necessário OCR se o PDF for processado depois por ferramentas de tratamento de texto. Para fluxos onde alguma dessas coisas importa (descoberta jurídica, submissões de acessibilidade, arquivos documentais destinados à busca, qualquer coisa que será analisada por software), a ferramenta certa é «Arquivo → Salvar como PDF» do Microsoft Word ou «Arquivo → Exportar como PDF» do LibreOffice; ambos produzem PDFs baseados em texto a partir de fontes DOCX. O propósito desta ferramenta é entregar um PDF visualmente limpo a partir de um documento Word sem enviar o documento para lugar algum; a saída em mapa de bits é o preço dessa garantia de privacidade.

Quando você seleciona um `.docx`, a API File do navegador passa os bytes para mammoth.js. mammoth trata o DOCX como um pacote OPC, extrai word/document.xml e percorre a árvore WordprocessingML: `<w:p>` vira `<p>`, `<w:tbl>` vira `<table>`, runs com negrito/itálico viram marcação inline, hyperlinks viram `<a>`, imagens incorporadas em `word/media/` viram tags `<img>` inline codificadas em base64. A ferramenta então renderiza o HTML dentro de um contêiner DOM oculto, aplica o tamanho de página e a margem escolhidos como CSS e chama o html2pdf com esse contêiner. html2pdf percorre o contêiner, divide-o em páginas virtuais nas fronteiras de página CSS, chama html2canvas em cada pedaço do tamanho de uma página e monta os mapas de bits de canvas resultantes em um documento jsPDF. Todo o pipeline não faz nenhuma requisição de rede após o carregamento inicial das bibliotecas.

As três bibliotecas por trás da conversão

mammoth.js é o analisador de DOCX. Criado por Michael Williamson sob licença BSD-2-Clause e mantido no GitHub em mwilliamson/mammoth.js. A filosofia de design, declarada pelo próprio Williamson, é que a conversão deve preservar o conteúdo semântico (parágrafos, títulos, listas, tabelas, notas de rodapé, hyperlinks, imagens incorporadas) e não a formatação direta (fontes específicas, tamanhos, cores, espaçamento). O autor argumenta que documentos se movem entre contextos (Word, web, ePub, PDF) e que o estilo visual adequado a um raramente é adequado a outro; carregar a estrutura semântica é mais útil do que carregar a aparência exata. O bundle do navegador tem cerca de 600 KB minificado.

jsPDF é o gravador de PDF. Criado por James Hall (GitHub: MrRio) em 2010, agora co-mantido pela yWorks GmbH, sob licença MIT, no GitHub em parallax/jsPDF. jsPDF pode gravar PDFs a partir de texto, gráficos vetoriais, imagens e canvases HTML; nesta ferramenta ele consome os mapas de bits de canvas vindos do html2canvas e os monta em páginas PDF. html2canvas, de Niklas von Hertzen (licença MIT), é o renderizador HTML-para-canvas que pinta nós do DOM em um `<canvas>` usando o CSS computado de cada elemento. html2pdf.js de Erik Koopmans (licença MIT) é a cola: ela orquestra html2canvas e jsPDF, lida com paginação, expõe uma API de configuração limpa e empacota tudo em um único bundle de cerca de 350 KB minificado.

A pegada combinada no primeiro carregamento é de cerca de 950 KB. As duas bibliotecas são guardadas em cache pelo navegador após a primeira visita, então visitas subsequentes são instantâneas do ponto de vista da rede. Os quatro projetos (mammoth.js, html2canvas, jsPDF, html2pdf.js) são código aberto, sob licenças MIT ou BSD, e já foram implantados em dezenas de milhares de projetos em produção. O pipeline é maduro, bem compreendido e calejado em produção para o caso de uso que serve: conversão DOCX para PDF com fidelidade visual sem renderização do lado do servidor.

Uma breve história do DOCX e do padrão OOXML

Fluxos do mundo real que motivam a conversão Word para PDF

Armadilhas comuns e o que significam

Privacidade: o documento fica no seu dispositivo

Todo grande serviço de Word para PDF em nuvem (Smallpdf, iLovePDF, Adobe Acrobat Online, PDF24, Sejda, Soda PDF) envia seu arquivo para os servidores do operador, analisa-o do lado do servidor com LibreOffice ou um motor proprietário, renderiza o PDF e o devolve como download. As implicações de privacidade não são triviais porque os documentos Word são rotineiramente pessoais ou sensíveis: CVs e cartas de apresentação contêm endereços residenciais, telefones e histórico profissional; cartas de apresentação e ensaios pessoais contêm autorrevelações; formulários de RH contêm expectativas salariais; contratos contêm termos comerciais; cartas de prontuário médico contêm informações de saúde protegidas; rascunhos jurídicos contêm conteúdo coberto por sigilo profissional. Os grandes provedores publicam políticas de privacidade que se comprometem a apagar dentro de uma ou duas horas e a cifrar em trânsito com TLS, e os maiores mantêm certificação ISO/IEC 27001 e alinhamento com o GDPR. Eles têm fortes motivos comerciais para cumprir esses compromissos. Mas «apagado em uma hora» não é «nunca visto»: durante essa hora o conteúdo do arquivo reside na infraestrutura deles, acessível a qualquer processo ou pessoa com permissões adequadas, e visível em logs e backups conforme a retenção aplicável.

Este conversor não envia nada. mammoth.js e html2pdf.js rodam inteiramente na sua aba do navegador; os bytes do arquivo são lidos pela API File, processados em JavaScript, e o PDF de saída é devolvido como Blob para download. Você pode comprovar a ausência de envio abrindo as ferramentas de desenvolvedor do navegador na aba Rede antes de clicar em Converter: nenhuma requisição é feita com o conteúdo do seu arquivo. O único tráfego de rede é o carregamento único, na primeira visita, das duas bibliotecas a partir do CDN (cerca de 950 KB no total minificados), que acontece uma vez e depois permanece no cache do navegador. Coloque o navegador em modo avião depois que a página carregar e o conversor continua funcionando sobre arquivos locais. O compromisso, como dito na seção sobre como a ferramenta funciona, é que o PDF de saída é baseado em mapa de bits: ele perde a seleção e a pesquisabilidade de texto que os conversores no servidor preservam. Para a maioria dos fluxos pessoais de Word para PDF (CVs, cartas de apresentação, memorandos internos, rascunhos de contrato, formulários de candidatura), a saída em mapa de bits está perfeitamente boa e a garantia de privacidade compensa a troca. Para documentos que precisam de texto selecionável na saída, a resposta certa é o «Salvar como PDF» do Word ou o «Exportar como PDF» do LibreOffice, ambos também offline e privados se o documento nunca precisar sair da máquina local.

Quando outra ferramenta é a escolha certa

Funcionalidades

Perguntas frequentes

Quais formatos Word são suportados ?

Este conversor suporta arquivos .docx (Microsoft Word 2007 em diante). Arquivos .doc antigos não são suportados ; você pode convertê-los em .docx no Microsoft Word e depois usar esta ferramenta.

Minha formatação será preservada ?

A maior parte da formatação é preservada, incluindo fontes, tamanhos, cores e layout básico. Entretanto, elementos complexos como tabelas avançadas, layouts em múltiplas colunas e objetos incorporados podem ser simplificados ou ajustados durante a conversão.

Meu documento Word é enviado a um servidor ?

Não. Toda a conversão é feita localmente no seu navegador via as bibliotecas Mammoth e html2pdf. Seu arquivo Word nunca sai do seu dispositivo, para privacidade e segurança totais.

Posso converter vários arquivos ao mesmo tempo ?

Esta ferramenta converte um arquivo Word por vez. Para cada conversão, basta importar um novo arquivo .docx e convertê-lo.

Qual o limite de tamanho do arquivo ?

Arquivos até 25 MB são suportados. Arquivos muito grandes podem levar mais tempo dependendo da memória disponível no seu navegador.

Posso ajustar as margens e o tamanho da página ?

Sim. Antes de converter, você pode selecionar o tamanho da página (A4 ou Letter) e a largura das margens (Normais, Estreitas ou Largas).

Mais perguntas frequentes

Por que o texto no PDF não pode ser selecionado?

Esta ferramenta produz um PDF baseado em mapa de bits: ela renderiza o documento Word em HTML, pinta esse HTML em um canvas fora da tela pelo navegador e depois embute o canvas como imagem dentro do PDF. O PDF de saída, portanto, contém fotos das páginas, não caracteres com posições. Copiar e colar do corpo da página não devolve nada útil, e uma função de busca dentro do PDF não vai encontrar palavras. Para fluxos que precisam de texto selecionável (descoberta jurídica, bases de pesquisa, acessibilidade), use «Arquivo → Salvar como PDF» do Microsoft Word ou «Arquivo → Exportar como PDF» do LibreOffice; ambos produzem PDFs baseados em texto a partir de fontes DOCX.

Por que a fonte está diferente do meu documento Word original?

mammoth.js, a biblioteca que esta ferramenta usa para analisar o DOCX, foca intencionalmente no conteúdo semântico (parágrafos, títulos, listas, tabelas) em vez de na formatação direta (fontes específicas, tamanhos exatos, cores). O navegador renderiza o HTML resultante usando as fontes que você tem instaladas localmente. Se o seu documento Word usou uma fonte corporativa ou de marca instalada apenas na sua máquina de trabalho, o PDF vai aparecer com a fonte de reserva do navegador (tipicamente uma sans-serif genérica). Para preservar as fontes, instale as mesmas fontes no seu dispositivo, ou use o «Salvar como PDF» do próprio Word, que incorpora as fontes que o seu documento referencia.

Esta ferramenta funciona offline?

Sim, depois da primeira visita. As bibliotecas (mammoth com cerca de 600 KB, html2pdf com cerca de 350 KB) são carregadas uma vez a partir de um CDN e depois ficam em cache no navegador. Visitas seguintes ao conversor funcionam totalmente offline, desde que o cache do navegador não tenha sido limpo. A conversão em si nunca precisou de rede; só o carregamento inicial da biblioteca precisou. Você pode verificar ativando o modo avião depois de abrir a página uma vez e convertendo um DOCX local.

Posso converter arquivos .doc antigos (Word 97-2003)?

Não. Esta ferramenta só aceita .docx (Office Open XML), o formato introduzido no Word 2007. O formato binário .doc antigo exige um analisador diferente (mammoth só lida com o .docx baseado em XML). Para converter um arquivo .doc, abra-o primeiro no Word ou no LibreOffice e Salve como .docx, depois converta aqui. A conversão de .doc para .docx é uma operação de um clique em qualquer das duas ferramentas e preserva o conteúdo.

Os hyperlinks serão clicáveis no PDF resultante?

Os hyperlinks do documento de origem aparecem como texto visualmente estilizado (azul, sublinhado) no PDF, mas não são interativos: como o corpo do PDF é uma imagem em mapa de bits do HTML renderizado, clicar no texto do link em um leitor de PDF não vai navegar para lugar nenhum. Se você precisa de links clicáveis no PDF de saída, use o «Salvar como PDF» do Word (que preserva as anotações de link do PDF) ou o «Exportar como PDF» do LibreOffice. Ambos produzem PDFs onde os hyperlinks continuam funcionais após a conversão.

Existe um equivalente desktop ou de linha de comando?

Sim, vários. A abordagem padrão no servidor e na linha de comando é o modo sem interface do LibreOffice: soffice --headless --convert-to pdf input.docx --outdir output/ converte o arquivo no lugar, é amigável a lotes, não exige GUI. O LibreOffice pode ser instalado em Linux, macOS e Windows; a mesma linha de comando funciona em todos. Para saída pixel-idêntica ao Word de forma programática, Microsoft Word + automação COM via PowerShell no Windows é o padrão-ouro (exige o Word instalado). As mesmas bibliotecas mammoth.js e html2pdf.js que esta ferramenta usa também rodam em Node.js para conversão por script sem navegador com o mesmo perfil de fidelidade. Pandoc com um motor LaTeX é outra opção para fluxos de publicação acadêmica.

Ferramentas relacionadas