Editor de páginas PDF grátis online
Exclua páginas indesejadas e reorganize a ordem das páginas no seu PDF. 100% no cliente · seus arquivos permanecem privados.
Suporta arquivos PDF · até 50 MB
O que este editor realmente faz
Um editor de páginas PDF opera no nível estrutural de um documento PDF, manipula a ordem, a presença e a orientação de páginas inteiras sem tocar no conteúdo renderizado de qualquer página individual. Larga um PDF no editor, a ferramenta analisa a sua árvore de páginas e mostra um cartão por página com o número e as dimensões, marca as caixas das páginas a remover, arrasta ou usa as setas para reordenar e descarrega o PDF modificado. O ficheiro original no teu disco nunca é modificado, a versão editada é uma transferência nova. Cada operação corre no teu navegador via JavaScript, alimentada pela biblioteca pdf-lib (um leitor/escritor de PDF em JavaScript puro de Andrew Dillon, licença MIT, no GitHub em Hopding/pdf-lib) carregada a partir de uma CDN. Sem envio, sem processamento no servidor, sem telemetria, verifica no separador Rede das DevTools enquanto carregas em Eliminar Selecionadas e Descarregar, ou põe a página offline (modo de avião) depois de pdf-lib carregada e o editor continua a funcionar. Ficheiros até 50 MB processam-se confortavelmente; ficheiros maiores funcionam mas demoram mais, consoante a memória do navegador e do dispositivo.
O PDF como formato, uma breve história
O PDF (Portable Document Format) foi criado na Adobe por John Warnock (cofundador da empresa) e nasceu da sua proposta interna de 1991 apelidada «Camelot». A primeira versão pública, PDF 1.0, foi lançada com o Adobe Acrobat 1.0 em junho de 1993, num evento de lançamento em Nova Iorque. O problema original que o PDF resolvia era a portabilidade fiel à impressão: pegar em qualquer documento, embalá-lo com as suas fontes incorporadas e o layout exacto, e qualquer leitor em qualquer sistema operativo reproduz-o pixel a pixel. O PDF manteve-se proprietário durante quinze anos antes de a Adobe entregar a especificação à ISO. PDF 1.7 tornou-se ISO 32000-1:2008 em julho de 2008, a especificação no coração de praticamente todos os PDFs em circulação ativa hoje. PDF 2.0 seguiu-se como ISO 32000-2:2017, com uma segunda edição revista publicada em dezembro de 2020 para esclarecer ambiguidades. Em abril de 2023, a Adobe emitiu uma renúncia a patentes que concede explicitamente direitos de implementação livres de royalties para o PDF, removendo a última fricção legal para leitores e escritores de código aberto. A unidade estrutural do formato é a árvore de páginas (dicionário /Pages com um array /Kids). Um editor de páginas como este percorre a árvore, remove ou reordena entradas em /Kids e escreve um novo ficheiro com as páginas sobreviventes renumeradas. Os próprios fluxos de conteúdo de página não são tocados, daí a operação ser rápida mesmo em documentos grandes e o conteúdo visual de cada página ser preservado bit a bit.
A biblioteca pdf-lib que faz o trabalho
pdf-lib é a biblioteca PDF em JavaScript puro que torna a edição no lado do navegador prática. Andrew Dillon publicou-a sob licença MIT e o projeto é entregue como um único bundle que corre em qualquer navegador moderno, sem dependências nativas, sem WebAssembly necessário para as operações básicas. Pode analisar, modificar e serializar PDFs de ponta a ponta: ler documentos existentes, copiar páginas entre documentos, incorporar imagens PNG e JPEG, desenhar texto com fontes incorporadas, modificar campos de formulário e reescrever o documento modificado como um Uint8Array adequado para descarga. A arquitectura alternativa (edição de PDF do lado do servidor) domina as ferramentas PDF comerciais porque o processamento de PDF tem sido historicamente difícil. Smallpdf, iLovePDF, Sejda, Soda PDF, ILovePDF, PDF24 e as dezenas de sites concorrentes carregam todos o teu ficheiro para um servidor, executam pdf-lib ou semelhante (ou Ghostscript, qpdf ou PDFtk no backend) e depois enviam o ficheiro modificado de volta. O compromisso: o lado do servidor lida com tamanhos de ficheiro arbitrários e operações complexas com mais fiabilidade, mas cada página de cada documento que editas vive nos registos de outra empresa durante algum tempo. O lado do navegador via pdf-lib troca um tecto prático de 50 MB e um conjunto de operações ligeiramente limitado pela garantia de que «o ficheiro nunca sai do teu dispositivo». Para documentos sensíveis (contratos, registos médicos, extractos bancários, documentos internos) essa troca vale a pena.
Como esta ferramenta funciona por dentro
A coleção de páginas de um PDF é definida pela árvore de páginas descrita na seção 7.7.3 da norma ISO 32000-2. O dicionário de catálogo do documento tem uma entrada /Pages que aponta para o nó raiz da árvore. Essa raiz traz /Type /Pages, uma entrada /Count que indica o número total de páginas-folha abaixo, e um array /Kids de referências aos filhos. Os filhos são objetos de página-folha (/Type /Page) ou outros nós /Pages intermediários. A árvore é balanceada para que um leitor consiga encontrar a página N em tempo O(log N) sem percorrer cada folha, e é por isso que o acesso aleatório a páginas é rápido mesmo em documentos de 500 páginas.
Quando você seleciona um PDF, a API File do navegador entrega os bytes brutos para a pdf-lib, que analisa a estrutura do documento como uma árvore de objetos em memória. A ferramenta chama pdfDoc.getPageCount() para contar as folhas e itera pdfDoc.getPage(i).getWidth() e getHeight() em cada página para produzir a grade de cartões que você vê (número da página e dimensões em pontos PostScript, onde 1 ponto equivale a 1/72 de polegada). Marcar uma caixa ou apertar uma seta só atualiza um array JavaScript que controla quais referências de página sobrevivem e em que ordem. Os bytes do PDF original permanecem intactos na memória do navegador até você clicar em Baixar.
No download, a pdf-lib faz o trabalho pesado através de copyPages. A ferramenta chama PDFDocument.create() para construir um documento vazio e depois newDoc.copyPages(sourceDoc, indices), onde indices é o array de posições de páginas-fonte na ordem em que devem aparecer na saída. copyPages rastreia cada objeto do qual cada página solicitada depende (fontes incorporadas, XObjects de imagem, fluxos de conteúdo, anotações) e os copia para o novo documento, depois regenera a tabela de referências cruzadas para que todos os deslocamentos de byte fiquem consistentes de ponta a ponta. A saída é um PDF estruturalmente limpo, idêntico à renderização do original página por página. Nenhuma requisição de rede é disparada durante tudo isso. Abra as ferramentas de desenvolvedor do navegador na aba Rede durante a operação e você não verá nada além do carregamento único do CDN da própria pdf-lib (cerca de 380 KB minificados, em cache pelo navegador após a primeira visita).
Quando precisas mesmo de um editor de páginas
- Remover o anexo que você não quer compartilhar. Um relatório de 60 páginas inclui um anexo financeiro confidencial de 15 páginas. Apague as páginas 46 a 60 e envie a versão enxuta. Mais rápido do que reexportar do aplicativo de origem (e funciona mesmo quando você não tem mais a fonte).
- Aparar a folha de rosto após uma ronda de assinaturas. Um contrato contra-assinado regressa do DocuSign ou de uma digitalização manual com uma página de assinatura a tinta acrescentada fora de ordem. Move a página de assinatura para o fim, apaga o talão de encaminhamento duplicado que a ferramenta de e-sign juntou, e guarda limpo.
- Limpar a saída do scanner. Um scanner de documentos multipágina produz um único PDF que pode incluir páginas de verso em branco da alimentação auto-duplex, ou páginas que saíram tortas ou fora de ordem. A edição ao nível da página permite-te descartar as em branco e reordenar as alimentações erradas sem voltar a digitalizar nada.
- Recompor para requisitos de submissão. Uma candidatura a financiamento, um auto judicial ou uma submissão académica exigem páginas numa ordem específica, título, resumo, depois secções numeradas. A ferramenta de reordenamento permite-te montar páginas de um PDF de origem na sequência exigida sem tocar num editor PDF de secretária.
- Remover páginas pessoais de um documento mais longo. Um currículo ou portefólio que inclui uma página de referências pessoais que não queres enviar a um recrutador específico. Apaga a página, descarrega a versão expurgada, o original fica intacto no disco.
- Dividir um PDF de livro demasiado grande para distribuição. Um PDF de referência de 600 páginas é demasiado grande para enviar por e-mail. Usa o editor para apagar as páginas de um capítulo de cada vez, descarregando cada capítulo como ficheiro próprio. Tosco mas eficaz comparado com abrir um editor PDF pesado.
O panorama competitivo, navegador vs servidor vs nativo
Três categorias de editor de PDF competem pelo mesmo utilizador. As ferramentas nativas de secretária: Adobe Acrobat Pro (a referência canónica, subscrição de US$19,99/mês), Foxit PDF Editor, Nitro PDF, PDF Studio, Apple Preview (integrado no macOS, surpreendentemente capaz para edição ao nível da página), instalam-se no teu computador e funcionam offline sobre os teus ficheiros locais. Tratam dos ficheiros maiores e das operações de edição mais profundas, mas exigem uma instalação e (no caso das comerciais) muitas vezes uma licença paga. As ferramentas web do lado do servidor: Smallpdf (sediada na Suíça, fundada em 2013), iLovePDF (Espanha, também 2013), Sejda (EUA), PDF24 (Alemanha), Soda PDF (Canadá), o próprio Acrobat Online da Adobe, gerem operações de PDF através de envio de ficheiro, processamento na infra-estrutura do fornecedor e descarga de regresso. Escalam para ficheiros grandes e operações complexas, mas cada ficheiro passa pelos servidores de outra empresa. As ferramentas do lado do navegador como esta usam pdf-lib, PDF.js (o renderizador de PDF da Mozilla, escrito por Andreas Gal e outros a partir de 2011 e hoje incluído com o Firefox) ou pdf-lib-extra para fazer o trabalho inteiramente no teu dispositivo. Têm limites de tamanho de ficheiro ditados pela memória do navegador, mas nunca veem o conteúdo do teu ficheiro. Para edições pontuais de páginas em documentos que contenham qualquer coisa sensível, a opção do lado do navegador é a forma certa, a escolha resume-se essencialmente a «vale a comodidade de o enviar para um servidor o custo de privacidade neste ficheiro em particular?». Para trabalho de rotina sobre documentos internos, quase sempre que sim. Para contratos, finanças, registos médicos ou qualquer documento que não publicarias na web pública, quase sempre que não.
O que este editor faz e não faz
- Eliminar páginas, selecciona páginas por caixa de verificação e remove-as em lote. Os números de página são renumerados automaticamente no PDF modificado.
- Reordenar páginas, os controlos de seta para cima/baixo movem uma página dentro da sequência. O PDF descarregado reflecte a nova ordem.
- Cartões de pré-visualização de página, cada página mostra o seu número e dimensões para saberes o que estás a editar.
- Ficheiro original intacto, o editor lê o ficheiro mas nunca lhe escreve por cima; a versão modificada é uma descarga nova para a tua pasta de transferências por defeito.
- Execução só no navegador, pdf-lib corre no teu separador; sem envio para o servidor em qualquer fase.
Fora do âmbito: editar o conteúdo de páginas individuais (texto, imagens, campos de formulário), dividir um PDF em vários ficheiros (usa a ferramenta dedicada Divisor de PDF gratuito), juntar vários PDFs num só (usa Juntar PDF online grátis), comprimir páginas para reduzir o tamanho do ficheiro (usa Compressor de PDF grátis online), redigir conteúdo sensível com barras pretas permanentes ou assinar PDFs digitalmente. Para essas operações, as ferramentas dedicadas ou um editor PDF de secretária são a opção adequada.
Armadilhas comuns e o que significam
- Os hyperlinks apontam para as páginas erradas após a edição. O PDF de origem tem hyperlinks internos ou entradas de sumário que referenciam posições de página por índice (um link «ir para a página 3»). Após a exclusão ou reordenação, essas referências continuam apontando para as posições antigas e agora caem no conteúdo errado. PDFs que usam destinos nomeados (links no estilo «ir para section-3» registrados na árvore de nomes do documento) sobrevivem corretamente à mutação de páginas, porque os destinos se movem junto com as páginas. A solução é achatar as anotações de link antes de editar com a Achatar PDF online grátis, ou aceitar que os links de número de página absoluto vão precisar de reparo manual depois. Se a fonte foi gerada do Word com campos de referência cruzada ou do LaTeX com hyperref, os links geralmente são destinos nomeados e sobrevivem.
- O arquivo de saída não fica tão pequeno quanto se esperava após a exclusão. O
copyPagesda pdf-lib rastreia e copia cada objeto do qual as páginas sobreviventes dependem, mas não deduplica agressivamente os recursos compartilhados que estavam referenciados pelas páginas que você removeu. Se as páginas 2 e 5 compartilhavam um subconjunto de fonte e você mantém a 5 mas apaga a 2, a referência de fonte viaja com a página 5 e a exclusão economiza o fluxo de conteúdo da página, mas não a fonte. As economias costumam ser de 80 a 95 por cento do que se esperaria de uma redução proporcional. Passe o resultado pela Compressor de PDF grátis online se uma saída mais enxuta importar; o compressor faz um reempacotamento completo e recupera o restante. - Os favoritos ou entradas de sumário desaparecem. O
copyPagesda pdf-lib não copia o esquema do documento (a árvore de favoritos). O esquema vive no nível do catálogo do documento como uma entrada/Outlinesapontando para uma árvore de itens de esquema, e a pdf-lib atualmente não a reescreve durante a cópia de páginas. O PDF de saída tem as páginas modificadas na ordem certa, mas sem favoritos. É uma limitação conhecida registrada no issue #218 da pdf-lib; a solução para documentos onde os favoritos precisam ser preservados é usar o recurso Organizar Páginas do Adobe Acrobat Pro, que preserva o esquema nativamente nas mutações de páginas. - Os campos de formulário param de funcionar após a edição. Os objetos de campo AcroForm vivem no nível do documento no array
/AcroForm /Fields, com anotações widget em páginas individuais que se ligam de volta a esses objetos de campo. Quando a pdf-lib copia páginas entre documentos, os widgets viajam com as páginas, mas as associações campo-para-widget nem sempre são reconstruídas de forma limpa. O sintoma visível: campos de formulário preenchíveis aparecem como retângulos estáticos ou somem da saída. A solução para fluxos «final, não editável» é achatar o formulário primeiro com a Achatar PDF online grátis, que cozinha os valores dos campos em conteúdo estático, e então editar. Para fluxos «ainda preenchível após editar», o Organizar Páginas do Adobe Acrobat Pro é a ferramenta certa. - O PDF está criptografado e a ferramenta relata um erro. A pdf-lib suporta criptografia básica por senha para leitura, mas nem sempre consegue analisar a árvore de páginas de um PDF protegido com criptografia em nível de usuário ou restrições em nível de proprietário sobre cópia ou modificação. O contorno padrão em três passos: primeiro desbloqueie o PDF com a Desbloquear PDF grátis online (também apenas no navegador, fornecendo a senha que você já conhece), edite as páginas aqui e, em seguida, opcionalmente, reproteja a saída com a Protetor de PDF com senha gratuito online. O arquivo intermediário desbloqueado é o que é editado; a saída final protegida preserva a nova ordem de páginas e a nova senha.
- Um PDF muito grande trava a aba. A pdf-lib carrega o arquivo inteiro na memória JavaScript ao analisar. Navegadores de desktop modernos lidam confortavelmente com PDFs de até várias centenas de megabytes, mas navegadores móveis têm tetos de memória de cerca de 200 MB a 500 MB, dependendo do dispositivo. Um PDF de 400 MB em um celular Android com 4 GB de RAM pode fazer o sistema operacional encerrar a aba. Para arquivos muito grandes, as ferramentas certas são aplicativos de desktop (Adobe Acrobat, Foxit) ou ferramentas de linha de comando (qpdf, pikepdf) que leem o arquivo em streaming a partir do disco, em vez de carregá-lo inteiro na RAM.
Privacidade: o ficheiro fica no teu dispositivo
Todo editor de páginas PDF em nuvem (Smallpdf, iLovePDF, PDF24, Adobe Acrobat Online, Sejda, Soda PDF) sobe seu arquivo para os servidores do operador, analisa do lado do servidor, deixa você clicar em excluir ou arrastar miniaturas contra prévias renderizadas pelo servidor e depois devolve uma cópia modificada como download. As implicações de privacidade diferem de um upload normal em um ponto importante: o operador necessariamente lê o conteúdo de cada página (para renderizar prévias e para contar e identificar as páginas) antes de você ter tomado qualquer decisão de exclusão ou reordenação. Mesmo que você mude de ideia e nunca baixe o resultado, o operador já viu o conteúdo. Os grandes provedores publicam políticas de privacidade que se comprometem a apagar dentro de horas e a usar TLS em trânsito, e têm fortes incentivos comerciais para cumprir, mas «apagado em uma hora» não é o mesmo que «nunca visto». PDFs contêm rotineiramente prontuários médicos, extratos bancários, contratos assinados, documentos de identidade, memorandos internos de empresa e rascunhos de petições jurídicas; para esses documentos, a distinção de política importa.
Este editor não envia nada. A pdf-lib roda na sua aba do navegador e recebe os bytes do arquivo pela API File, devolvendo os bytes modificados para a mesma aba como um Blob que se torna um download. Você pode comprovar: abra as ferramentas de desenvolvedor do navegador na aba Rede antes de clicar em Baixar PDF Modificado, execute a operação e observe que nenhuma requisição é feita com o conteúdo do seu arquivo. O único tráfego de rede é o carregamento único da pdf-lib pelo CDN na primeira visita (cerca de 380 KB minificados), que acontece uma vez e depois fica no cache do navegador. Coloque o navegador em modo avião depois que a página carregou e o editor continua funcionando sobre arquivos locais. O compromisso é o escopo de funcionalidades: serviços em nuvem costumam empacotar operações secundárias como OCR antes de editar, conversão automática de anexos ou fluxos de assinar-e-enviar após edição. Esta ferramenta faz só a exclusão e reordenação no nível de página. Para esse fluxo focado, a ferramenta no lado do navegador é estritamente mais rápida (sem espera de upload, sem limite de tamanho de upload) e significativamente mais privada.
Quando outra ferramenta é a escolha certa
- PDFs acima de 200 MB num dispositivo com memória limitada. A pdf-lib carrega o arquivo inteiro na memória; em celulares, tablets ou laptops antigos a aba pode ficar sem memória e travar. Use Adobe Acrobat, Foxit ou a linha de comando qpdf para arquivos muito grandes. O qpdf faz streaming do arquivo a partir do disco e lida com documentos de tamanho essencialmente ilimitado.
- Formulários XFA ou criptografia baseada em certificado. XFA é o formato proprietário de formulário em XML da Adobe, e a pdf-lib não o trata de maneira confiável. Criptografia baseada em certificado (em oposição à baseada em senha) também está fora do escopo da pdf-lib. O Adobe Acrobat é a ferramenta canônica para ambos. Se o documento foi criado no Adobe LiveCycle Designer, parta do pressuposto de que ele contém XFA.
- Edições que precisam preservar a árvore de favoritos ou de esquema. Se o documento tem um esquema complexo e você precisa que os favoritos sigam as páginas para suas novas posições (ou permaneçam após uma exclusão), o Organizar Páginas do Adobe Acrobat Pro faz isso nativamente. A pdf-lib atualmente não faz. Para exclusões pontuais em documentos cujos esquemas você não se importa, esta ferramenta é mais rápida; para fluxos críticos em esquema, como teses acadêmicas ou manuais técnicos, use o Acrobat Pro.
- Edição em lote automatizada como parte de um pipeline. Para edição no servidor ou via script de muitos PDFs, use a pdf-lib direto do Node.js (mesma biblioteca, sem precisar de aba de navegador), a pikepdf em Python (um binding para o qpdf com API pythônica) ou a linha de comando do qpdf com sintaxe explícita de intervalos de página (
qpdf --pages input.pdf 1-4,6-20 -- output.pdfmantém as páginas 1 a 4 e 6 a 20, apagando a 5).
Perguntas frequentes
Meu PDF é enviado para um servidor?
Não. Todo o processamento ocorre no teu navegador através da biblioteca JavaScript pdf-lib, que corre no teu separador. O teu ficheiro é lido para a memória do navegador, manipulado em JavaScript, e a versão modificada é-te oferecida como descarga. O único tráfego de rede é o carregamento pontual do próprio pdf-lib a partir da CDN quando a página abre pela primeira vez. Verifica no separador Rede das DevTools enquanto eliminas páginas ou carregas em Descarregar, não disparam pedidos que incluam o conteúdo do teu ficheiro.
Qual é o limite de tamanho do arquivo?
PDFs até 50 MB processam-se confortavelmente na maioria dos navegadores e dispositivos modernos. Ficheiros maiores que 50 MB irão funcionar mas podem congelar brevemente o separador enquanto pdf-lib analisa a árvore de páginas, sobretudo em dispositivos com menos memória. O limite fundamental é a memória do navegador, e não um tecto rígido; PDFs muito grandes (centenas de megabytes) podem ficar mais bem servidos por uma ferramenta de secretária como o Adobe Acrobat ou o Apple Preview.
Posso desfazer minhas alterações?
Podes continuar a alterar a selecção e a ordem das páginas antes de descarregar, nada é fixado até carregares em Descarregar PDF Modificado. Atualizar a página ou carregar em Limpar repõe o documento original. Uma vez descarregado, o ficheiro modificado é um PDF novo; o original no teu disco nunca é sobrescrito, por isso tens sempre a versão não modificada para recomeçar.
Funciona com PDFs digitalizados?
Sim. As operações ao nível da página (eliminar, reordenar) funcionam de forma idêntica, quer cada página contenha texto selecionável ou um bitmap de imagem digitalizada, o editor move páginas inteiras como blocos opacos de conteúdo. A contagem de páginas, os números e as dimensões mostram-se correctamente também para páginas baseadas em imagem. O que este editor não faz é OCR ao texto digitalizado nem modificar o conteúdo de imagem de qualquer página; para essas operações é necessária uma ferramenta OCR dedicada ou um editor PDF de secretária com funções OCR.
Esta ferramenta funciona no celular?
Sim, para ficheiros pequenos. Os navegadores móveis têm menos memória e motores JavaScript mais lentos do que os de secretária, pelo que PDFs muito grandes podem congelar o separador ou bloquear. A affordance de arrastar e largar também funciona pior em dispositivos táteis, usa antes o seletor de ficheiros (toca em «clica para procurar»). Para eliminações pontuais de páginas em PDFs mais pequenos, o móvel funciona bem; para ficheiros grandes, passa para a secretária.
E os PDFs protegidos por palavra-passe?
O suporte integrado do pdf-lib para PDFs encriptados é limitado em comparação com o Adobe Acrobat. Se um PDF estiver protegido por palavra-passe com encriptação ao nível do utilizador, o editor pode falhar ao carregá-lo ou carregá-lo sem capacidade de escrever alterações. A alternativa: abre o PDF numa ferramenta de secretária que conheça a palavra-passe, guarda-o como cópia não encriptada e edita depois a versão não encriptada nesta ferramenta. Reencripta depois se precisares de protecção por palavra-passe na saída.
Mais perguntas frequentes
Esta ferramenta funciona offline?
Depois da primeira visita, sim. A biblioteca JavaScript pdf-lib fica em cache no navegador no primeiro carregamento (cerca de 380 KB minificados). Visitas subsequentes ao editor de páginas funcionam sem conexão de rede, desde que o cache do navegador não tenha sido limpo no intervalo. A manipulação da árvore de páginas em si nunca precisou de rede; só o carregamento da biblioteca precisava. Você pode verificar ativando o modo avião depois de abrir a página uma vez e tentando excluir ou reordenar um PDF local.
Posso excluir ou reordenar páginas de vários PDFs ao mesmo tempo?
Não diretamente: a interface aceita um documento-fonte por vez. O fluxo em dois passos para edições multi-PDF é usar primeiro a Juntar PDF online grátis para combinar suas fontes em um único documento, e depois trazer esse PDF combinado para cá para excluir ou reordenar páginas até a sequência final. Para fluxos cruzados mais complexos (arrastar a página 3 do arquivo A entre as páginas 5 e 6 do arquivo B), o Organizar Páginas do Adobe Acrobat Pro lida com o arrasto entre documentos nativamente em um passo só. Para automação em lote em dezenas ou centenas de arquivos, as ferramentas de linha de comando qpdf ou pikepdf são as indicadas.
Devo editar as páginas antes ou depois de assinar, achatar ou comprimir?
A ordem segura é: editar primeiro, achatar em seguida, assinar depois e comprimir por último. Editar primeiro porque as operações subsequentes dependem da sequência final de páginas. Achatar a seguir porque cozinha os campos de formulário e anotações em conteúdo estático para que ferramentas a jusante lidem com o documento de modo uniforme. Assinar após o achatamento porque assinaturas criptográficas se comprometem com a sequência final de bytes do documento e qualquer mudança posterior as invalida. Comprimir por último (opcional) para reduzir o tamanho do arquivo na transmissão. PDFs assinados que forem editados em seguida vão falhar na verificação de assinatura no Acrobat e em outros leitores sensíveis a assinaturas, então a assinatura deve sempre ser o último passo a tocar o conteúdo.
A camada de texto OCR será preservada em páginas digitalizadas?
Sim. O texto OCR em um PDF fica armazenado como texto invisível desenhado sobre a imagem digitalizada (uma sequência de operadores de fluxo de conteúdo marcada como invisível), e esse fluxo de conteúdo faz parte do objeto de página. Quando o copyPages da pdf-lib copia uma página, ele copia todo o objeto de página, inclusive todos os fluxos de conteúdo, referências de fonte e qualquer camada invisível de texto OCR. Busca e seleção continuam funcionando na saída editada exatamente como funcionavam no original, para as páginas que sobreviveram. A camada de texto é preservada byte a byte; a pdf-lib não recodifica nem rasteriza nada de novo.
Excluir metade das páginas reduz o arquivo pela metade?
Em geral, menos da metade, às vezes bem menos. Se as páginas excluídas tinham conteúdo próprio (imagens incorporadas próprias, subconjuntos de fonte próprios), as economias são grandes. Se as páginas excluídas compartilhavam recursos com as que você manteve (a mesma fonte usada em todo o documento, a mesma imagem de logotipo em cada página), os recursos compartilhados permanecem no arquivo. A pdf-lib não reempacota agressivamente o arquivo ao salvar, então a deduplicação entre páginas que o PDF original já fazia é preservada, mas as oportunidades novas de deduplicação geradas pela exclusão não são exploradas. Para uma saída enxuta, passe o resultado pela Compressor de PDF grátis online, que faz reempacotamento completo e recodificação de imagens e normalmente recupera o resto da economia.
Existe um equivalente desktop ou de linha de comando para scripts?
Sim, vários. A pdf-lib roda sem modificações no Node.js (npm install pdf-lib) e o código de edição é o mesmo: copyPages(source, indices) seguido de addPage() para cada página. Na linha de comando, o qpdf tem uma sintaxe de seleção por página: qpdf --pages input.pdf 1-4,6-20 -- input.pdf output.pdf mantém as páginas 1 a 4 e 6 a 20, apagando a 5. A pikepdf em Python é um binding para o qpdf com uma API mais limpa (del pdf.pages[2] para apagar a página 3, semântica de fatiamento de listas para reordenação). O Adobe Acrobat Pro oferece as mesmas operações por uma interface gráfica e, além disso, preserva favoritos e o esquema do documento ao longo das mutações de páginas, o que o caminho só-navegador não faz.