Removedor de espaços e limpador de texto

Limpe texto bagunçado removendo espaços supérfluos, tabulações e linhas vazias.

Seus dados não saem do seu dispositivo

Como usar

  1. Cole seu texto na área de entrada.
  2. Selecione as opções de limpeza desejadas (todas marcadas por padrão).
  3. Clique em Limpar o texto para processar.
  4. Copie ou baixe o resultado limpo.

Perguntas frequentes

O que conta como espaço em branco ?

Os espaços, tabulações, espaços inquebráveis e outros caracteres de espaçamento Unicode. As quebras de linha são tratadas separadamente pelas opções « linhas vazias » e « reduzir quebras de linha ».

Esta ferramenta modifica meu conteúdo ?

Não. Ela remove ou reduz apenas caracteres de espaçamento. Suas palavras, pontuação e demais conteúdos permanecem intactos.

Posso usá-la para código ?

Pode, mas com cautela · remover os espaços iniciais destruirá a indentação do código. Use as caixas individuais para controlar exatamente o que é limpo.

O que «espaço em branco» realmente significa

Um caractere de espaço em branco é aquele que produz espaço vazio quando o texto é renderizado, em vez de um glifo visível, usado para separar palavras, indentar linhas e quebrar parágrafos. O Unicode Character Database atribui a propriedade formal White_Space a exatamente 25 pontos de código. Os suspeitos de sempre (espaço, tabulação, avanço de linha, retorno de carro) cobrem a maior parte do que você vai colar, mas a lista completa também inclui o espaço sem quebra (U+00A0), o espaço estreito sem quebra (U+202F), 11 espaços tipográficos na faixa U+2000-U+200A, os separadores de linha e de parágrafo (U+2028, U+2029), o espaço matemático médio (U+205F) e o espaço ideográfico de largura completa (U+3000) usado após a pontuação CJK.

Um grupo separado parece invisível, mas não é classificado como espaço em branco pelo Unicode: a marca de ordem de bytes (U+FEFF), o espaço de largura zero (U+200B), o juntador e o não juntador de largura zero (U+200D, U+200C), o juntador de palavras (U+2060) e o hífen suave (U+00AD). Esses são controles de formatação, não espaços, a maioria dos relatos de «limpei meu texto mas algo ainda está errado» remonta a um deles.

O que esta ferramenta faz, opção por opção

Todas as seis opções são botões independentes (desmarque qualquer uma que você queira pular) e cada uma roda apenas sobre o texto que você cola. Nada é enviado; a limpeza acontece no seu navegador via passagens de regex em JavaScript.

Quando você recorreria a isto

Ciladas comuns

Breve contexto técnico

Esta ferramenta roda inteiramente no seu navegador usando o motor de regex embutido do JavaScript. O String.prototype.trim() nos motores modernos (todo navegador evergreen desde por volta de 2015) remove tanto o espaço sem quebra quanto a marca de ordem de bytes, porque a spec do ECMAScript define o seu conjunto de recorte como a união das produções WhiteSpace e LineTerminator, uma lista que cobre tabulações, espaço comum, NBSP, BOM, os espaços tipográficos e as quebras CR / LF / LS / PS. Ela exclui apenas um caractere de espaço em branco do Unicode, U+0085 (NEL), que é uma curiosidade herdada do EBCDIC e quase nunca aparece em texto moderno.

Para entradas muito grandes, a parte lenta raramente é a passagem de regex, é escrever o resultado de volta na área de texto e re-renderizar o DOM. Entradas de até alguns megabytes geralmente vão bem em um laptop moderno; além disso, ferramentas de linha de comando (tr, sed, awk, ou um pequeno script Python) costumam ser mais rápidas.

Mais perguntas

Qual é a diferença entre um espaço normal e um espaço sem quebra?

Eles renderizam com a mesma largura, mas o espaço sem quebra (NBSP, U+00A0) diz ao renderizador para não quebrar uma linha naquele ponto. O Word, o Google Docs e muitos CMSes o inserem entre pronomes de tratamento e sobrenomes (Sr. Smith), entre números e unidades (10 km), ou em torno de símbolos de moeda (R$ 5). É o caractere «estranho» mais comum de encontrar em texto colado, e é por isso que o espaço de aparência igual entre duas palavras às vezes resiste a um regex escrito para espaços comuns.

Isso vai remover caracteres de largura zero ou a marca de ordem de bytes?

O tratamento de espaço em branco do JavaScript geralmente pega a marca de ordem de bytes (U+FEFF). Ele não pega o espaço de largura zero (U+200B), o juntador de largura zero (U+200D), o não juntador de largura zero (U+200C), o juntador de palavras (U+2060) nem o hífen suave (U+00AD), o Unicode não classifica esses como espaço em branco, então eles sobrevivem a uma passagem de espaço em branco por design. Se você suspeita que um desses está no seu texto, vai precisar de um inspetor de caracteres invisíveis.

Por que linhas vazias e quebras de linha consecutivas são duas opções separadas?

O «Remover linhas vazias» deleta toda linha vazia, o resultado é um bloco contínuo de texto sem quebras de parágrafo. O «Reduzir quebras de linha múltiplas a uma só» mantém uma única quebra de linha entre os parágrafos e remove apenas as extras. Se você quer parágrafos legíveis na saída, deixe a primeira opção desligada e use a segunda.

Há um limite de tamanho?

Não há limite rígido, a ferramenta consegue lidar confortavelmente com texto na faixa de dezenas de milhares a alguns milhões de caracteres em um laptop moderno. O limite é o desempenho da área de texto do seu navegador: colagens muito grandes começam a travar durante a digitação ou a cópia, não durante a etapa de limpeza em si.

Algo é enviado a um servidor?

Não. O texto nunca sai do seu navegador. A limpeza roda localmente em JavaScript, o resultado é escrito de volta em uma área de texto na mesma página, e você pode usar a página offline depois de carregada. O mesmo se aplica a toda ferramenta do Absolutool.

Ferramentas relacionadas

Conversor de maiúsculas/minúsculas Contador de palavras e caracteres on-line gratuito Ordenador de linhas