Contador de palavras e caracteres on-line gratuito

Cole ou digite seu texto abaixo para ver instantaneamente a contagem de palavras, caracteres, frases, parágrafos e tempo de leitura estimado.

0
Palavras
0
Caracteres
0
Caracteres (sem espaços)
0
Frases
0
Parágrafos
0s
Tempo de leitura
0s
Tempo de fala
0
Palavras únicas
-
Legibilidade

Sobre esta ferramenta

Este contador de palavras gratuito é perfeito para estudantes, escritores, blogueiros e gerentes de redes sociais. Conte palavras instantaneamente para redações, tweets, legendas do Instagram e muito mais. O tempo de leitura é baseado em uma velocidade média de leitura de 200 palavras por minuto.

Limites comuns de contagem de palavras

Conhecer os limites comuns ajuda a atingir seu objetivo:

Perguntas frequentes

Como o tempo de leitura é calculado?

Usamos a média padrão de 200 palavras por minuto. Esta é uma média amplamente aceita para a velocidade de leitura de adultos para conteúdo não técnico.

O que conta como uma palavra?

Qualquer sequência de caracteres separada por espaços em branco conta como uma palavra. Palavras com hífen como "bem-conhecido" contam como uma palavra. Números e abreviações também contam.

Meu texto é salvo em algum lugar?

Não. Tudo acontece no seu navegador. Seu texto nunca é enviado a nenhum servidor nem armazenado em lugar algum. Feche a aba e ele desaparece.

O que conta como uma palavra, exactamente?

O Microsoft Word, o Google Docs, o Pages, o comando Unix wc e quase todos os contadores no navegador concordam numa única regra: uma palavra é uma sequência máxima de caracteres não-espaço separada das sequências vizinhas por espaços. O padrão POSIX para o wc define uma palavra como uma sequência não-vazia de caracteres imprimíveis delimitada por espaços, a mesma regra que uma implementação de quatro linhas em JavaScript (text.trim().split(/\s+/).length) produz. É puramente mecânico: não percebe morfologia, pontuação ou língua. «Hello world» são duas palavras; «Hello,world» sem espaço é uma. «Don't» é uma palavra; «do n't» são duas.

Um linguista discordaria. O Oxford English Dictionary distingue entre a palavra grafémica (uma sequência de letras delimitada por espaços) e o lexema (uma entrada abstracta de dicionário). As duas divergem em casos comuns:

Para prosa comum o desacordo entre esta regra e um contador humano cuidadoso costuma estar abaixo de um por cento. Para texto muito composto, hifenizado ou numérico pode chegar a 5-15%. Além da regra do espaço, o Unicode publica um algoritmo formal de fronteira de palavra (UAX #29), uma máquina de estados de 14 regras que reconhece fronteiras de palavra a partir de categorias de caracteres. O JavaScript expõe-no via Intl.Segmenter com {granularity: 'word'}, e esse é o único caminho correcto para contar palavras em chinês, japonês, tailandês ou khmer sem um dicionário.

Línguas que não usam espaços

Chinês, japonês (em kanji puro ou kanji + hiragana), tailandês, lao, khmer, birmanês e tibetano escrevem-se sem espaços entre palavras, a convenção chama-se scriptio continua. Um tokenizer por espaços a correr sobre um parágrafo chinês devolve 1, o parágrafo inteiro como uma única «palavra». Para estas escritas, a métrica relevante é a contagem de caracteres, não a de palavras.

Em tradução profissional, a regra empírica é grosso modo um carácter chinês ≈ 1,5-2,0 palavras inglesas; dois caracteres japoneses ≈ uma palavra inglesa; um carácter coreano ≈ 0,55 palavras inglesas. Os tradutores chinês-inglês costumam facturar por número de caracteres-fonte do lado chinês e por número de palavras-alvo do lado inglês. O coreano, único entre as escritas do leste asiático, usa espaçamento entre palavras (띄어쓰기, ttuieosseugi), por isso a tokenização por espaços funciona, mas as regras de espaçamento são notoriamente difíceis e mesmo falantes nativos discordam em casos-limite.

Uma breve história de pagar a escritores à palavra

O pagamento à palavra surgiu com as revistas de grande circulação do final do século XIX. Já nos anos 1920 e 1930 as revistas pulp, Black Mask, Weird Tales, Astounding, Argosy, pagavam à palavra a tarifas que iam de um quarto de cêntimo a dois cêntimos. Raymond Chandler ganhou famosamente um cêntimo por palavra do Black Mask nos anos 1930. O modelo sobrevive hoje: as fábricas de conteúdo baratas pagam 0,01-0,05 USD por palavra, as revistas de profissionais de gama média pagam 0,30-0,75 USD, e as publicações americanas de topo (The New Yorker, The Atlantic, Wired, Harper's) pagam 1-3 USD por palavra, ocasionalmente mais para reportagens de destaque.

Como o tecto é contratual, saber a contagem exacta de palavras é rendimento. Uma reportagem de 1 500 palavras a 1 USD por palavra são 1 500 USD; em 1 400 são 1 400. Os editores fazem cumprir os tectos, uma encomenda de 2 000 palavras significa 1 950-2 050, não 2 400, e ultrapassar o tecto pode significar um corte de tarifa fixa ou uma kill-fee.

Contagens de palavras de romances e o hábito diário

A indústria editorial tem contagens de palavras-alvo notavelmente consistentes para romances adultos. A ficção literária adulta cai em 80 000-100 000 palavras; o thriller comercial, mistério e romance em 70 000-90 000; a fantasia épica e ficção científica em 100 000-120 000 (ocasionalmente 150 000+). Young Adult são 50 000-80 000, Middle Grade 25 000-55 000, álbuns ilustrados 100-500, novelas 17 500-40 000, contos 1 000-7 500, flash fiction abaixo de 1 000. Os agentes recusam queries de primeiros romances muito fora destes intervalos independentemente da qualidade, os intervalos convencionais codificam expectativa de leitor e economia de imprensa.

O National Novel Writing Month, fundado em 1999 por Chris Baty, define um alvo de 50 000 palavras para Novembro, mais ou menos a extensão de O Grande Gatsby (50 061) e Matadouro Cinco (49 459). Isso dá 1 667 palavras por dia durante trinta dias. Stephen King recomenda 2 000 palavras por dia em On Writing; Anthony Trollope escrevia 3 000 por dia antes de ir para o seu emprego nos correios; Graham Greene parava alegadamente em exactamente 500 palavras por dia; Mark Twain visava 1 400. Um hábito diário de palavras é o que transforma «tenho uma ideia» em «termino em N dias». Um romance de 90 000 palavras a 1 000 palavras por dia são 90 dias.

Contagens de palavras académicas e de revistas

Para o ensino superior dos EUA e do Reino Unido, as extensões típicas de tarefa são: ensaio do secundário 300-1 000 palavras; ensaio universitário (humanidades) 1 500-3 000; trabalho de fim de semestre 3 000-6 000; tese de honours 12 000-20 000; tese de mestrado 20 000-40 000; dissertação de doutoramento 80 000-100 000 em humanidades (frequentemente mais curta, 40 000-60 000, em ciências). O statement pessoal do Common App está limitado a 650 palavras, o portal de candidatura faz cumprir. O statement pessoal do UCAS no Reino Unido está limitado a 4 000 caracteres ou 47 linhas, o que for mais curto. A maior parte das universidades aplica os limites de ensaio com uma tolerância de ±10%.

Os artigos de revista vão desde uma carta de 500-1 500 palavras, um brief de 1 500-3 000, um artigo de investigação padrão de 4 000-8 000, até uma revisão de 6 000-12 000. Nature Letters tecto a 3 000 palavras; JAMA Original Investigation a 3 000 com um resumo de três parágrafos; PNAS Direct Submission a seis páginas impressas, à volta de 6 000 palavras.

Limites de caracteres em redes sociais que vale a pena memorizar

Segmentar frases é mais difícil do que dividir num ponto

A regra ingénua, dividir em ., !, ?, falha em qualquer texto inglês realista logo no primeiro parágrafo. «Dr. Smith met Mr. Jones at U.S. Steel» é uma frase; a divisão ingénua devolve quatro. «J. R. R. Tolkien wrote The Hobbit» é uma; ingénua devolve quatro. «The pH of 7.4 is normal» é uma; ingénua devolve duas. Nomes de domínio («Visit absolutool.com.») e e-mails criam falsos positivos; reticências («Wait...what?») criam falsos negativos.

A segmentação robusta precisa ou de uma lista curada de abreviaturas (a abordagem usada pelo segmentador Punkt do NLTK, que o artigo de Kiss e Strunk de 2006 treinou num corpus de um milhão de palavras até F1 ≈ 0,97) ou de um modelo estatístico. Para um contador no navegador, o compromisso prático é dividir em [.!?]+ seguido de espaço e maiúscula, com uma pequena lista negra de abreviaturas (Mr|Mrs|Dr|Prof|Sr|Jr|St|Inc|Ltd|U.S|e.g|i.e|etc|vs). Mesmo assim, a precisão em texto ruidoso fica em torno de 90%. Tome a contagem de frases como aproximada.

Fórmulas de legibilidade num parágrafo cada

Flesch Reading Ease (1948). A fórmula de Rudolf Flesch: 206,835 − 1,015 × (palavras/frases) − 84,6 × (sílabas/palavras). Mais alto significa mais fácil. 0-30 é «muito difícil, licenciado»; 60-70 é «inglês simples, oitavo a nono ano»; 90-100 é «muito fácil, quinto ano». A Reader's Digest aponta para ~65; a Time aponta para ~52; a Harvard Law Review ronda 30.

Flesch-Kincaid Grade Level (1975). Encomendado pela Marinha dos EUA a J. Peter Kincaid para legibilidade de manuais técnicos: 0,39 × (palavras/frases) + 11,8 × (sílabas/palavras) − 15,59. A saída é um nível de ano americano (8,0 = oitavo ano). Está agora embutido no corrector ortográfico do Microsoft Word e é a métrica de legibilidade mais citada em copywriting.

SMOG (1969). O «Simple Measure of Gobbledygook» de Harry McLaughlin conta apenas palavras de três ou mais sílabas em dez frases consecutivas tiradas do início, do meio e do fim do texto. Preferido pelos National Institutes of Health dos EUA para folhetos sanitários para pacientes porque correlaciona melhor que o Flesch-Kincaid com a compreensão real em texto de saúde.

Gunning Fog (1952). O índice de Robert Gunning: 0,4 × ((palavras/frases) + 100 × (palavras_complexas/palavras)). O The Wall Street Journal aponta para Fog ~11; o Times de Londres ~14. A tese de Gunning era que qualquer escrita empresarial acima de Fog 12 perderia leitores.

Tempo de leitura e de fala, de onde vêm os números

Este contador mostra tempo de leitura a 200 palavras por minuto e tempo de fala a 130 palavras por minuto. O número 200 ppm é conservador relativamente à meta-análise de 2019 de Marc Brysbaert sobre 190 estudos, que convergiu em 238 ppm para não-ficção e 260 ppm para ficção (Journal of Memory and Language). Errar ligeiramente do lado lento é a escolha amigável para o utilizador, é melhor que uma «leitura de cinco minutos» seja de quatro minutos do que de sete. A taxa de fala de 130 ppm corresponde à fala conversacional; os discursos formais têm em média 100-130 ppm. Uma keynote de vinte minutos são aproximadamente 2 600 palavras faladas. A funcionalidade «X min read» da Medium, introduzida em 2014 por Mike Sall, foi originalmente calibrada a 275 ppm.

Por que a sua contagem difere da do Word

Três causas comuns: (1) o Microsoft Word e o Google Docs tratam palavras hifenizadas como uma (igual a este contador), mas alguns contadores em PHP dividem em cada carácter não-letra e devolvem dois para «well-known». (2) Colar do Word traz caracteres invisíveis, aspas curvas, espaços não-quebráveis (U+00A0), hífenes suaves (U+00AD), que podem fragmentar ou fundir tokens consoante a ferramenta. (3) As contagens de palavras únicas são sensíveis a maiúsculas por defeito, por isso «The» e «the» contam como duas palavras únicas distintas; remover a sensibilidade a maiúsculas e fazer stemming («running» → «run») baixaria a contagem de únicas em torno de 15% em prosa típica.

Se o seu texto chinês ou japonês mostra zero (ou uma) palavra, é o tokenizer por espaços a fazer o que lhe foi dito, vire a atenção para a contagem de caracteres, que é a métrica relevante para essas escritas. Se «3,000» conta como uma palavra é porque a vírgula é não-espaço e o token é contíguo; é o comportamento correcto e está alinhado com o Word.

Mais perguntas

Quão precisa é a pontuação de legibilidade?

As fórmulas de legibilidade estimam complexidade a partir de palavras-por-frase e sílabas-por-palavra, não percebem de facto se a sua prosa é boa. Uma pontuação de «8.º ano» significa um perfil de comprimento de frase e densidade silábica típico do material de leitura do oitavo ano; não certifica clareza. Use a pontuação como teste de sanidade, não como veredicto. Hemingway pontua perto do 4.º ano; a King James Bible perto do 8.º; The Wall Street Journal perto do 11.º.

Este contador lida com Markdown ou HTML?

Conta tudo o que está na área de texto literalmente, incluindo **negrito**, cabeçalhos # e tags HTML como <p>. Se quiser contar apenas o texto renderizado, cole o seu conteúdo num pré-visualizador de Markdown ou na Vista de Leitura do navegador, e depois copie o texto limpo para aqui. Hugo, Jekyll e 11ty retiram todos o front-matter e o Markdown antes de calcular contagens de palavras nas páginas construídas.

Qual é a melhor dica para acertar uma contagem exacta de palavras?

Escreva 10-15% acima do seu alvo, depois corte. Cortar é muito mais fácil do que encher, e os cortes quase sempre tornam a prosa mais forte, porque o que é mais fácil de remover é o mais fraco. O conselho tradicional de editor («mata os teus queridos») só faz sentido se tiver queridos para matar, o que significa que os escreveu primeiro.

Posso usá-lo para briefs jurídicos e processos judiciais?

Sim para uma verificação rápida, o Supremo Tribunal dos EUA limita os briefs dos peticionários a 13 000 palavras e a Federal Rule 32(a)(7)(B) limita os briefs de recurso a 13 000 palavras, ambos contados por espaços. Para a contagem de palavras certificada exigida no momento do envio, use a contagem do Microsoft Word (que os tribunais aceitam pelo nome) e trate esta ferramenta como verificação de rascunho.

Ferramentas relacionadas