Comptage de mots et de caractères en ligne, gratuit

Collez ou tapez votre texte ci-dessous pour voir instantanément le nombre de mots, de caractères, de phrases, de paragraphes, ainsi que le temps de lecture estimé.

0
Mots
0
Caractères
0
Caractères (sans espaces)
0
Phrases
0
Paragraphes
0s
Temps de lecture
0s
Temps de parole
0
Mots uniques
-
Lisibilité

À propos de cet outil

Ce compteur de mots gratuit est idéal pour les étudiants, les rédacteurs, les blogueurs et les gestionnaires de réseaux sociaux. Comptez instantanément les mots d'une dissertation, d'un tweet, d'une légende Instagram, et plus encore. Le temps de lecture est calculé sur la base d'une vitesse moyenne de 200 mots par minute.

Limites de comptage courantes

Connaître les limites courantes aide à atteindre votre objectif :

Questions fréquentes

Comment le temps de lecture est-il calculé ?

Nous utilisons la moyenne standard de 200 mots par minute. C'est une moyenne largement acceptée pour la vitesse de lecture adulte d'un contenu non technique.

Qu'est-ce qui compte comme un mot ?

Toute séquence de caractères séparée par un espace compte comme un mot. Les mots composés avec trait d'union, comme « bien-aimé », comptent comme un seul mot. Les chiffres et les abréviations comptent également.

Mon texte est-il enregistré quelque part ?

Non. Tout se passe dans votre navigateur. Votre texte n'est jamais envoyé à un serveur, ni stocké où que ce soit. Fermez l'onglet et il disparaît.

Qu'est-ce qui compte exactement comme un mot ?

Microsoft Word, Google Docs, Pages, la commande Unix wc et presque tous les compteurs en navigateur s'accordent sur une seule règle : un mot est une suite maximale de caractères non blancs, séparée des suites voisines par des espaces. Le standard POSIX pour wc définit un mot comme une séquence non vide de caractères imprimables délimitée par des espaces, la même règle que produit une implémentation JavaScript en quatre lignes (text.trim().split(/\s+/).length). C'est purement mécanique : ça ne comprend ni la morphologie, ni la ponctuation, ni la langue. « Hello world » compte deux mots ; « Hello,world » sans espace en compte un. « Don't » est un mot ; « do n't » en fait deux.

Un linguiste protesterait. L'Oxford English Dictionary distingue le mot graphémique (une suite de lettres bornée par des espaces) du lexème (une entrée abstraite du dictionnaire). Les deux divergent dans des cas courants :

Pour la prose ordinaire, le désaccord entre cette règle et un compteur humain attentif reste généralement sous le pour-cent. Pour un texte très composé, hyphénisé ou numérique, il peut atteindre 5–15 %. Au-delà de la règle des espaces, Unicode publie un algorithme formel de frontière de mot (UAX #29), une machine à états de 14 règles qui reconnaît les frontières de mots à partir de catégories de caractères. JavaScript l'expose via Intl.Segmenter avec {granularity: 'word'}, et c'est la seule voie correcte pour compter des mots en chinois, japonais, thaï ou khmer sans dictionnaire.

Les langues qui n'utilisent pas d'espaces

Le chinois, le japonais (en kanji pur ou kanji + hiragana), le thaï, le lao, le khmer, le birman et le tibétain s'écrivent sans espaces inter-mots, la convention s'appelle scriptio continua. Un tokeniseur par espaces sur un paragraphe chinois retourne 1, le paragraphe entier comme un seul « mot ». Pour ces écritures, la métrique pertinente est le nombre de caractères, pas le nombre de mots.

En traduction professionnelle, la règle empirique est à peu près un caractère chinois ≈ 1,5 à 2,0 mots anglais ; deux caractères japonais ≈ un mot anglais ; un caractère coréen ≈ 0,55 mot anglais. Les traducteurs chinois-anglais facturent typiquement au nombre de caractères source côté chinois et au nombre de mots cible côté anglais. Le coréen, fait unique parmi les écritures d'Asie de l'Est, utilise bien un espacement entre mots (띄어쓰기, ttuieosseugi), donc la tokenisation par espaces fonctionne, mais les règles d'espacement sont notoirement difficiles et même les locuteurs natifs ne s'accordent pas sur les cas limites.

Brève histoire du paiement des écrivains au mot

Le paiement au mot a vu le jour avec les magazines à grand tirage de la fin du XIXe siècle. Dans les années 1920 et 1930, les pulps, Black Mask, Weird Tales, Astounding, Argosy, payaient au mot à des tarifs allant d'un quart de cent à deux cents. Raymond Chandler touchait fameusement un cent par mot du Black Mask dans les années 1930. Le modèle survit aujourd'hui : les usines à contenu paient 0,01-0,05 USD par mot, les magazines spécialisés de moyen de gamme paient 0,30-0,75 USD, et les magazines américains de premier plan (The New Yorker, The Atlantic, Wired, Harper's) paient 1-3 USD par mot, parfois plus pour les articles de fond.

Comme le plafond est contractuel, connaître le nombre exact de mots, c'est du revenu. Un long format de 1 500 mots à 1 USD le mot fait 1 500 USD ; à 1 400 c'est 1 400. Les rédacteurs en chef font respecter les plafonds, une commande de 2 000 mots veut dire 1 950-2 050, pas 2 400, et rater le plafond peut signifier une réduction au forfait ou une indemnité d'annulation.

Nombres de mots des romans et habitude du quota quotidien

L'édition a des cibles de nombres de mots remarquablement constantes pour les romans adultes. La fiction littéraire adulte se situe à 80 000-100 000 mots ; le thriller commercial, le mystère et la romance à 70 000-90 000 ; la fantasy épique et la SF à 100 000-120 000 (parfois 150 000+). Le Young Adult fait 50 000-80 000, le Middle Grade 25 000-55 000, les albums illustrés 100-500, les novellas 17 500-40 000, les nouvelles 1 000-7 500, la flash fiction sous 1 000. Les agents rejetteront les premiers romans très en dehors de ces fourchettes indépendamment de la qualité, les fourchettes conventionnelles encodent l'attente du lectorat et l'économie de l'imprimerie.

Le National Novel Writing Month, fondé en 1999 par Chris Baty, fixe une cible de 50 000 mots pour novembre, à peu près la longueur de Gatsby le Magnifique (50 061) et de Slaughterhouse-Five (49 459). Soit 1 667 mots par jour pendant trente jours. Stephen King recommande 2 000 mots par jour dans Écriture, mémoires d'un métier ; Anthony Trollope écrivait 3 000 par jour avant d'aller à son emploi à la poste ; Graham Greene se serait arrêté à exactement 500 mots par jour ; Mark Twain visait 1 400. Une habitude quotidienne de mots est ce qui transforme « j'ai une idée » en « je finirai dans N jours ». Un roman de 90 000 mots à 1 000 mots par jour, c'est 90 jours.

Nombres de mots académiques et journalistiques

Pour l'enseignement supérieur américain et britannique, les longueurs de devoir typiques vont : dissertation de lycée 300-1 000 mots ; dissertation universitaire (humanités) 1 500-3 000 ; mémoire 3 000-6 000 ; mémoire de licence avec mention 12 000-20 000 ; mémoire de master 20 000-40 000 ; thèse de doctorat 80 000-100 000 en humanités (souvent plus court, 40 000-60 000, en sciences). Le statement personnel Common App est plafonné à 650 mots, le portail de candidature l'applique. Le statement personnel UCAS au Royaume-Uni est plafonné à 4 000 caractères ou 47 lignes, le plus court des deux. La plupart des universités font respecter les limites avec une tolérance de ±10 %.

Les articles de revue vont d'une lettre de 500-1 500 mots, à un brief de 1 500-3 000, à un article de recherche standard de 4 000-8 000, à une revue de 6 000-12 000. Nature Letters plafonne à 3 000 mots ; JAMA Original Investigation à 3 000 avec un résumé en trois paragraphes ; PNAS Direct Submission à six pages imprimées, environ 6 000 mots.

Limites de caractères sur les réseaux sociaux à mémoriser

La segmentation de phrases est plus difficile que de couper sur un point

La règle naïve, couper sur ., !, ?, échoue sur tout texte anglais réaliste dès le premier paragraphe. « Dr. Smith met Mr. Jones at U.S. Steel » est une phrase ; la coupe naïve en retourne quatre. « J. R. R. Tolkien wrote The Hobbit » est une ; la naïve en retourne quatre. « The pH of 7.4 is normal » est une ; la naïve en retourne deux. Les noms de domaine (« Visit absolutool.com. ») et les e-mails créent des faux positifs ; les points de suspension (« Wait...what? ») créent des faux négatifs.

Une segmentation robuste a besoin soit d'une liste d'abréviations soigneusement constituée (l'approche utilisée par le segmenteur Punkt de NLTK, que l'article 2006 de Kiss et Strunk a entraîné sur un corpus d'un million de mots à F1 ≈ 0,97), soit d'un modèle statistique. Pour un compteur en navigateur, le compromis pratique est de couper sur [.!?]+ suivi d'une espace et d'une majuscule, avec une petite liste noire d'abréviations (Mr|Mrs|Dr|Prof|Sr|Jr|St|Inc|Ltd|U.S|e.g|i.e|etc|vs). Même avec ça, la précision sur du texte bruité plafonne autour de 90 %. Considérez le compte de phrases comme approximatif.

Les formules de lisibilité en un paragraphe chacune

Flesch Reading Ease (1948). Formule de Rudolf Flesch : 206,835 − 1,015 × (mots/phrases) − 84,6 × (syllabes/mots). Plus haut signifie plus facile. 0-30 c'est « très difficile, niveau diplômé universitaire » ; 60-70 c'est « anglais courant, huitième-neuvième année » ; 90-100 c'est « très facile, cinquième année ». Reader's Digest vise ~65 ; Time vise ~52 ; la Harvard Law Review tourne autour de 30.

Flesch-Kincaid Grade Level (1975). Commandé par la marine américaine à J. Peter Kincaid pour la lisibilité de manuels techniques : 0,39 × (mots/phrases) + 11,8 × (syllabes/mots) − 15,59. Sortie : un niveau scolaire américain (8,0 = huitième année). Maintenant intégré au correcteur de Microsoft Word et la métrique de lisibilité la plus citée en copywriting.

SMOG (1969). Le « Simple Measure of Gobbledygook » de Harry McLaughlin compte uniquement les mots de trois syllabes ou plus dans dix phrases consécutives prises au début, au milieu et à la fin du texte. Préféré par les National Institutes of Health américains pour les notices destinées aux patients parce qu'il corrèle mieux que Flesch-Kincaid avec la compréhension réelle sur du texte de santé.

Gunning Fog (1952). Indice de Robert Gunning : 0,4 × ((mots/phrases) + 100 × (mots_complexes/mots)). The Wall Street Journal vise un Fog de ~11 ; le Times de Londres ~14. La thèse de Gunning était que toute écriture professionnelle au-dessus d'un Fog de 12 perdrait des lecteurs.

Temps de lecture et de parole, d'où viennent les chiffres

Ce compteur affiche le temps de lecture à 200 mots par minute et le temps de parole à 130 mots par minute. Les 200 mots/min sont conservateurs par rapport à la méta-analyse 2019 de Marc Brysbaert sur 190 études, qui a convergé sur 238 mots/min en non-fiction et 260 mots/min en fiction (Journal of Memory and Language). Pencher légèrement vers le lent est le choix amical pour l'utilisateur, il vaut mieux qu'une « lecture de cinq minutes » soit en réalité de quatre minutes plutôt que de sept. Les 130 mots/min de parole correspondent à la conversation ; les discours formels font en moyenne 100-130 mots/min. Une keynote de vingt minutes, c'est environ 2 600 mots prononcés. La fonction « X min de lecture » de Medium, introduite en 2014 par Mike Sall, était à l'origine calibrée à 275 mots/min.

Pourquoi votre compte diffère de celui de Word

Trois causes courantes : (1) Microsoft Word et Google Docs traitent les mots à trait d'union comme un seul (comme ce compteur), mais certains compteurs PHP coupent sur tout caractère non-lettre et retournent deux pour « well-known ». (2) Coller depuis Word amène des caractères invisibles, guillemets courbes, espaces insécables (U+00A0), traits d'union conditionnels (U+00AD), qui peuvent fragmenter ou fusionner des jetons selon l'outil. (3) Les comptes de mots uniques sont sensibles à la casse par défaut, donc « The » et « the » comptent comme deux mots uniques distincts ; supprimer la casse et lemmatiser (« running » → « run ») abaisserait le compte d'uniques d'environ 15 % sur la prose typique.

Si votre texte chinois ou japonais affiche zéro (ou un) mot, c'est le tokeniseur par espaces qui fait ce qu'on lui dit, reportez votre attention sur le compte de caractères, qui est la métrique pertinente pour ces écritures. Si « 3,000 » compte pour un mot, c'est parce que la virgule est non-blanc et que le jeton est contigu ; c'est le bon comportement et il correspond à Word.

Plus de questions

Quelle est la précision du score de lisibilité ?

Les formules de lisibilité estiment la complexité à partir des mots-par-phrase et syllabes-par-mot, elles ne comprennent pas réellement si votre prose est bonne. Un score « 8e année » signifie un profil longueur de phrase + densité de syllabes typique des supports de lecture de huitième année ; ça ne certifie pas la clarté. Utilisez le score comme garde-fou, pas comme verdict. Hemingway score autour de la 4e année ; la King James Bible autour de la 8e ; The Wall Street Journal autour de la 11e.

Ce compteur gère-t-il le Markdown ou le HTML ?

Il compte tout ce qui est dans la zone de texte tel quel, y compris **gras**, les en-têtes # et les balises HTML comme <p>. Si vous voulez ne compter que le texte rendu, collez votre contenu dans un previewer Markdown ou la vue Lecteur d'un navigateur, puis copiez le texte nettoyé ici. Hugo, Jekyll et 11ty enlèvent tous le front-matter et le Markdown avant de calculer les nombres de mots sur les pages construites.

Quel est le meilleur conseil pour atteindre un nombre exact de mots ?

Écrivez 10-15 % au-dessus de votre cible, puis coupez. Couper est beaucoup plus facile que rembourrer, et les coupes rendent presque toujours la prose plus forte, parce que les choses les plus faciles à enlever sont les plus faibles. Le conseil traditionnel des éditeurs (« tuez vos chéris ») n'a de sens que si vous avez des chéris à tuer, ce qui veut dire que vous les avez d'abord écrits.

Puis-je l'utiliser pour des mémoires juridiques et des dépôts judiciaires ?

Oui pour une vérification rapide, la Cour suprême des États-Unis plafonne les mémoires de requérants à 13 000 mots et la Federal Rule 32(a)(7)(B) plafonne les mémoires d'appel à 13 000 mots, tous deux comptés par espaces. Pour le compte de mots certifié exigé au dépôt, utilisez le compte de Microsoft Word (que les tribunaux acceptent par nom) et traitez cet outil comme une vérification de brouillon.

Outils associés