16 faits linguistiques surprenants qui semblent faux (mais sont vrais)
TABLE OF CONTENTS
Certains sont si étranges que vous penserez qu’on les a inventés. Ce n’est pas le cas. Chacun est étayé par la recherche linguistique.
Vocabulaire
1. « Run » a 645 significations — et il a fallu 9 mois à un homme pour toutes les écrire.
L’entrée la plus longue du Oxford English Dictionary n’est plus celle de « set ». Le lexicographe Peter Gilliver a passé neuf mois à compiler le verbe « run » : 645 sens distincts couvrant les machines (les programmes s’exécutent), les liquides (les rivières coulent), les tissus (les couleurs déteignent) et des dizaines d’autres domaines. L’entrée pour « set » compte environ 430 significations et se trouve maintenant en troisième position, derrière « run » et « put ».
2. Le mot le plus long du monde prend plus de 3 heures à prononcer.
La réponse dépend de ce qu’on compte comme un « mot ». Si l’on autorise la nomenclature chimique, la protéine titine compte 189 819 lettres. Le Guinness World Records attribue la couronne à un composé sanskrit de 195 caractères tiré d’un poème du XVIe siècle — 428 lettres une fois translittéré. Et l’allemand, en tant que langue agglutinante, peut empiler les noms sans limite, ce qui signifie qu’il n’existe tout simplement pas de mot allemand le plus long.
3. L’arabe N’A PAS 400 mots pour « chameau ». Les Inuits n’ont pas non plus 100 mots pour « neige ».
Ces deux affirmations sont le même mythe linguistique sous des habits différents. Le chiffre des « 400 mots pour chameau » — répété par les encyclopédies et les manuels pendant des décennies — compte chaque expression descriptive, variante dialectale et forme dérivée comme un « mot » distinct. Avec cette logique, l’anglais aurait des centaines de « mots » pour l’eau (liquid, moisture, dew, condensation, precipitation, rainwater, seawater…). Les deux mythes ont été démystifiés par les linguistes comme « motivés davantage par l’ignorance ethnocentrique que par l’érudition ».
4. Plus de 20 mots anglais sont leurs propres contraires.
On les appelle des contronymes (ou Janus words, d’après le dieu romain à deux visages). Sanction peut signifier à la fois « approuver » et « pénaliser ». Cleave peut signifier « fendre » et « s’attacher à ». Dust peut signifier « enlever la poussière de » et « saupoudrer de ». Oversight peut signifier « surveillance attentive » et « une erreur d’inattention ». Off peut signifier « activé » (the alarm went off) et « désactivé » (turn it off). Le contexte fait tout le travail.
Les mots sont déjà assez étranges. Mais la grammaire — les règles invisibles que nous suivons sans y penser — est encore plus étrange.
Une grammaire qui défie le cerveau
5. Il existe une langue sans chiffres — même pas « un » et « deux ».
Le pirahã, parlé par quelques centaines de personnes en Amazonie brésilienne, n’a pas de mots pour les quantités exactes. Le linguiste Daniel Everett n’a documenté que trois termes relatifs : hói (une petite quantité), hoí (une plus grande quantité) et baágiso (beaucoup). Lorsque des chercheurs du MIT ont testé cela en 2008 en montrant des objets dans l’ordre décroissant (10 → 1), les locuteurs ont utilisé hói — supposément « un » — pour des quantités allant jusqu’à six. Ils ne comptent pas. Ils estiment.
6. Dans certaines langues, vous ne pouvez pas dire une seule phrase sans révéler comment vous le savez.
Environ un quart des langues du monde ont une évidentialité obligatoire — un système grammatical qui oblige les locuteurs à indiquer la source de leur information. En tariana, parlé en Amazonie, « José a joué au football » nécessite l’un des cinq suffixes verbaux : -ka (je l’ai vu), -mahka (je l’ai entendu), -nihka (je le déduis des preuves), -sika (je le suppose par connaissance générale) ou -pidaka (quelqu’un me l’a dit). Sans l’un d’eux, la phrase est grammaticalement incomplète — et utiliser le mauvais est considéré comme malhonnête.
7. Le chinois mandarin n’a pas de passé. Ni de futur. Ni aucun temps du tout.
Les verbes chinois ne se conjuguent jamais pour le temps. Au lieu de cela, le temps est exprimé par des mots de contexte (昨天 « hier », 明天 « demain »), des marqueurs d’aspect (了 le pour les actions accomplies) et le bon sens. La phrase « 我去 » (wǒ qù) peut signifier « je vais », « je suis allé » ou « j’irai » selon le moment où vous la dites et ce qui l’entoure. Plusieurs langues mayas et le groenlandais occidental fonctionnent de la même manière — prouvant que le temps grammatical est optionnel, pas universel.
8. Le japonais n’a presque pas de gros mots — et cela le rend plus brutal, pas moins.
Le japonais manque de ces « mots interdits » qui choquent en anglais. Kuso (« zut/crotte ») et baka (« idiot ») sont si doux qu’ils apparaissent non censurés dans les animes pour enfants. Mais le japonais offense différemment — par le choix du pronom. Il y a plus d’une douzaine de façons de dire « tu », et choisir le mauvais est dévastateur. Temē ne signifie rien de littéralement obscène, mais l’utiliser équivaut socialement à traiter quelqu’un de déchet. Comme l’a dit un linguiste : certaines langues ont inventé le marteau pour insulter ; le japonais a inventé le scalpel.
La grammaire vous dit quoi dire. Mais l’écriture et le son déterminent comment cela atteint le monde — et là aussi, les langues font des choix radicalement différents.
Son et symbole
9. Le plus petit alphabet du monde n’a que 12 lettres.
Le rotokas, parlé par environ 4 300 personnes sur l’île de Bougainville en Papouasie-Nouvelle-Guinée, se débrouille avec seulement A, E, G, I, K, O, P, R, S, T, U, V. Cela fait 5 voyelles et effectivement seulement 6 sons consonantiques. Comparez cela à l’anglais (26 lettres) ou au khmer (74 lettres) — l’écart est stupéfiant.
10. Les consonnes de clic n’existent naturellement qu’à un seul endroit sur Terre — l’Afrique.
Ce son « tsk-tsk » que vous faites pour montrer votre désapprobation ? C’est un son de parole légitime dans les langues khoïsan d’Afrique australe, où jusqu’à 70 % des mots commencent par un clic. Certaines langues de cette famille ont plus de 100 consonnes grâce aux combinaisons de cinq types de clics de base (dental, latéral, alvéolaire, palatal, bilabial) avec différents schémas de voix et de flux d’air. Le xhosa et le zoulou ont emprunté les clics par contact — mais en dehors de l’Afrique, aucune langue naturelle ne les utilise.
11. Les langues tonales ne sont pas majoritaires — elles représentent environ 42 % des langues du monde.
L’affirmation souvent citée selon laquelle « 60–70 % des langues sont tonales » est fausse. La base de données ThoT (Maslinsky et Vydrin, 2025) a analysé 7 674 langues et a constaté qu’environ 42,8 % sont tonales. L’ancien chiffre provenait d’un échantillonnage biaisé. Cela reste plus de 3 000 langues où la hauteur change le sens d’un mot — en mandarin, mā (妈, mère) et mǎ (马, cheval) ne diffèrent que par le ton.
12. Le chinois est le plus ancien système d’écriture encore en usage — de loin.
Les caractères chinois remontent aux inscriptions sur os oraculaires d’environ 1200 av. J.-C., ce qui donne au système d’écriture plus de 3 200 ans. Les hiéroglyphes égyptiens sont plus anciens mais éteints. L’écriture cunéiforme sumérienne est plus ancienne mais éteinte. Les caractères chinois ont évolué, se sont simplifiés et se sont répandus — mais un lecteur moderne peut encore reconnaître des formes que ses ancêtres gravaient dans des carapaces de tortue il y a trois millénaires. Le grec possède la plus longue tradition écrite et parlée continue (Linéaire B d’environ 1700 av. J.-C.), mais son alphabet actuel ne date « que » du VIIIe siècle av. J.-C.
Certaines langues ont des traces écrites remontant à des millénaires. D’autres disparaissent avant même d’avoir été écrites.
Perdues et retrouvées
13. Le basque n’a aucun parent connu. Aucun. C’est le dernier de son espèce.
Le basque (Euskara) est la seule langue pré-indo-européenne survivante en Europe occidentale. On le parlait dans les Pyrénées avant l’arrivée des ancêtres de l’anglais, de l’espagnol, du français et du hindi. Toute tentative de le rattacher à une autre famille linguistique — ibérique, berbère, caucasienne — a échoué. La plus ancienne inscription basque, la Main d’Irulegi (Ier siècle av. J.-C.), porte sorioneku — en basque moderne zorioneko, qui signifie « chanceux ». La langue a survécu à la conquête romaine, à des siècles de pression de l’espagnol et du français, et à l’interdiction explicite de Franco. Environ 700 000 personnes la parlent aujourd’hui. Comme le gallois, une autre ancienne langue européenne qui a survécu contre toute attente, le basque connaît aujourd’hui un renouveau culturel.
14. L’espéranto a des locuteurs natifs — environ 1 000 d’entre eux.
Les personnes nées dans des familles espérantophones sont appelées denaskuloj. La première était Emilia Burillo, née en Espagne en 1904. Aujourd’hui, environ 1 000 à 2 000 personnes dans le monde ont appris l’espéranto dès la naissance — généralement dans des familles internationales où les parents se sont rencontrés grâce au mouvement espérantiste. Elles sont toujours au moins bilingues (aucun pays n’a l’espéranto comme langue officielle), et certaines familles perpétuent la tradition depuis quatre générations. C’est la seule langue construite à avoir développé une communauté de locuteurs natifs.
15. Une langue meurt toutes les deux semaines.
L’UNESCO estime qu’il existe environ 8 300 langues dans le monde. Environ 40 % — plus de 3 000 — sont en danger. Depuis 1950, au moins 230 langues se sont éteintes, et le rythme actuel est d’environ une tous les 14 jours. D’ici 2100, les linguistes prévoient que 50 % à 90 % de toutes les langues pourraient disparaître, chacune emportant avec elle une façon irremplaçable de voir le monde.
16. Le document le plus traduit de l’histoire n’est pas la Bible — il ne fait que 1 800 mots.
La Déclaration universelle des droits de l’homme détient le record du monde Guinness du document le plus traduit, disponible en plus de 525 langues. Adoptée par l’ONU en 1948, elle contient 30 articles en environ 1 800 mots. La Bible a été traduite intégralement dans davantage de langues (plus de 700), mais la DUDH l’emporte en tant que document unique et complet disponible dans la plus large gamme de langues — de l’abkhaze au zoulou.
La DUDH existe maintenant dans plus de 525 langues grâce aux traducteurs qui travaillent à travers les barrières linguistiques. OpenL en prend en charge plus de 100 aujourd’hui.
Plus de curiosités linguistiques : 12 mots intraduisibles qui changeront votre vision du monde
Sources
- OED — “Run” as most complex word — New York Times interview with OED editor
- Longest words — Wikipedia — Cross-language comparison of longest words
- Pirahã number experiment — MIT-led team finds language without numbers (2008)
- Evidentiality — The Grammar of Knowledge — Aikhenvald & Dixon, Oxford University Press
- Japanese swearing — Language Log — Discussion of Japanese profanity mechanisms
- Rotokas language — Wikipedia — Smallest modern alphabet
- Click languages — Britannica — Overview of click consonants
- ThoT Database — Tonal status of world languages (Maslinsky & Vydrin, 2025)
- Basque language — BBC Travel — The mysterious origins of Europe’s oldest language
- Native Esperanto speakers — Ethnologue — Denaskuloj demographics
- Endangered languages — UNESCO — UNESCO Bangkok 2025 report
- Most translated document — Guinness World Records — UDHR record
- Contronyms — MIT — Seth Teller’s auto-antonym collection
- Color terms — The Conversation — Why languages differ in color vocabulary


