16 fatos linguísticos surpreendentes que parecem falsos (mas são reais)

OpenL Team 6/8/2026
16 fatos linguísticos surpreendentes que parecem falsos (mas são reais)

TABLE OF CONTENTS

Alguns são tão estranhos que você vai achar que inventamos. Não inventamos. Cada um é respaldado por pesquisa linguística.

Vocabulário

1. “Run” tem 645 significados — e um homem levou 9 meses para escrevê-los todos.

A entrada mais longa do Oxford English Dictionary não é mais para “set”. O lexicógrafo Peter Gilliver passou nove meses compilando o verbo “run”: 645 sentidos distintos abrangendo máquinas (programas rodam), líquidos (rios correm), tecidos (cores desbotam) e dezenas de outros domínios. A entrada para “set” tem cerca de 430 significados e agora ocupa o terceiro lugar, atrás de “run” e “put”.

2. A palavra mais longa do mundo leva mais de 3 horas para ser pronunciada.

A resposta depende do que se conta como “palavra”. Se for permitida a nomenclatura química, a proteína titina tem 189.819 letras. O Guinness World Records concede a coroa a um composto sânscrito de 195 caracteres de um poema do século XVI — 428 letras quando transliterado. E o alemão, como língua aglutinante, pode empilhar substantivos sem limite, o que significa que simplesmente não existe uma palavra alemã mais longa.

3. O árabe NÃO tem 400 palavras para “camelo”. Nem os inuítes têm 100 palavras para “neve”.

Ambas as alegações são o mesmo mito linguístico com roupagens diferentes. O número de “400 palavras para camelo” — repetido por enciclopédias e livros didáticos por décadas — conta cada frase descritiva, variante dialetal e forma derivada como uma “palavra” separada. Por essa lógica, o inglês tem centenas de “palavras” para água (liquid, moisture, dew, condensation, precipitation, rainwater, seawater…). Ambos os mitos foram desmascarados por linguistas como “motivados mais pela ignorância etnocêntrica do que pelo rigor acadêmico”.

4. Mais de 20 palavras em inglês são seus próprios opostos.

São chamadas de contronyms (ou Janus words, em referência ao deus romano de duas faces). Sanction pode significar tanto “aprovar” quanto “penalizar”. Cleave pode significar “separar” e “aderir”. Dust pode significar “remover o pó de” e “polvilhar”. Oversight pode significar “supervisão cuidadosa” e “um descuido”. Off pode significar “ativado” (the alarm went off) e “desativado” (turn it off). O contexto faz todo o trabalho.

As palavras já são estranhas o suficiente. Mas a gramática — as regras invisíveis que seguimos sem pensar — é ainda mais estranha.

Gramática que desafia o cérebro

5. Existe uma língua sem números — nem mesmo “um” e “dois”.

O pirahã, falado por algumas centenas de pessoas na Amazônia brasileira, não tem palavras para quantidades exatas. O linguista Daniel Everett documentou apenas três termos relativos: hói (uma quantidade pequena), hoí (uma quantidade maior) e baágiso (muitos). Quando pesquisadores do MIT testaram isso em 2008 mostrando objetos em ordem decrescente (10 → 1), os falantes usaram hói — supostamente “um” — para quantidades de até seis. Eles não estão contando. Estão estimando.

6. Em algumas línguas, você não pode dizer uma única frase sem revelar como a sabe.

Cerca de um quarto das línguas do mundo têm evidencialidade obrigatória — um sistema gramatical que força os falantes a marcar a fonte de sua informação. Em tariana, falado na Amazônia, “José jogou futebol” exige um dos cinco sufixos verbais: -ka (eu vi), -mahka (eu ouvi), -nihka (eu infiro pelas evidências), -sika (eu suponho pelo conhecimento geral) ou -pidaka (alguém me contou). Sem um deles, a frase está gramaticalmente incompleta — e usar o errado é considerado desonestidade.

7. O chinês mandarim não tem passado. Nem futuro. Nem tempo verbal algum.

Os verbos chineses nunca se conjugam para o tempo. Em vez disso, o tempo é expresso por palavras de contexto (昨天 “ontem”, 明天 “amanhã”), marcadores de aspecto (了 le para ações concluídas) e senso comum. A frase “我去” (wǒ qù) pode significar “eu vou”, “eu fui” ou “eu irei” dependendo inteiramente de quando você a diz e do que a rodeia. Várias línguas maias e o groenlandês ocidental funcionam da mesma forma — provando que o tempo verbal é opcional, não universal.

8. O japonês quase não tem palavrões — e isso o torna mais brutal, não menos.

O japonês carece do tipo de “palavras proibidas” que chocam em inglês. Kuso (“droga/porcaria”) e baka (“idiota”) são tão leves que aparecem sem censura em animes infantis. Mas o japonês ofende de forma diferente — pela escolha do pronome. Há mais de uma dúzia de maneiras de dizer “você”, e escolher a errada é devastador. Temē não significa nada literalmente obsceno, mas usá-lo é o equivalente social a chamar alguém de lixo. Como disse um linguista: algumas línguas inventaram a marreta para insultar; o japonês inventou o bisturi.

A gramática diz o que falar. Mas a escrita e o som determinam como isso chega ao mundo — e também aqui, as línguas fazem escolhas radicalmente diferentes.

Som e símbolo

9. O menor alfabeto do mundo tem apenas 12 letras.

O rotokas, falado por cerca de 4.300 pessoas na Ilha de Bougainville, em Papua-Nova Guiné, se vira com apenas A, E, G, I, K, O, P, R, S, T, U, V. São 5 vogais e efetivamente apenas 6 sons consonantais. Compare isso com o inglês (26 letras) ou o khmer (74 letras) — a diferença é impressionante.

10. As consoantes de clique existem naturalmente em apenas um lugar na Terra — a África.

Aquele som “tsc-tsc” que você faz para mostrar desaprovação? É um som de fala legítimo nas línguas khoisan da África austral, onde até 70% das palavras começam com um clique. Algumas línguas dessa família têm mais de 100 consoantes graças a combinações de cinco tipos básicos de clique (dental, lateral, alveolar, palatal, bilabial) com diferentes padrões de voz e fluxo de ar. O xhosa e o zulu pegaram cliques emprestados por contato — mas fora da África, nenhuma língua natural os usa.

11. As línguas tonais não são a maioria — representam cerca de 42% das línguas do mundo.

A afirmação frequentemente citada de que “60–70% das línguas são tonais” está errada. O banco de dados ThoT (Maslinsky e Vydrin, 2025) analisou 7.674 línguas e descobriu que aproximadamente 42,8% são tonais. O número antigo vinha de uma amostragem enviesada. Ainda assim, são mais de 3.000 línguas onde o tom muda o significado de uma palavra — em mandarim, (妈, mãe) e (马, cavalo) diferem apenas no tom.

12. O chinês é o sistema de escrita mais antigo ainda em uso — de longe.

Os caracteres chineses remontam às inscrições em ossos oraculares de cerca de 1200 a.C., tornando o sistema de escrita com mais de 3.200 anos. Os hieróglifos egípcios são mais antigos, mas estão extintos. A escrita cuneiforme suméria é mais antiga, mas está extinta. Os caracteres chineses evoluíram, simplificaram e se espalharam — mas um leitor moderno ainda pode reconhecer formas que seus ancestrais gravaram em cascos de tartaruga há três milênios. O grego tem a mais longa tradição escrita e falada contínua (Linear B de ~1700 a.C.), mas seu alfabeto atual é “apenas” do século VIII a.C.

Algumas línguas têm registros escritos que remontam a milênios. Outras estão desaparecendo antes de serem escritas.

Perdidas e encontradas

13. O basco não tem parentes conhecidos. Nenhum. É o último de sua espécie.

O basco (Euskara) é a única língua pré-indo-europeia sobrevivente na Europa Ocidental. Era falada nos Pireneus antes da chegada dos ancestrais do inglês, espanhol, francês e hindi. Todas as tentativas de vinculá-lo a outra família linguística — ibérica, berbere, caucasiana — falharam. A inscrição basca mais antiga, a Mão de Irulegi (século I a.C.), traz sorioneku — no basco moderno zorioneko, que significa “afortunado”. A língua sobreviveu à conquista romana, a séculos de pressão do espanhol e do francês, e à proibição explícita de Franco. Cerca de 700.000 pessoas a falam hoje. Assim como o galês, outra antiga língua europeia que sobreviveu contra todas as probabilidades, o basco está experimentando um renascimento cultural.

14. O esperanto tem falantes nativos — cerca de 1.000 deles.

As pessoas nascidas em famílias esperantistas são chamadas de denaskuloj. A primeira foi Emilia Burillo, nascida na Espanha em 1904. Hoje, cerca de 1.000 a 2.000 pessoas em todo o mundo aprenderam esperanto desde o nascimento — geralmente em famílias internacionais onde os pais se conheceram através do movimento esperantista. São sempre pelo menos bilíngues (nenhum país tem o esperanto como língua oficial), e algumas famílias mantêm a tradição por quatro gerações. É a única língua construída a desenvolver uma comunidade de falantes nativos.

15. Uma língua morre a cada duas semanas.

A UNESCO estima que existam cerca de 8.300 línguas no mundo. Cerca de 40% — mais de 3.000 — estão ameaçadas. Desde 1950, pelo menos 230 línguas foram extintas, e a taxa atual é de aproximadamente uma a cada 14 dias. Até 2100, os linguistas projetam que 50% a 90% de todas as línguas podem desaparecer, cada uma levando consigo uma forma insubstituível de ver o mundo.

16. O documento mais traduzido da história não é a Bíblia — tem apenas 1.800 palavras.

A Declaração Universal dos Direitos Humanos detém o Recorde Mundial do Guinness como o documento mais traduzido, disponível em mais de 525 idiomas. Adotada pela ONU em 1948, contém 30 artigos em cerca de 1.800 palavras. A Bíblia foi traduzida integralmente para mais idiomas (mais de 700), mas a DUDH ganha como um documento único e completo disponível na mais ampla gama de línguas — do abkhaz ao zulu.

A DUDH agora existe em mais de 525 idiomas graças a tradutores que trabalham superando barreiras linguísticas. A OpenL oferece suporte a mais de 100 deles hoje.

Mais curiosidades linguísticas: 12 palavras intraduzíveis que vão mudar como você vê o mundo

Sources