16 个听起来像假的(但千真万确)的惊人语言事实

OpenL Team 2026/6/8
16 个听起来像假的(但千真万确)的惊人语言事实

目录

有些事实实在太过离奇,你会以为是我们编的。我们没有。每一个都有语言学研究作支撑。

词汇

1. “Run” 有 645 种含义——而一个人花了 9 个月才把它们全部写完。

《牛津英语词典》最长的词条不再是 “set” 了。词典编纂者 Peter Gilliver 花了九个月时间编纂动词 “run”——从机器运行(programs run)、液体流动(rivers run)、布料褪色(colors run)到其他数十个领域,共计 645 种不同的义项。“set” 的词条约有 430 种含义,现在排在第三位,仅次于 “run” 和 “put”。

2. 世界上最长的单词需要超过 3 小时才能读完。

答案取决于你把什么算作一个”单词”。如果允许化学命名法,蛋白质 titin 的名称长达 189,819 个字母。吉尼斯世界纪录将桂冠授予一个来自 16 世纪诗歌的 195 个字符的梵语复合词——转写后为 428 个字母。而德语作为一种黏着语,可以无限堆叠名词,这意味着德语根本没有最长的单词。

3. 阿拉伯语并没有 400 个表示”骆驼”的词。因纽特人也没有 100 个表示”雪”的词。

这两种说法是同一个语言学迷思穿了不同的外衣。“400 个骆驼词汇”这个数字——被百科全书和教科书重复引用了几十年——把每一个描述性短语、方言变体和派生形式都算作了独立的”词”。按这个逻辑,英语有几百个表示”水”的”词”(liquid、moisture、dew、condensation、precipitation、rainwater、seawater……)。这两种迷思都被语言学家驳斥为”其动机更多出于族裔中心主义的无知,而非学术研究”。

4. 有超过 20 个英语单词是它们自己的反义词。

它们被称为 contronym(或 Janus words,以罗马双面神 Janus 命名)。Sanction 可以同时表示”批准”和”制裁”。Cleave 可以表示”劈开”和”紧贴”。Dust 可以表示”除去灰尘”和”撒上粉末”。Oversight 可以表示”仔细监督”和”疏忽大意”。Off 可以表示”启动”(the alarm went off)和”关闭”(turn it off)。全靠语境来区分。

单词已经够奇怪了。但语法——那些我们不经思考就遵循的隐形规则——更加奇怪。

颠覆认知的语法

5. 有一种语言没有数字——连”一”和”二”都没有。

Pirahã 语由巴西亚马逊地区几百人使用,没有表示精确数量的词汇。语言学家 Daniel Everett 只记录了三个相对量词:hói(少量)、hoí(较多量)和 baágiso(很多)。当 MIT 研究人员在 2008 年通过按降序展示物体(10 → 1)来测试时,说话者用 hói——据称是”一”——来表示高达六个的数量。他们不是在数数,而是在估算。

6. 在某些语言中,你没法说出一句完整的话而不透露你是怎么知道这件事的。

世界上大约四分之一的语言具有强制性 evidentiality(示证范畴)——一个语法系统,迫使说话者标记其信息来源。在亚马逊地区使用的 Tariana 语中,“José 踢了足球”需要五个动词后缀之一:-ka(我亲眼看到的)、-mahka(我听到的)、-nihka(我从证据推断的)、-sika(我根据常识推断的)或 -pidaka(别人告诉我的)。没有后缀,句子在语法上就是不完整的——而用错了后缀则被视为不诚实。

7. 普通话没有过去时。也没有将来时。根本没有任何时态。

中文动词从不根据时间变位。相反,时间通过上下文词语(昨天、明天)、体标记(了表示完成动作)和常识来表达。句子”我去”可以根据你说话的时间和上下文表示”I go”、“I went”或”I will go”。几种玛雅语言和西格陵兰语也以同样方式运作——这证明了时态是可选的,而非普遍的。

8. 日语几乎没有脏话——而这让它更具杀伤力,而非更温和。

日语缺少英语中那种令人震惊的”禁忌词汇”。Kuso(“该死/糟糕”)和 baka(“笨蛋”)温和到在儿童动画中都不加审查地出现。但日语以不同的方式冒犯他人——通过代词选择。有十几种方式表达”你”,选错一个就是毁灭性的。Temē 的字面意思并不淫秽,但在社交上等同于把对方叫做垃圾。正如一位语言学家所说:有些语言发明了大锤来骂人;日语则发明了手术刀。

语法告诉你该说什么。但文字和声音决定了它如何传达给世界——在这方面,语言同样做出了截然不同的选择。

声音与符号

9. 世界上最小的字母表只有 12 个字母。

Rotokas 语由巴布亚新几内亚布干维尔岛约 4,300 人使用,仅靠 A、E、G、I、K、O、P、R、S、T、U、V 这 12 个字母运作。那是 5 个元音和实际上只有 6 个辅音。与英语(26 个字母)或高棉语(74 个字母)相比——差距惊人。

10. 搭嘴音在地球上只有一个地方自然存在——非洲。

你表示不赞同时发出的”啧啧”声?在南非的 Khoisan 语系中,这是一个合法的语音,其中高达 70% 的单词以搭嘴音开头。该语系中的一些语言拥有超过 100 个辅音,这要归功于五种基本搭嘴音类型(齿音、边音、龈音、腭音、双唇音)与不同嗓音和气流模式的组合。Xhosa 语和 Zulu 语通过接触借用了搭嘴音——但在非洲之外,没有一种自然语言使用它们。

11. 声调语言并非占大多数——它们约占世界语言的 42%。

经常被引用的”60-70% 的语言是声调语言”的说法是错误的。ThoT 数据库(Maslinsky 和 Vydrin,2025 年)分析了 7,674 种语言,发现约 42.8% 是声调语言。旧数据来自有偏抽样。尽管如此,这仍然是超过 3,000 种语言,在这些语言中音高变化会改变词语的含义——在普通话中,(妈)和 (马)仅通过声调区分。

12. 中文是仍在使用的、最古老的书写系统——遥遥领先。

汉字可以追溯到公元前 1200 年左右的甲骨文,使得这个书写系统已有 3,200 多年的历史。埃及象形文字更古老但已消亡。苏美尔楔形文字更古老但已消亡。汉字不断演变、简化和传播——但现代读者仍然能辨认出他们祖先三千年前刻在龟甲上的字形。希腊语拥有最长的连续书写和口语传统(Linear B 约公元前 1700 年),但其当前字母表”仅”追溯到公元前 8 世纪。

有些语言拥有跨越千年的书面记录。而另一些在尚未被记录下来之前就正在消失。

失落与发现

13. Basque 语没有已知的亲属语言。完全没有。它是其语系中仅存的最后一种。

Basque 语(Euskara)是西欧唯一幸存的前印欧语言。在英语、西班牙语、法语和印地语的祖先抵达之前,它就已在比利牛斯山脉地区被使用。每一次将其与其他语系联系起来——Iberian 语、Berber 语、高加索语系——的尝试都失败了。最古老的 Basque 语铭文,Irulegi 之手(公元前 1 世纪),写着 sorioneku——现代 Basque 语的 zorioneko,意为”幸运的”。这种语言经历了罗马征服、几个世纪来自西班牙语和法语的挤压,以及佛朗哥的明令禁止,仍然存活了下来。今天大约有 70 万人使用它。就像另一种克服困难幸存下来的古老欧洲语言 Welsh 一样,Basque 语正在经历一场文化复兴。

14. 世界语(Esperanto)有母语使用者——大约 1,000 人。

出生在世界语家庭的人被称为 denaskuloj。第一位是 Emilia Burillo,1904 年出生于西班牙。今天,全球大约有 1,000 到 2,000 人从出生起就学习世界语——通常是在父母通过世界语运动相识的国际家庭中。他们至少是双语者(没有国家将世界语作为官方语言),有些家庭已经传承了四代。这是唯一一种发展出母语使用者社群的人造语言。

15. 每两周就有一种语言消亡。

UNESCO 估计世界上大约有 8,300 种语言。约 40%——超过 3,000 种——濒临灭绝。自 1950 年以来,至少 230 种语言已经灭绝,目前的速度大约是每 14 天一种。到 2100 年,语言学家预测 50% 到 90% 的语言可能会消失,每一种都带走了一种不可替代的看待世界的方式。

16. 历史上被翻译最多的文件不是《圣经》——它只有 1,800 个单词。

《世界人权宣言》保持着吉尼斯世界纪录,是有史以来被翻译最多的文件,可用超过 525 种语言阅读。该宣言于 1948 年由联合国通过,包含 30 条条款,约 1,800 个单词。《圣经》被完整翻译成的语言更多(700 多种),但《世界人权宣言》作为一份单一完整的文件,以最广泛的语言范围——从 Abkhaz 语到 Zulu 语——可供阅读而获胜。

《世界人权宣言》如今存在超过 525 种语言版本,这要归功于跨越语言障碍工作的翻译人员。OpenL 目前支持其中 100 多种语言。

更多语言趣闻:12 个无法翻译的词,将改变你看世界的方式

Sources