格鲁吉亚字母:欧洲最独特的文字,历经1500年依然生机勃勃
目录
格鲁吉亚语与任何主要语言家族都无关。它的33字母字母表是专为其发音设计的,动词能同时标记三个人,数数方式以二十为单位。语言学家称它为世界上最令人着迷的谜团之一。
分类
格鲁吉亚语(ქართული ენა,kartuli ena)属于卡特维尔语系(也称为南高加索语系)——这是世界上主要的语言家族之一,目前没有证据表明它与印欧语系、突厥语系或其他已知语系有遗传关系。它完全独立存在。
卡特维尔语系现存四种语言:
| 语言 | 使用者 | 状态 |
|---|---|---|
| 格鲁吉亚语 | 约400万 | 格鲁吉亚官方语言;唯一拥有完整文学传统的语言 |
| 明格列尔语 | 约50万 | 格鲁吉亚西部;无标准书写形式 |
| 斯万语 | 约3.5万–4万 | 格鲁吉亚西北山区;最古老,最早分化 |
| 拉兹语 | 约2.2万 | 土耳其东北部和阿扎尔地区;濒危 |
卡特维尔语系的共同祖先——原始卡特维尔语——大约在公元前2500–2000年于现今格鲁吉亚西部地区使用。2023年一项多学科研究采用贝叶斯系统发育学方法,将斯万语的分化时间推得更早——至铜器时代早期,约7600年前——这表明该语系比传统估计的历史更为悠久。
分布地区
格鲁吉亚语在格鲁吉亚国内约有400万人使用,是唯一的官方语言,也是约87%人口的母语。
主要侨民社区分布于:
| 国家 | 估计使用者人数 | 起源 |
|---|---|---|
| 俄罗斯 | 约17万 | 历史迁徙及苏联时期人口流动 |
| 土耳其 | 约15万 | 19世纪迁移及历史上的格鲁吉亚领土 |
| 伊朗 | 约6万 | 17至19世纪被迁移(Fereydanian 方言) |
| 阿塞拜疆 | 约2万 | Saingilo 地区的本土 Ingiloan 社群 |
| 美国 | 约1.5万 | 1991年后移民 |
| 乌克兰、希腊、西欧 | 合计约5万 | 近期经济移民 |
在格鲁吉亚国内,格鲁吉亚语主导着公共生活——政府、教育、媒体和日常商业活动都以格鲁吉亚语进行。俄语在老一代中仍是常用的第二语言,而自1991年独立以来,英语在年轻一代中迅速普及。

方言
格鲁吉亚语至少有18种公认方言,传统上分为东部和西部两大类。所有方言之间可以互相理解——这与同属 Kartvelian 语系的姐妹语言(Mingrelian、Laz、Svan)不同,后者格鲁吉亚语使用者若不专门学习则无法理解。
五大主要方言群:
| 群组 | 方言 | 地区 |
|---|---|---|
| 西北部 | Imeretian、Lechkhumian、Rachan | Imereti、Lechkhumi、Racha |
| 西南部 | Gurian、Adjarian、Imerkhevian | Guria、Adjara、土耳其东北部 |
| 中部 | Kartlian、Meskhian、Javakhian | Kartli、Meskheti、Javakheti |
| 东北部 | Mokhevian、Mtiuletian、Khevsurian、Pshavian、Tushetian | 东北山区 |
| 东部 | Kakhetian、Tianetian、Ingiloan、Fereydanian | Kakheti及侨居地 |
标准格鲁吉亚语以第比利斯周边中部地区的卡特利方言为基础。最显著的方言差异出现在东北山区(保留了如 [j] 和 [w] 等古老音位)以及西南部(阿扎尔地区因数百年奥斯曼统治,方言中大量吸收了土耳其语和阿拉伯语词汇)。
侨民方言正面临急剧衰退:基兹拉尔-莫兹多克方言(18世纪移民在俄罗斯使用)现已灭绝,伊朗的费雷达尼方言则受到波斯语的强烈冲击。
历史
格鲁吉亚语的书面历史始于公元5世纪,但口语历史则要久远得多。
起源(公元前2500–2000年)。 原始卡特维尔语的使用者居住在格鲁吉亚西部里奥尼河沿岸的科尔基斯平原。早期与印欧语、闪米特语和胡里-乌拉尔图语的接触,至今仍能在词汇中看到借词的痕迹。
最早的文献(约公元430年)。 已知最早的卡特维尔语铭文——比尔·艾尔·库特铭文——出自伯利恒附近的格鲁吉亚修道院,采用阿索姆塔夫鲁利字母书写。这标志着古格鲁吉亚语时期的开始,该时期以圣经翻译、圣人传记和受希腊语、阿拉姆语影响深远的礼仪文本为主。
文学黄金时代(12世纪)。 绍塔·鲁斯塔韦利的史诗**《虎皮骑士》**(ვეფხისტყაოსანი, Vepkhist’q’aosani)确立了世俗文学标准。这部诗歌约有1600节,采用复杂的沙伊里格律,至今仍是民族象征;每个格鲁吉亚学生都要学习,诗句也常在日常对话中引用。
印刷与规范化(17–19世纪)。 第一部格鲁吉亚语印刷书籍于1629年在罗马问世。现代文学格鲁吉亚语在19世纪以东格鲁吉亚方言为基础得到全面规范,1879年正字法改革废除了五个古老字母,最终确定了现行33个字母的字母表。
苏联时期及后苏联时期。 在苏联统治下(1921–1991),格鲁吉亚语在格鲁吉亚苏维埃社会主义共和国中始终保有官方地位——这与许多其他苏维埃加盟共和国被俄语取代本地语言的情况不同。自独立以来,格鲁吉亚语作为国家语言受宪法保护,并在教育、政府及数字领域得到积极推广。
书写系统
格鲁吉亚语历史上使用过三种不同的文字系统,均源自卡特维尔语族:
| 文字 | 时期 | 用途 |
|---|---|---|
| Asomtavruli (ასომთავრული) | 5–9世纪 | 大写体,字形圆润;用于铭文和早期宗教文献 |
| Nuskhuri (ნუსხური) | 9–11世纪 | 小写体,字形方正;用于宗教手稿 |
| Mkhedruli (მხედრული) | 11世纪至今 | 现代草写体;现今所有领域通用 |
关于格鲁吉亚文字的起源众说纷纭。中世纪格鲁吉亚传统认为帕尔纳瓦兹一世国王(公元前3世纪)发明了该文字,但最早的考古证据——Bir el Qutt 铭文——约可追溯至公元430年。字母顺序及部分字形显示出可能受希腊字母影响,但大多数字符是为格鲁吉亚语音系统专门设计的原创字母。
现代 Mkhedruli 字母表共有33个字母,每个字母对应一个音素——格鲁吉亚语拼写几乎完全遵循语音。主要特点包括:
- 无大小写之分。 另有一种专门用于标题、标识和强调的Mtavruli(全大写)风格,但这仅是排版变体,并非严格意义上的大小写系统。
- 书写方向为从左至右。
- 无连写或连笔字母——每个字符都是独立书写。
- 五个字母(ჱ, ჲ, ჳ, ჴ, ჵ)于1879年被废止,仅见于历史文献。在书写Svan、Mingrelian和Laz等相关语言时,这些字母仍在使用。
该文字是目前全球仅约14种仍在使用的字母之一——也是少数最初为某一特定语言设计,而非借用或改编的文字体系。
音系
格鲁吉亚语的音系围绕一个核心特征构建:爆发音(ejective consonants)。
三分法塞音系统
格鲁吉亚语的塞音和塞擦音分为三类——浊音、送气音和爆发音:
| 类型 | 示例 | 听起来像 |
|---|---|---|
| 浊音 | ბ (b), დ (d), გ (g) | 类似英语的 b, d, g |
| 送气音 | ფ (p), თ (t), ქ (k) | 类似英语的 p, t, k,带有一股气流 |
| 爆发音 | პ (p’), ტ (t’), კ (k’), ყ (q’), წ (ts’), ჭ (ch’) | 一种“爆破”声——闭合声门,积压气流,猛然释放 |
爆发音是格鲁吉亚语在外国人耳中最具辨识度的声音。格鲁吉亚语中有三种类似 k 的音(ქ k, კ k’, ყ q’),以及三种类似 ts 的音(ც ts, ძ dz, წ ts’)。如果你把爆发音误读成普通音,词义就会完全改变。比如:
- ქარი(kari,送气 k)= “风”
- კარი(k’ari,爆发 k)= “门”
辅音连缀
格鲁吉亚语允许的辅音组合对非母语者来说几乎不可思议。最著名的例子:
მწვრთნელი — mts’vrtneli(“教练”),开头连续六个辅音
还有გვფრცქვნი(gvprtskvni,“你在剥我们”),常被引用为极端案例,八个辅音连在一起。
这些连缀遵循音系规则——它们是“和谐连缀”,声调先降后升——但依然是格鲁吉亚语发音最难掌握的部分之一。
元音
格鲁吉亚语只有五个元音,与西班牙语完全相同:
| 字母 | 国际音标 | 类似发音 |
|---|---|---|
| ა (a) | /a/ | “father” |
| ე (e) | /ɛ/ | “bed” |
| ი (i) | /i/ | “see” |
| ო (o) | /ɔ/ | “or” |
| უ (u) | /u/ | “blue” |
没有长元音、没有声调、没有鼻化元音。如果你能清楚地发出 a、e、i、o、u 这几个音,那么格鲁吉亚语的元音对你来说就不会是难题。
语法
格鲁吉亚语的语法正是这门语言声名远扬的原因。有三个特点尤为突出。
分裂作格
大多数语言在标记主语和宾语时只用一种系统。英语是主宾格语言:“I see him”和“I run”中的主语形式相同。而格鲁吉亚语则根据动词的时态使用两套不同的系统:
| 动词系列 | 及物动词主语 | 直接宾语 | 例时时态 |
|---|---|---|---|
| 系列 I(现在时) | 主格 | 与格 | 现在时、将来时 |
| 系列 II(简单过去时) | 作格 | 主格 | 简单过去时 |
| 系列 III(完成时) | 与格 | 主格 | 现在完成时 |
这意味着同一个名词会根据动词所处的时态而变格:
- 现在时:ბიჭი ხატავს (bich’i khat’avs) — “男孩(主格)在画它”
- 过去时:ბიჭმა დახატა (bich’ma dakhat’a) — “男孩(作格)画了它”
- 完成时:ბიჭს დაუხატავს (bich’s daukhata’vs) — “男孩(与格)已经画过了”
“男孩”这个词会从 bich’i 变成 bich’ma,再变成 bich’s。分裂作格在世界语言中极为罕见,这也是为什么格鲁吉亚语成为语言学家们珍视的研究对象。
多人称动词
一个格鲁吉亚语动词可以同时编码多达三位参与者——主语、直接宾语和间接宾语。一个动词单词中最多可以包含八个语素。
以词根 -წერ-(-ts’er-,“写”)为例:
დამიწერე — damits’ere = “写给我”
- და- = 前缀(完成体)
- -მ- = 第一人称单数间接宾语(“给我”)
- -ი- = 版本标记
- -წერ- = 词根(“写”)
- -ე = 祈使式
六个语素,组成一个词。而在英语中,这需要四个单词:“Write it to me.”
这个系统被称为多重人称标记(polypersonalism),意味着格鲁吉亚语的动词变位表极其庞大——每个动词都有几十种形式。
七个名词格
| 格 | 功能 | 示例后缀 |
|---|---|---|
| 主格 | 主语(第一、第二系列宾语) | -ი (-i) |
| 作格/叙述格 | 及物动词主语(第二系列) | -მა (-ma) |
| 与格 | 间接宾语;第三系列主语 | -ს (-s) |
| 属格 | 表示所有关系 | -ის (-is) |
| 工具格 | 表示手段、工具、方法 | -ით (-it) |
| 副词格 | 副词性修饰 | -ად (-ad) |
| 呼格 | 直接称呼 | -ო (-o) |
格鲁吉亚语没有的东西
三点让语法比看起来简单:
- 没有语法性别。 没有任何阳性/阴性/中性区分。甚至代词 ის (is) 既可以指“他”、“她”或“它”——格鲁吉亚语对此毫不在意。
- 没有冠词。 没有类似“the”或“a”的词。
- 拼音书写。 每个字母只对应一个发音。你能读出来,就能写出来。
二十进制数词
格鲁吉亚语是按二十为单位计数,而不是十:
| 数字 | 格鲁吉亚语 | 字面含义 |
|---|---|---|
| 20 | ოცი (otsi) | “二十” |
| 30 | ოცდაათი (otsdaati) | “二十加十” |
| 40 | ორმოცი (ormotsi) | “两个二十” |
| 60 | სამოცი (samotsi) | “三个二十” |
| 80 | ოთხმოცი (otkhmotsi) | “四个二十” |
| 99 | ოთხმოცდაცხრამეტი | “四个二十加十九” |
这是与巴斯克语和部分凯尔特语计数系统共有的区域特征——也提醒我们,“十进制”只是习惯,并非普遍规律。
词汇与借词
格鲁吉亚语位于欧亚交汇处,其词汇反映了数千年的交流与融合。
| 来源 | 示例 |
|---|---|
| 希腊语 | eklesia “教堂”,paraskevi “星期五” |
| 波斯语 | shakar “糖”,bāzār “市场” |
| 阿拉伯语 | khalkhi “人民”(源自 khalq),kitabi “书” |
| 土耳其语 | chai “茶”,大量食品和贸易相关词汇 |
| 俄语 | gazeti “报纸”,traktori “拖拉机”,苏联时期行政词汇 |
| 英语 | kompiuteri、telefoni、interneti ——近期借词,已适应格鲁吉亚语音体系 |
更深层的借词可以追溯得更远。有学者认为格鲁吉亚语中存在来自赫梯语及其他安纳托利亚语言的可能借词——如 veli(“田地”,参见赫梯语 wēllu- “牧场”)和 k’ak’abi(“鹧鸪”,参见赫梯语 kakkabi-)——显示出青铜时代的交流痕迹。
格鲁吉亚语也通过自身的构词系统积极造词。词根 -კაც-(-k’ats-,“人”)可以派生出 k’atsi(男人)、sak’atso(人类)、mok’atseoba(公民身份)、uk’atso(粗鲁),以及通过前缀和后缀形成的几十个词汇。
常用短语
| 英文 | 格鲁吉亚语 | 发音 | 备注 |
|---|---|---|---|
| Hello | გამარჯობა | gamarjoba | 字面意思是“胜利!”——独特的格鲁吉亚式问候 |
| Goodbye | ნახვამდის | nakhvamdis | “直到我们再见” |
| Thank you | მადლობა | madloba | 源自 madli(“恩典”) |
| Please | თუ შეიძლება | tu sheidzleba | 字面意思是“如果可以的话” |
| Yes | კი / დიახ | ki / diakh | Ki为随意用法,diakh较正式 |
| No | არა | ara | |
| Excuse me | ბოდიში | bodishi | 也可表示“对不起” |
| How are you? | როგორ ხარ? | rogor khar? | 非正式单数用法 |
| Cheers! | გაუმარჯოს! | gaumarjos! | 祝酒词——字面意思“祝你胜利!” |
| I love Georgia | მე მიყვარს საქართველო | me miq’vars sakartvelo |
敬酒传统值得特别一提。格鲁吉亚人以其精致的敬酒仪式而闻名,这一仪式通常由宴会(supra)上的თამადა(tamada,敬酒主持人)引领。每一次敬酒都以gaumarjos——“胜利属于你”——开场,将日常用语与格鲁吉亚深厚的待客文化紧密相连。
学起来难吗?
简短回答:难。美国外交服务学院(FSI)将格鲁吉亚语归为第四类语言——英语母语者要达到专业水平大约需要1,100课时(44周)。在FSI的表格中,格鲁吉亚语还被标注了星号(*),意味着它通常比同级别的其他语言更难。
难点如下:
| 挑战 | 难点解析 |
|---|---|
| 动词系统 | 多重人称一致 + 分裂作格 + 11种“screeves”(时体态组合) |
| 送气塞音 | 英语中没有对应音;需要训练声门发音 |
| 辅音连缀 | 类似mts’vrtneli这样的词需要彻底改变舌头的发音习惯 |
| 词汇 | 与英语几乎没有同源词;一切都要从头学起 |
| 非拉丁字母 | 需要掌握33个陌生字母,才能看懂路牌 |
比你想象中容易的地方:
| 优势 | 有何助益 |
|---|---|
| 无性别区分 | 再也不用记“le”和“la”之类的性别词了 |
| 拼写完全表音 | 每个字母对应一个音;没有哑音,没有例外 |
| 没有冠词 | 不用纠结“a/an/the” |
| 重音规律 | 单词重音基本可预测 |
| 热情欢迎 | 格鲁吉亚人真心欣赏你尝试说他们的语言 |
学习格鲁吉亚语的建议
1. 从字母表开始——别碰别的。 在接触语法之前,先把33个Mkhedruli字母反复练习,直到能自动认读。否则,后续每一步都会变得更慢、更挫败。抽认卡和手写练习是你最好的帮手。
2. 尽早掌握送气塞音。 录下自己发音的极小对立词(如 ქარი 和 კარი),并与母语者的音频进行对比。送气塞音需要声门的肌肉记忆,而英语从未用到这种发音——这是一项身体技能,而非智力技能。
3. 按“screeves”学习动词,而不是按时态。 格鲁吉亚语动词分为11个 screeves(მწკრივი,mts’k’rivi)——即时态、体和语气的组合。不要试图直接对应英语时态,而要在语境中学习每个 screeve 的实际用法。
4. 找一位母语者。 格鲁吉亚语的教材资源远少于主流语言。语言交换伙伴、iTalki 等平台上的导师,或第比利斯本地语言学校的在线课程,是最有效的学习途径。
5. 利用格鲁吉亚语媒体。 在 Netflix 上观看格鲁吉亚电影,在 Spotify 上听格鲁吉亚音乐,关注格鲁吉亚新闻网站。即使是被动接触,也有助于你内化送气塞音的声音和辅音簇的节奏。
6. 对自己要有耐心。 IV类语言意味着需要 1,100+ 小时。如果你每周学习 5 小时,达到专业熟练至少需要四年以上。设定以月为单位的里程碑,而不是以周为单位。
格鲁吉亚语的 AI 翻译
由于格鲁吉亚语使用者基数较小(约 400 万人)且形态结构复杂,长期以来它一直是机器翻译领域的低资源语言——训练数据远不及西班牙语、中文或阿拉伯语。
但这一状况正在迅速改变。截至 2026 年:
- Translated 的 Lara 200 现已支持格鲁吉亚语,在专业人工评测中比此前最先进系统提升了 13%。其 Lara Think 推理模型在处理形态复杂的句子时,错误率降低了 50–60%。
- GPT-4o 和 Mistral-large 在格鲁吉亚语词形还原和词性标注上的准确率为 76–87%,虽然仍低于它们在主流欧洲语言上的表现。
- Meta 的 NLLB-200(No Language Left Behind)提供开源的格鲁吉亚语翻译能力,已成为许多小型翻译应用的核心引擎。
- 多款移动应用现已支持格鲁吉亚语的语音、拍照和文本翻译。
当前的主要挑战,正是格鲁吉亚语在语言学上引人入胜的特性:多参与者动词(一个词可编码三种参与者)、爆破音(语音转文字系统难以区分)、以及分裂作格结构(让习惯于主宾一致语言的模型无所适从)。
如今要获得可靠的格鲁吉亚语翻译,OpenL 等工具已支持 100 多种语言的格鲁吉亚语互译,采用上下文感知的神经网络翻译方式,比逐词翻译更能处理复杂的动词一致性。如果你在比较格鲁吉亚语等低资源语言的翻译方案,可参考我们的 Google Translate 替代方案盘点。在翻译格鲁吉亚语文档时,务必选择明确支持 Mkhedruli 字母的服务,以避免编码错误——尤其是在处理 PDF 文件时。
参考来源
- 卡特维尔语系 — 大英百科全书 — 关于该语系的分类、历史及语言特征介绍
- 格鲁吉亚语 — 大英百科全书 — 格鲁吉亚语方言、语法及文学历史的全面概述
- 卡特维尔语系 — 维基百科 — 详尽的语言分类及原始卡特维尔语的重建
- 格鲁吉亚语方言 — 维基百科 — 18种方言分类、地区特征及侨民变体
- 标准格鲁吉亚语 — 剑桥大学出版社(2024) — 标准格鲁吉亚语语音的国际音标示例
- FSI语言难度排名 — 美国国务院 — IV类分类及1100小时学习估算
- Lara 200 Languages — Translated(2025) — 格鲁吉亚语被纳入Lara 200,较ModernMT提升13%
- 历史格鲁吉亚语的大型语言模型 — Vidal-Gorene, Cafiero & Kindt(2025) — GPT-4o和Mistral在格鲁吉亚语自然语言处理任务上的表现
- Gavashelishvili等(2023)— 南高加索语系起源的时间与地点 — 原始卡特维尔语的贝叶斯系统发育年代推定约为7600年前
- 简明格鲁吉亚语语法,第2版 — Tamar Makharoblidze(2024) — 现代格鲁吉亚语最新学术语法书


