波斯语:伊朗及其周边地区的诗意语言
目录
拥有超过1.1亿使用者,分布在三大洲,波斯语是世界上最古老的持续使用的语言之一——也是为我们带来鲁米、哈菲兹和菲尔多西的语言。
介绍
波斯语,在其母语使用者中被称为 Farsi (فارسی),属于印欧语系的伊朗语支。它拥有超过2500年的书面历史,从阿契美尼德帝国的楔形文字铭文到今天德黑兰新闻网站上的现代散文,波斯语的书写记录源远流长。
波斯语是伊朗的官方语言,其密切相关的变体——阿富汗的达里语和塔吉克斯坦的塔吉克语——在这些国家也作为官方语言使用。这三种语言彼此可以互通,使波斯语成为一种从地中海延伸到中亚的多中心语言。
无论您是为了商务、旅行、文学还是翻译而学习波斯语,了解其核心特征将使您与一个塑造了三千年世界文明的文化建立联系。
波斯语的使用地区
- 伊朗:约有8000万使用者。波斯语(Farsi)是官方语言,也是政府、媒体、教育和日常生活中的主要语言。
- 阿富汗:约有1500万使用者讲达里语(Dari),这是该国与普什图语(Pashto)并列的两种官方语言之一。达里语是阿富汗众多民族之间的通用语。
- 塔吉克斯坦:约有800万使用者讲塔吉克语(Tajik),这是该国的官方语言。塔吉克语使用的是经过修改的西里尔字母,而不是波斯-阿拉伯字母。
- 乌兹别克斯坦:波斯语使用者是显著的少数群体,尤其是在撒马尔罕和布哈拉等城市,这些地方是波斯文化的历史中心。
- 波斯湾国家:在巴林、伊拉克、阿曼、阿联酋及其他海湾国家存在讲波斯语的社区。
- 美国:估计有100万波斯语使用者,主要集中在洛杉矶(常被称为“德黑兰吉利斯”)、华盛顿特区地区和纽约。
- 加拿大:约有20万使用者,主要分布在多伦多和温哥华。
- 欧洲:在德国、英国、瑞典和法国有显著的波斯语社区。
提示:如果您计划在波斯语世界范围内工作,请尽早熟悉三种语言名称——Farsi、Dari、Tajik。在阿富汗称语言为“Farsi”或在塔吉克斯坦称语言为“Persian”可能会在专业场合引起混淆。
破除迷思
迷思 1:“波斯语和阿拉伯语基本是同一种语言。”
事实:波斯语属于印欧语系(与英语、法语和印地语相关),而阿拉伯语属于亚非语系。两者共享一种书写系统并有许多借词,但它们的语法、核心词汇和语音体系根本不同。
误区 2:“波斯文书写系统难以学会。”
事实:波斯字母表共有 32 个字母,书写方向为从右到左。大多数学习者在两到三周内就能读懂基础单词。主要的挑战在于短元音通常不标注,因此需要通过上下文来判断发音——类似于在英语中解读 “read” 的发音。
误区 3:“波斯语语法和阿拉伯语语法一样复杂。”
事实:波斯语没有语法上的性别(甚至连代词也没有性别区分),没有名词格变化,动词变位也相对规则。相比阿拉伯语的词根与词形变化体系,波斯语的语法要容易得多。
误区 4:“Farsi 和 Persian 是不同的语言。”
事实:“Farsi” 是波斯语的本地名称,与 “Persian” 指的是同一种语言,就像 “Deutsch” 和 “German” 是同一个意思一样。“Dari” 和 “Tajik” 是波斯语的区域变体名称,与伊朗的 Farsi 仍然可以互相理解。
独特特征
波斯-阿拉伯字母系统
波斯语使用的是一种经过改良的阿拉伯字母系统,书写方向为从右到左。波斯字母表共有 32 个字母,包括阿拉伯字母表中的 28 个字母,以及为表达阿拉伯语中不存在的音而新增的 4 个字母:
- پ (pe) = /p/
- چ (che) = /tʃ/(如 “church” 中的音)
- ژ (zhe) = /ʒ/(如 “vision” 中的音)
- گ (gaf) = /g/(如 “go” 中的音)
短元音(a, e, o)通常不会在标准文本中标注,因此学习者需要部分依靠上下文来掌握词汇。而长元音(â, i, u)则通过字母表示:ا (alef)、ی (ye) 和 و (vâv)。
在塔吉克斯坦,波斯语使用的是苏联时期采用的改良西里尔字母书写系统。因此,同一种语言可以以三种书写系统呈现:波斯-阿拉伯字母(伊朗/阿富汗)、西里尔字母(塔吉克斯坦)以及偶尔用于非正式数字交流的拉丁字母。
无语法性别
波斯语没有语法上的性别区分,这意味着名词、形容词和代词都不需要根据性别变化。这一特性使波斯语的学习比许多其他语言更加简单。
波斯语是少数完全消除了语法性别的印欧语言之一。它没有阳性、阴性或中性之分——无论是在名词、形容词还是代词中都不存在这种区分。第三人称单数代词 او (u) 同时表示“他”和“她”。
对于来自法语、德语或阿拉伯语的学习者来说,这无疑是一种巨大的解脱:你不需要记住桌子是阳性还是书是阴性。
Ezafe 结构
波斯语最具特色的语法特征之一是 ezafe (اضافه),这是一个短促的非重读元音(-e 或 -ye),用于连接名词与其修饰语。它的功能有点类似于英语中的“of”,但用途更加广泛:
- ketâb-e bozorg (کتاب بزرگ) = “大书”(字面意思:“书-的 大”)
- dar-e otâgh (در اتاق) = “房间的门”
- ketâb-e man (کتاب من) = “我的书”(字面意思:“书-的 我”)
Ezafe 在标准书写中并不显示——你需要知道它的存在。这种隐形的连接词对于理解波斯语中名词、形容词和所有者之间的关系至关重要。
SOV 语序
波斯语采用 主语–宾语–动词 (SOV) 的语序,将动词置于句末:
- Man ketâb mikhânam (من کتاب میخوانم) = “我 书 读” → “我读书”
- Ali be madrese raft (علی به مدرسه رفت) = “阿里 到 学校 去了” → “阿里去了学校”
这使得波斯语与日语、韩语、土耳其语和印地语属于同一语序家族。然而,由于上下文线索和宾语标记 râ (را) 的存在,语序具有一定的灵活性。râ 用于标记特指的直接宾语:
- Man ketâb-râ khândam = “我读了那本书”(特指)
- Man ketâb khândam = “我读了一本书”(泛指)
主语省略语言
由于波斯语动词带有明确的主语/数的后缀,主语代词通常会被省略:
miravam (میروم) 我去
miravi (میروی) 你去
miravad (میرود) 他/她去
miravim (میرویم) 我们去
miravid (میروید) 你们去
miravand (میروند) 他们去
这一特性使波斯语在对话中显得简洁高效。
波斯语的历史
波斯语是现存语言中历史记载最悠久的语言之一,其发展经历了三个阶段:
古波斯语 (约公元前 650–300 年)
古波斯语是阿契美尼德帝国的官方语言,使用楔形文字书写,主要通过皇家铭文得以保存,其中最著名的是贝希斯敦铭文(公元前 522 年)——这是由大流士一世下令刻在悬崖上的三语铭文,成为解读楔形文字的关键,就像罗塞塔石碑之于埃及象形文字一样。
古波斯语语法复杂,具有三种语法性别、八种格,以及与吠陀梵语非常相似的动词系统。
中古波斯语 / 帕拉维语 (约公元前 300 年–公元 900 年)
随着阿契美尼德帝国被帕提亚和萨珊王朝取代,古波斯语演变为中古波斯语(帕拉维语)。这一时期语言发生了显著的简化:
- 语法性别完全消失
- 八格系统被简化并最终消失
- 动词变位变得更加规则
- 楔形文字被一种源自阿拉米语的文字取代
中古波斯语是萨珊王朝的官方语言,也是祆教宗教文本(包括《阿维斯陀》的注释)的语言。
现代波斯语 / 新波斯语 (约公元 800 年至今)
在 7 世纪阿拉伯征服波斯后,阿拉伯语成为宗教和行政的主要语言。但波斯语在 9 至 10 世纪重新兴起,此时采用改良的阿拉伯字母书写,并吸收了大量阿拉伯词汇,同时保留了伊朗语系的语法核心。
波斯语是第一个打破阿拉伯语在伊斯兰世界垄断地位的语言。关键的里程碑包括:
- 费尔多西的《沙赫纳梅》(约977–1010年):一部约5万对句的史诗,保存了伊朗的伊斯兰前历史和神话。费尔多西有意减少了阿拉伯语借词的使用,使《沙赫纳梅》成为“纯粹”波斯语的丰碑。
- 鲁米的《玛斯纳维》(13世纪):一部六卷本的神秘主义诗作,有时被称为“波斯语的《古兰经》”,因其精神深度而得名。
- 哈菲兹的《诗集》(14世纪):一部包含抒情诗(ghazal)的诗集,至今仍是伊朗最广泛阅读的诗歌书籍。
波斯语超越了其本土范围,成为一种具有威望的文学和行政语言——曾是奥斯曼帝国、印度的莫卧儿帝国以及中亚汗国的宫廷语言。
词汇层次
波斯语词汇反映了数千年的文化接触:
- 本土伊朗核心词汇:âb(水)、nân(面包)、zan(女人)、mard(男人)、khâne(房子)
- 阿拉伯语借词:宗教、法律和科学词汇——ketâb(书)、elm(科学)、qânun(法律)
- 突厥语影响:军事和行政术语——qushun(军队)、bâzâr(市场)
- 法语借词:19世纪现代化带来的词汇——mersi(谢谢)、etobus(公交车)
- 英语借词:kompyuter(电脑)、internet(互联网)、taksi(出租车)
语法要点
动词系统
波斯语动词由两个词干构成:一个是现在词干,另一个是过去词干。通过将这两个词干与前缀和人称词尾结合,可以生成所有时态:
| 时态 | 构成方式 | raftan (去) | kardan (做) | budan (是) |
|---|---|---|---|---|
| 简单过去时 | 过去词干 + 词尾 | raftam (我去了) | kardam (我做了) | budam (我是/我在) |
| 现在/习惯时 | mi- + 现在词干 + 词尾 | miravam (我去) | mikonam (我做) | hastam (我是/我在) |
| 现在进行时 | dâram + mi- + 现在词干 | dâram miravam (我正在去) | dâram mikonam (我正在做) | — |
| 简单将来时 | khâham + 过去分词 | khâham raft (我将去) | khâham kard (我将做) | khâham bud (我将是/我将在) |
| 现在完成时 | 过去分词 + hast- | rafte-am (我已经去了) | karde-am (我已经做了) | bude-am (我已经是/我已经在) |
这个系统逻辑清晰且规则化——大多数动词都可以预测性地遵循这些模式。
复数形式
波斯语有两个主要的复数后缀:
- -hâ (ها):通用后缀,适用于所有名词 — ketâb-hâ (书们/书籍),mâshin-hâ (车们/汽车)
- -ân (ان):主要用于文学语言中的有生命名词 — mardân (男人们),zanân (女人们)
对于从阿拉伯语借来的词汇,波斯语也使用一些阿拉伯语的不规则复数形式:ketâb → kotob。然而,本土的 -hâ 后缀可以适用于任何名词。
一个与英语的重要区别是:波斯语在数字后不使用复数形式。例如,你说 se ketâb (三本书),而不是 se ketâb-hâ。
介词
波斯语使用介词(而非后置词),它们位于名词之前:
dar khâne (در خانه) 在房子里
be madrese (به مدرسه) 去学校
az Tehrân (از تهران) 从德黑兰
bâ dust-am (با دوستم) 和我的朋友
barâye to (برای تو) 为了你
礼貌与 T–V 区分
与法语类似,波斯语在熟悉和正式的称呼之间有所区分:
- to (تو) = 非正式的“你”(用于朋友、家人、孩子)
- shomâ (شما) = 正式的“您”(用于陌生人、长辈、正式场合)
使用 to 与刚认识的人或长辈交谈被认为是不尊重的行为。默认使用 shomâ,直到对方邀请你使用非正式称呼。
方言与地区变体
伊朗波斯语 (Farsi)
标准语基于德黑兰方言,广泛用于教育、媒体和政府。存在一些地区方言——如伊斯法罕方言、设拉子方言、马什哈德方言——但它们与标准语都可以互相理解。
伊朗波斯语口语的一个显著特点是正式语与日常口语之间的差异。在日常对话中,动词形式会被简化,发音也会发生变化:
- 正式语:mikhâham beravam(我想去) → 口语:mikham beram
- 正式语:nemidânam(我不知道) → 口语:nemidunam
达里语 (阿富汗波斯语)
达里语保留了一些德黑兰波斯语已经失去的特征,例如某些元音的发音。比如,达里语保留了 majhul 元音(ē 和 ō)的区别,而这些元音在伊朗波斯语中已经合并。达里语词汇中包含更多古老的波斯词汇,同时也有来自普什图语和当地语言的借词。
一些具体的差异可以注意到:
- “大学”:伊朗 dâneshgâh vs. 达里 pohantun(来自普什图语)
- “谢谢”:伊朗 mersi(来自法语,非正式) vs. 达里 tashakor(来自阿拉伯语)
- 发音:表示“面包”的词在伊朗是 nun,而在阿富汗是 nân(保留了长元音)
塔吉克语 (塔吉克斯坦波斯语)
塔吉克语使用西里尔字母书写,并受到俄语和乌兹别克语词汇的影响。尽管书写系统不同,口语塔吉克语与波斯语和达里语在很大程度上可以互相理解。
塔吉克语最显著的差异包括:
- 俄语借词取代阿拉伯语/法语词汇:“飞机”在塔吉克语中是 samolyot(来自俄语 самолёт),而在伊朗波斯语中是 havâpeymâ
- “谢谢”:塔吉克语中是 rahmat,而在伊朗是 mersi/mamnun
- 一些元音变化:伊朗波斯语中的 â(如 âb,水)在塔吉克语中通常发音更接近 o(ob)
常见问题(及解决方法)
忘记使用“ezafe”连接词
❌ ketâb bozorg 缺少连接元音 → ✓ ketâb-e bozorg。虽然“ezafe”在书写时不体现,但必须在发音中使用。忽略它会让你的语音听起来断断续续且不自然。
动词位置错误
❌ Man mikhânam ketâb(英语语序)→ ✓ Man ketâb mikhânam。在波斯语中,动词应放在句尾。
过度使用主语代词
波斯语是“主语省略”语言,因此在每句话中都说 man miravam, man mikhânam, man midânam 会显得冗长。当上下文已经明确主语时,应省略代词。
混淆正式和非正式的“你”
对陌生人或长辈使用 to 是不礼貌的。在所有情况下默认使用 shomâ,直到对方邀请你使用非正式表达。
从英语进行直译
波斯语中的“我喜欢”是 dust dâram(字面意思是“我有朋友”)。“你几岁了?”是 chand sâl dâri?(字面意思是“你有多少年?”)。这些结构上的差异需要用波斯语的思维方式来表达。
忽略正式与口语的差异
课本中的波斯语和日常口语可能听起来非常不同。如果你只学习正式形式,可能会在理解日常对话时遇到困难。反之,在书写中只使用口语形式会显得缺乏教育背景。
提示:当你发现自己在用英语语序构造波斯语句子时,停下来并将动词移到句尾。养成这个习惯可以一次性解决大约一半的初学者错误。
AI 翻译与波斯语
波斯语对机器翻译系统提出了几个特定挑战:
- 脚本复杂性: 波斯-阿拉伯字母表由于省略短元音以及字母形式依赖上下文,需要复杂的预处理
- 正式与口语差异: 书面波斯语与口语波斯语差异显著,基于正式文本训练的 AI 系统可能难以处理口语输入
- 阿拉伯借词: 许多阿拉伯词汇同时拥有原始阿拉伯复数形式和波斯复数形式(-hâ),选择正确形式取决于语域
- Ezafe 模糊性: 隐形的 Ezafe 连接词可能会给机器解析带来挑战
- 资源匮乏状态: 尽管有 1.1 亿使用者,波斯语在 NLP 领域的资源相较于英语、中文或西班牙语仍然较少,基准数据集和训练语料库也较为有限
波斯语 NLP 的研究正在不断推进,诸如 ParsiNLU 基准测试和 AbjadNLP 工作坊(于 COLING 2025 举办)等项目正在帮助建立使用阿拉伯衍生脚本语言的评估标准。
OpenL 的波斯语翻译工具 能够应对这些挑战——包括脚本处理、语域识别和 Ezafe 解析——通过上下文感知模型支持波斯语与超过 100 种语言之间的文本、文档和图像翻译。
学习路线图
美国外交服务学院将波斯语归类为英语使用者的 第三类语言,需要大约 1,100 小时的学习时间才能达到专业工作水平——比罗曼语族语言更难,但显著比阿拉伯语、中文或日语容易。
第 1–3 周: 字母与基础生存表达
- 学习波斯语的 32 个字母及字母连接规则
- 练习阅读简单单词,重点掌握长元音
- 记忆 15–20 个基础生存短语(问候语、数字、基本问题)
- 熟悉从右到左的阅读方式
第 1–2 个月:核心语法
- 学习现在时和过去时的动词系统
- 理解 ezafe 结构并练习听辨
- 学习基础介词和语序(主语-宾语-动词)
- 将词汇量提升至 500–800 个单词
第 3–6 个月:建立流利度
- 增加将来时和完成时的学习
- 练习复合动词(波斯语中广泛使用)
- 开始阅读改编文本并收听慢速播客
- 学会区分正式和口语形式
第 6–12 个月:巩固阶段
- 阅读带翻译的波斯诗歌(从鲁米或哈菲兹开始)
- 观看带字幕的伊朗电影,逐渐过渡到无字幕观看
- 练习写作:写日记、消息、短文
- 目标达到 2,000–3,000 个主动词汇量
每日学习计划(40 分钟)
- 10 分钟:练习书写波斯文和复习闪卡(基于句子)
- 10 分钟:听力练习(播客、音乐或新闻片段)
- 10 分钟:语法练习(动词变位、ezafe 练习)
- 10 分钟:口语或写作练习(语言交换、日记)
关键短语
سلام / Salâm — 你好
خداحافظ / Khodâhâfez — 再见
ممنون / Mamnun — 谢谢
لطفاً / Lotfan — 请
بله / Bale — 是
نه / Na — 不是
ببخشید / Bebakhshid — 打扰一下 / 对不起
اسم شما چیه؟ / Esm-e shomâ chiye? — 您叫什么名字?(正式)
اسم من ... است / Esm-e man ... ast — 我的名字是……
فارسی بلد نیستم / Fârsi balad nistam — 我不会说波斯语
انگلیسی صحبت میکنید؟ / Engelisi sohbat mikonid? — 您会说英语吗?
این چنده؟ / In chande? — 这个多少钱?
دستشویی کجاست؟ / Dastshuyi kojâst? — 洗手间在哪里?
کمک! / Komak! — 救命!
خیلی خوب / Kheyli khub — 非常好
خوشحالم / Khoshhâlam — 很高兴认识您(我很高兴)
两段简短对话
- 在餐厅
A: سلام! خوش آمدید. 您好!欢迎光临。
B: سلام، ممنون. منو رو میشه ببینم؟ 您好,谢谢。我可以看一下菜单吗?
A: بفرمایید. 请拿好。
B: یک کباب کوبیده لطفاً. 请来一份烤肉串。
A: نوشیدنی هم میخواهید؟ 您还需要饮料吗?
B: یک دوغ لطفاً. چقدر میشه؟ 请来一杯多乌(咸酸奶)。多少钱?
A: صد و بیست هزار تومان. 一共十二万托曼。
B: بفرمایید. ممنون! 给您,谢谢!
- 问路
A: ببخشید، مترو کجاست؟ 打扰一下,地铁在哪里?
B: مستقیم برید، بعد بپیچید سمت چپ. 一直走,然后左转。
A: دور هست؟ 远吗?
B: نه، پنج دقیقه پیاده. 不远,步行五分钟。
A: خیلی ممنون! 非常感谢!
B: خواهش میکنم! 不客气!
波斯语的诗意之心
没有波斯语的非凡文学传统,任何波斯语指南都不算完整。波斯诗歌并非历史遗迹,而是日常生活中鲜活的一部分。伊朗人会在餐桌上引用哈菲兹的诗句,用他的《诗集》(Divan)占卜(fâl-e Hafez),在婚礼上吟诵鲁米的诗篇。
每位学习者都应该了解的主要诗人:
- 费尔多西 (940–1020):《列王纪》(Shahnameh)的作者,这部作品包含约五万对句,是由单一作者创作的最长诗篇。费尔多西保存了伊朗的伊斯兰前神话,并刻意避免使用阿拉伯语借词。
- 鲁米 (1207–1273):苏菲派神秘主义诗人,其作品《玛斯纳维》(Masnavi)探讨了神圣之爱与灵性渴望。他出生于今日的阿富汗,后居住在科尼亚(今土耳其),至今仍是全球最畅销的诗人之一。
- 哈菲兹 (1315–1390):加扎勒诗体的大师,他的诗集几乎在每个伊朗家庭中都能找到。歌德曾以哈菲兹为灵感创作了《东西集》(West-östlicher Divan)。
- 萨迪 (1210–1291):《果园》(Golestan)和《蔷薇园》(Bustan)的作者,他的名言“人类皆为一体”被刻在联合国总部入口处。
- 奥马尔·海亚姆 (1048–1131):数学家、天文学家和诗人,他的《鲁拜集》(Rubáiyát)由爱德华·菲茨杰拉德翻译后,在维多利亚时代的英国引起轰动。
提示:可以从鲁米的短篇加扎勒诗或萨迪在《果园》中的散文寓言开始——这两者都有广泛可用的双语版本。每天读几行,不仅能提升词汇量,还能学到让母语者立刻感到亲切的表达。
结论
学习波斯语会让你的好奇心得到回报。它的语法比大多数学习者预期的要简单——没有语法性别、没有名词格变化、动词形式规则——而它的文学遗产却是世界上最深厚的之一。波斯语的书写系统只需几周即可掌握,之后你便能接触到从波斯波利斯的楔形文字铭文到现代德黑兰的整个文明。
从字母表开始,学习 ezafe 结构和主语-宾语-动词(SOV)的语序,从双词干系统中积累动词词汇,让诗歌引领你深入探索。波斯语作为外交、科学和艺术的语言已有两千多年的历史——这一传统仍在延续。


