威尔士语:不屈于消亡的不列颠凯尔特语言
目录
1536年,亨利八世下令禁止威尔士语在法庭和政府中使用。四个世纪后,威尔士语成为威尔士的官方语言——如今,威尔士政府的目标是到2050年实现一百万威尔士语使用者。
什么是威尔士语?
威尔士语(Cymraeg)是一种凯尔特语,属于岛屿凯尔特语系中的布立吞语支(或称布立吞尼克语支)。它直接继承自古布立吞语,这是盎格鲁-撒克逊人到来前在不列颠岛广泛使用的语言。
威尔士语属于P-凯尔特语分支,得名于原始凯尔特语中的 kw 音变为 p。这是岛屿凯尔特语两大分支的主要分界线:
| 特征 | 布立吞语支(P-凯尔特语) | 盖尔语支(Q-凯尔特语) |
|---|---|---|
| 关键音变 | kw → p | kw → k/c |
| “头” | pen | 爱尔兰语 ceann |
| “儿子” | mab(古形 map) | 爱尔兰语 mac |
| “四” | pedwar | 爱尔兰语 ceathair |
| 现存语言 | 威尔士语、康沃尔语、布列塔尼语 | 爱尔兰语、苏格兰盖尔语、曼岛语 |
威尔士语现存最接近的亲属是康沃尔语(20世纪复兴)和布列塔尼语(在法国布列塔尼地区使用)。在所有凯尔特语言中,威尔士语的生存状况最为健康——它是唯一未被联合国教科文组织列为濒危语言的凯尔特语。
威尔士语在哪里使用?
威尔士语主要在威尔士(Cymru)使用,根据《Welsh Language (Wales) Measure 2011》,它与英语同享官方语言地位。
有多少人会说威尔士语?
这个数字取决于你参考的数据来源:
| 来源 | 估算使用者人数 | 占威尔士(3岁及以上)比例 |
|---|---|---|
| 2021年人口普查 | 约538,300 | 约17.8% |
| 年度人口调查(截至2025年9月) | 约828,500 | 约26.9% |
| 威尔士政府估算 | 约700,000 | 约23% |
人口普查采用简单的自我评估方式(“你会说威尔士语吗?”),因此得出的数字较低。年度人口调查(Annual Population Survey)使用不同的抽样方法,并反映了更广泛的“能力”定义。然而,由于样本数量持续减少,英国统计监管办公室(UK Office for Statistics Regulation)已暂时撤销APS威尔士语统计数据的认证,因此人口普查数据被认为更具权威性。威尔士政府使用人口普查数据来跟踪其目标的进展。
在威尔士语使用者中,大约**431,700人(14%)**每天都在使用威尔士语。
威尔士语使用者最集中的地区是威尔士西北部的传统核心地带——格温内斯(Gwynedd,73.4%)和安格尔西(Anglesey,61.8%)。
Y Wladfa:巴塔哥尼亚的威尔士语
令人惊讶的是,在阿根廷巴塔哥尼亚的丘布特省(Chubut Province),距离威尔士7,500英里,存在一个威尔士语社区。1865年,153名威尔士移民乘坐茶叶快船Mimosa抵达,寻求建立一个“威尔士之外的小威尔士”,摆脱英格兰文化的主导。
如今,该地区约有50,000–70,000名威尔士裔居民,其中估计有1,500–5,000人会说威尔士语——但几乎所有人都是作为第二语言使用。该社区设有三所威尔士语-西班牙语双语小学,每年举办Eisteddfodau(威尔士文化节),自1990年代复兴运动以来,学习威尔士语的兴趣不断增长。
在英格兰(尤其是边境地区)、美国、加拿大和澳大利亚也有威尔士语侨民社区。
生存传奇:威尔士语的历史
威尔士语的故事,是在极其艰难的环境下坚持不懈的传奇。
古不列颠语大约在公元前600年作为一种独立的凯尔特语言出现,曾广泛分布于如今的英格兰、威尔士和苏格兰南部。在罗马统治时期(公元43年至410年),由于不列颠人与罗马士兵及商人的直接接触,古不列颠语吸收了大约800个拉丁语借词——比如 ffenestr(窗户,源自拉丁语 fenestra)和 pont(桥,源自拉丁语 pons),这些词至今仍在使用。
随着罗马人撤离,盎格鲁-撒克逊人的迁徙将不列颠语使用者逐步推向威尔士、康沃尔和坎布里亚的高地——正是这场盎格鲁-撒克逊入侵,最终催生了古英语。到大约公元550年,学者Kenneth H. Jackson指出,标志着原始威尔士语诞生的主要语音变化已经完成。
古威尔士语(约公元800–1150年)主要以注释、铭文以及最早的吟游诗人Cynfeirdd(如Aneirin和Taliesin)的诗歌形式留存下来。现存最古老的威尔士语书写实例之一是Juvencus密码诗,这是一份9世纪手稿的边注。

中古威尔士语(12至14世纪)为我们留下了马比诺吉昂手稿,这是一部著名的中世纪威尔士故事集,以及威尔士法律文献。
历史的转折点出现在1536年,当时亨利八世颁布的联合法案正式将威尔士并入英格兰,并禁止在法庭和公职中使用威尔士语。威尔士语因此被视为下层阶级的语言,贵族阶层迅速英格兰化。
随后,威尔士语得以存续的最关键事件发生了:威廉·摩根于1588年翻译的威尔士语圣经。这部译作确立了威尔士语的文学标准,并在18世纪卫理公会复兴时期,催生了一批巡回学校,让普通民众学会阅读威尔士语。19世纪初,威尔士约有80%的人口以威尔士语为母语。
工业革命期间,大量讲英语的工人涌入南威尔士,到1901年,威尔士语使用者已降至人口的50%。20世纪,这一比例加速下滑,到1980年代初,威尔士语使用者跌至约**39.5万人(约14%)**的历史低点。
随后,威尔士语复兴运动展开。1967年威尔士语言法案首次赋予威尔士语有限的法律地位。1982年,威尔士语电视台S4C开播。1993年威尔士语言法案使威尔士语和英语在公共生活中享有同等地位,2011年法案则赋予威尔士语官方语言地位。
如今,威尔士政府提出了Cymraeg 2050战略,目标是到2050年实现100万威尔士语使用者和20%日常使用率,并通过扩大威尔士语教育和更新技术战略来推动实现。

威尔士语还处于风险中吗?
目前,联合国教科文组织并未将威尔士语列为濒危语言——这是所有凯尔特语中独一无二的地位。然而,担忧依然存在。年度人口调查显示,2025年威尔士语使用者比例略有下降,且自2019年以来,3至15岁能说威尔士语的儿童人数也在缓慢减少。2026年3月,《卫报》报道称,要实现2050年目标,教育、社区使用和技术领域都需要一场“威尔士革命”。威尔士语目前安全,但成果依然脆弱——这种状况对其他小型但坚韧的欧洲语言(如冰岛语)来说并不陌生。
北威尔士与南威尔士:方言分界
威尔士方言传统上分为北威尔士语(Gog,源自gogledd“北方”)和南威尔士语(Hwntw),不过语言学家实际上识别出了多达五种不同的地区变体。两者差异之大,以至于学习者(甚至母语者)有时也会因此犯错。
主要词汇差异
| 英语 | 北威尔士 | 南威尔士 |
|---|---|---|
| 牛奶 | llefrith | llaeth |
| 钱 | pres | arian |
| 现在 | rŵan | nawr |
| 想要 | isio / isho | moyn |
| 男孩 | hogyn | bachgen / crwt |
| 女孩 | hogan | merch |
| 祖母 | nain | mam-gu |
| 祖父 | taid | tad-cu |
| 蛋糕 | cacen | teisen |
| 外面 | allan | mas |
| 钥匙 | agoriad | allwedd |
| 哭泣 | crio / wylo | llefain |
| 狐狸 | llwynog | cadno |
要注意“假朋友”:llaeth在南威尔士表示“牛奶”,但在北威尔士却指“酪乳”——这在早餐桌上常常引发混淆。
语法上也有差异。“我有……”在北方用Mae gen i…,而南方则说Mae … ‘da fi。北方表达过去时更倾向于使用助动结构(Mi wnes i ddweud——“我确实说了”),而南方则偏好动词词尾变化(Mi ddwedes i)。
方言分界线大致沿着中威尔士的阿贝里斯特威斯和马亨莱斯之间,但这是一条模糊的连续带,而非泾渭分明的界限。对于流利的使用者来说,两种方言是可以互相理解的。
威尔士语书写系统
威尔士语采用拉丁字母书写,自公元6世纪最早的书面记录起便是如此。它是欧洲最拼音透明的书写系统之一——拼写与发音高度一致,几乎可以直接预测。
29个字母的字母表
现代威尔士字母表共有29个字母,其中包括8个双字母(即两个字符组合,被视为单一字母用于字母排序):
| 字母 | 字母 | 字母 |
|---|---|---|
| a | ng | ph |
| b | h | r |
| c | i | rh |
| ch | j | s |
| d | l | t |
| dd | ll | th |
| e | m | u |
| f | n | w |
| ff | o | y |
| g | p |
复合字母 ch、dd、ff、ng、ll、ph、rh、th 在排序时都被视为单一字母。例如,Llanelli 在威尔士语中只有 6 个字母,而不是 8 个。
为什么没有 K、Q、V、X 或 Z?
字母 k 在 16 世纪被威尔士语淘汰,原因非常实用:英格兰印刷威尔士语圣经的印刷工没有足够的 k 字母模具。翻译者 William Salesbury 写道:“C 代替 K,因为印刷工没有威尔士语所需的那么多 K。”
字母 q、v、x 和 z 也不是传统字母表的一部分,不过 j 最近才被引入,用于外来词,比如 garej(车库)和 ffrij(冰箱)。
大写规则
当以复合字母开头的单词需要大写时,只大写第一个字母:Llandudno(而不是 LLandudno)。只有在全大写文本中,两个字母才都大写:LLANDUDNO。
重音符号
威尔士语使用四种重音符号:
- 抑扬符(ˆ) — 标记长元音:â, ê, î, ô, û, ŵ, ŷ
- 重音符(`) — 标记意外短元音:pàs(通行证)与 pas(咳嗽)
- 尖音符(´) — 标记重读的词尾音节:gwacáu(清空)
- 分音符(¨) — 表示两个相邻元音要分别发音:copïo(复制)
现代正字法于 1928 年由 Sir John Morris-Jones 主持的委员会制定,并在 1987 年进一步完善。

著名的辅音变音
辅音变音是所有现代凯尔特语的标志性特征,而威尔士语的系统尤为丰富。单词的首辅音会根据语法环境发生变化,这些变化会在拼写中体现出来。
威尔士语有三种主要的音变:
1. 软音变(Treiglad Meddal)
这是最常见的音变。清塞音变为浊塞音;浊塞音变为擦音(或消失):
| 原始音 | → 软音变 | 例子 |
|---|---|---|
| p | b | pen → ei ben(他的头) |
| t | d | tŷ → ei dŷ(他的房子) |
| c | g | cath → ei gath(他的猫) |
| b | f | brawd → ei frawd(他的兄弟) |
| d | dd | dŵr → ei ddŵr(他的水) |
| g | 消失 | gardd → yr ardd(花园) |
| m | f | mam → ei fam(他的母亲) |
| ll | l | llaw → ei law(他的手) |
| rh | r | rhywbeth → ei rywbeth(他的某物) |
软音变通常出现在阴性单数名词在定冠词之后、某些介词之后、dy(“你的”)和ei(“他的”)之后、数字二(dau/dwy)之后,以及动词变位后宾语上。
2. 鼻音变(Treiglad Trwynol)
浊塞音变为鼻音;清塞音变为清鼻音:
| 原始音 | → 鼻音变 | 例子 |
|---|---|---|
| p | mh | pen → fy mhen(我的头) |
| t | nh | tŷ → fy nhŷ(我的房子) |
| c | ngh | cath → fy nghath(我的猫) |
| b | m | brawd → fy mrawd(我的兄弟) |
| d | n | dŵr → fy nŵr(我的水) |
| g | ng | gardd → fy ngardd(我的花园) |
鼻音变通常出现在fy(“我的”)之后,以及介词yn表示“在”时之后。
3. 送气音变(Treiglad Llaes)
在口语中使用最少。清塞音变为擦音(拼写上加h):
| 原始音 | → 送气音变 | 例子 |
|---|---|---|
| p | ph | pen → ei phen(她的头) |
| t | th | tŷ → ei thŷ(她的房子) |
| c | ch | cath → ei chath(她的猫) |
送气变音会在 ei(“她的”)、a(“和”)、â(“与”)以及 tri(“三”——阳性)之后触发。
威尔士语为什么要改变单词的首字母?
以单词 carreg(“石头”)为例,可以看到三种变音的实际应用:
- y garreg — “这块石头”(软变音,出现在带定冠词的阴性名词后)
- fy ngharreg — “我的石头”(鼻音变音,出现在 fy 之后)
- ei charreg — “她的石头”(送气变音,出现在 ei 之后)
变音并非随意发生——它们承载着语法意义。变音可以标记性别、所属关系、介词以及句法关系。一旦你能识别它们,就会发现它们无处不在,包括在威尔士地名中:Llanfair = llan(“教堂”)+ Mair(“玛丽”,由 Mair 软变音而来),Pontardawe = pont ar Dawe(“在塔威河上的桥”)。
要点总结: 变音一开始让人觉得陌生,但其实有规律可循。大多数学习者在接触大约两周后就会“开窍”——诀窍是通过语境学习,而不是死记表格。
更多语法上的惊喜
除了最引人注目的变音之外,威尔士语还有一些在欧洲语言中颇为独特的特征。这些特征虽然不那么有名,但同样鲜明。
VSO 语序
威尔士语采用动词–主语–宾语(VSO)语序,这在欧洲语言中非常罕见(英语和大多数罗曼语族语言采用 SVO 语序)——这是它与其他凯尔特语言共有的特征,在欧洲其他语言中极为少见,尽管巴斯克语也有自己完全不同的语法奇观:
- Gwelodd Mair ddraig —— 字面意思:“看见 玛丽 一条龙”=“玛丽看见了一条龙”。
疑问句通过在动词前加上特殊的小品词 a 来构成,而在口语中,助动结构(Mae…yn…)比动词变位更为常见。
没有不定冠词
威尔士语中没有“a”或“an”这样的词。单词 cath 可以根据语境表示“猫”或“一只猫”。同样也没有复数的不定冠词。对于英语或罗曼语系的使用者来说,这需要适应。
集体/单体数系统
这是威尔士语最优雅的特征之一。对于许多天生成群出现的事物名词,复数形式是基础,而通过添加后缀来表示单数:
| 集体数(类似复数的基础形式) | 单体数 |
|---|---|
| plant — 儿童 | plentyn — 一个孩子 |
| coed — 树/森林 | coeden — 一棵树 |
| adar — 鸟 | aderyn — 一只鸟 |
| ser — 星星 | seren — 一颗星星 |
| moch — 猪 | mochyn — 一头猪 |
| gwenyn — 蜜蜂 | gwenynen — 一只蜜蜂 |
这与英语的概念正好相反,英语中单数(tree)是基础形式,通过添加 -s 构成复数(trees)。
变位介词
威尔士语的介词会根据人称和数进行变位——这种特征在凯尔特语和闪米特语中常见,但在欧洲其他语言中较为罕见:
| 人称 | ar(“在……上”) | i(“到/给”) | gan(“和/由”) |
|---|---|---|---|
| 第一人称单数(我) | arna i | i mi / i fi | gen i |
| 第二人称单数(你) | arnat ti | i ti | gen ti |
| 第三人称单数阳性(他) | arno fe / fo | iddo fe / fo | ganddo fe / fo |
| 第三人称单数阴性(她) | arni hi | iddi hi | ganddi hi |
| 第一人称复数(我们) | arnon ni | i ni | gynnon ni |
| 第二人称复数(你们) | arnoch chi | i chi | gynnoch chi |
| 第三人称复数(他们/她们) | arnyn nhw | iddyn nhw | ganddyn nhw |
表语 yn
威尔士语在表语(“是”后面的形容词或名词)前要加一个特殊的小品词 yn:
- Mae hi’n dda — “她很好”(字面意思:“是 她 PRED 好”)
这个 yn 与表示“在……里面”的介词 yn 完全不同,后者会引发鼻音变音。
没有单独的“是”或“不是”一词
威尔士语中没有直接对应的“yes”(是)或“no”(否)。相反,你需要用问题中的动词以适当的形式来回答:
- Wyt ti’n hapus?(“你开心吗?”)→ Ydw(“我开心”)或 Nac ydw(“我不开心”)
- Oes cath gyda ti?(“你有猫吗?”)→ Oes(“有”)或 Nac oes(“没有”)
对于英语母语者来说,这种回答方式很难习惯——但其实非常合乎逻辑。
威尔士语的独特发音
威尔士语的语音系统中包含了几种英语中没有的音:
| 音 | 描述 | 示例 |
|---|---|---|
| ll /ɬ/ | 清擦边音——舌头摆在发“l”的位置,从舌两侧送气 | Llanelli |
| ch /χ/ | 清小舌擦音,类似苏格兰英语“loch”中的“ch” | chwaer(姐妹) |
| rh /r̥/ | 清颤音,带气的“hr”音 | rhywbeth(某物) |
| dd /ð/ | 浊“th”,如英语“these”中的“th” | dda(好的,软变音) |
| th /θ/ | 清“th”,如英语“thin”中的“th” | byth(曾经/从不) |
| f /v/ | 类似英语中的“v”(不是“f”) | fawr(大的,软变音) |
| ff /f/ | 类似英语中的“f” | coffi(咖啡) |
W 和 Y 作为元音
在威尔士语中,w 和 y 都是完整的元音:
- w 代表 /ʊ/(如英语“book”中的“u”)或 /uː/(如“pool”中的“oo”):cwrw(啤酒)= “koo-roo”
- y 有两种发音:一种是“清晰”音 /ɨ, iː/(类似“machine”中的“i”),另一种是“模糊”音 /ə/(类似“about”中的“a”)
加上这两种元音,威尔士语一共有7个元音:a、e、i、o、u、w、y。
重音与 h-前置
威尔士语的重音几乎总是落在倒数第二个音节,这也赋予了威尔士语独特的节奏感。在某些物主代词后,元音开头的词会加上h:oedran(“年龄”)变为 ei hoedran hi(“她的年龄”),在 ein(“我们的”)和 eu(“他们的”)后也会出现。这种现象称为h-前置(h-prothesis)。
词汇:拉丁根源与英语邻居
威尔士语词汇展现了这门语言深厚的历史积淀。
凯尔特语核心词汇:像 afon(河流)、dyn(男人)、haul(太阳)、drws(门)这样的词,都是源远流长的本土凯尔特词汇。
拉丁语层(约800词):与英语主要通过诺曼法语或学术借用引入拉丁词不同,威尔士语是在罗马占领时期通过日常接触直接吸收了拉丁语。结果是许多词汇都非常日常:
| 威尔士语 | 拉丁语 | 含义 |
|---|---|---|
| ffenestr | fenestra | 窗户 |
| pont | pons | 桥 |
| mur | murus | 墙 |
| pobl | populus | 人民 |
| barf | barba | 胡子 |
| ysgrifennu | scribere | 写 |
| tafarn | taverna | 酒馆 |
| bresych | brassica | 卷心菜 |
英语和法语借词:中世纪贸易带来了 cwpan(杯子)、sidan(丝绸)和 bwrdd(桌子/板)。诺曼法语则贡献了 cwarel(窗格)、marchnad(市场)和 barwn(男爵)。现代借词包括 ffôn(电话)、garej(车库)和 ffrij(冰箱)。
尽管有大量借词,威尔士语依然倾向于用本土词根创造新词。例如 cyfrifiadur(计算机),由 cyfrif(“计数”)加上表示施事者的后缀构成,是一个完全威尔士语的意译新词。
常用威尔士语短语
| 威尔士语 | 英语 | 近似发音 |
|---|---|---|
| Helô / Hylô | 你好 | ”hell-oh / hill-oh” |
| Shwmae / S’mae | 嗨 / 你好吗?(非正式) | “shoo-my” |
| Bore da | 早安 | ”boh-reh dah” |
| Prynhawn da | 下午好 | ”prin-hown dah” |
| Noswaith dda | 晚上好 | ”noss-why-th thah” |
| Nos da | 晚安 | ”nohs dah” |
| Croeso | 欢迎 / 不客气 | ”croy-so” |
| Os gwelwch yn dda | 请 | ”os gwel-ookh un tha” |
| Diolch | 谢谢 | ”dee-olch” |
| Diolch yn fawr | 非常感谢 | ”dee-olch un vow-er” |
| Hwyl fawr | 再见 | ”hoo-eel vow-er” |
| Iechyd da | 干杯!(祝酒用语) | “yeah-chid dah” |
| Sut wyt ti? | 你好吗?(非正式) | “sit oyt tee” |
| Da iawn, diolch | 很好,谢谢 | ”da-yow-un dee-olch” |
| Cwtch | 拥抱 / 依偎 | ”kutch” |
| Cariad | 爱 / 亲爱的 | ”carry-ad” |
威尔士语怎么说“你好”?
最常用的日常问候语是 Shwmae(发音类似“shoo-my”),它是 Sut mae?(“怎么样?”)的缩写。Helô 也可以用,但更像是从英语借用过来的表达。在正式场合或早晨,通常用 Bore da(“早安”)。中午过后可以说 Prynhawn da,晚上则用 Noswaith dda。

威尔士语难学吗?
威尔士语没有被美国外交服务学院(U.S. Foreign Service Institute)正式评级,但普遍认为属于第三类语言——大约需要1,100课时才能流利掌握,难度大致与爱尔兰语、印地语或俄语相当。这意味着它比罗曼语族语言难,但比阿拉伯语、日语或普通话要容易得多。
威尔士语的难点
| 挑战 | 难度 |
|---|---|
| 辅音变换 — 单词的首字母会根据语境发生变化 | 高(大约两周后规律会明朗) |
| VSO语序 — 动词先行,然后主语,最后宾语 | 中等 |
| 不熟悉的发音 — ll、ch、rh | 中等(多练习即可掌握) |
| 方言差异 — 北部和南部几乎像两种语言 | 中等 |
| 没有“是/否”直接回答 | 低至中等 |
威尔士语比你想象的更容易的原因
- 拼写与发音高度一致 — 威尔士语几乎是百分百按发音拼写。看到什么就读什么,没有像英语 through、though、tough 那样的无声字母或混乱。
- 约20%的词汇与其他语言共享 — 通过拉丁语和法语同源词(如 ffenestr / fenêtre / “fenestration”,nos / “nocturnal”)。
- 现代口语中没有名词性别 — 不像法语、德语或西班牙语那样复杂。
- 丰富的免费资源 — Duolingo、BBC Bitesize、SaySomethingInWelsh、S4C电视台。
我可以在 Duolingo 上学威尔士语吗?
可以。Duolingo 提供完整的威尔士语课程,内容约 150小时,足以达到基础会话水平。不过,大多数认真的学习者会搭配其他资源一起使用——仅靠 Duolingo 很难学会自然地说威尔士语,尤其是辅音变换和方言选择方面。
现实的学习进度
| 水平 | 时间 |
|---|---|
| A1(基础短语和问候) | 1–2个月 |
| A2(简单对话) | 3–6个月 |
| 日常会话 | 6–12个月持续学习 |
| 流利 | 总计约1,100小时 |
学习威尔士语的建议
-
从 SaySomethingInWelsh 开始 — 这种以音频为主的方法广受好评,比应用类学习更快建立口语自信。它在语境中训练辅音变换,而不是抽象规则。
-
每天使用 Duolingo — 每天15–20分钟可以积累词汇和阅读能力。游戏化的学习方式有助于养成习惯。
-
观看 S4C Clic — 这是威尔士语广播机构提供的免费流媒体服务。可以先从儿童节目入手(Cyw 适合年龄较小的学习者,Stwnsh 适合稍大一些的孩子)——这些节目使用的威尔士语更简单,并且配有字幕。
-
收听 Radio Cymru — 即使只是作为背景音,也能帮助你熟悉威尔士语的节奏和语调。可以尝试收听 Pigion 精选播客。
-
选择一个方言并坚持下去 — 北部或南部方言,选择哪一个其实并不重要,关键是要保持一致。学习过程中频繁切换方言会让人困惑。
-
通过歌曲和地名学习变音 — 威尔士民谣(如 Calan、9Bach)以及地名词源能让变音规则更容易记住。比如 Pont-y-pŵl(“池塘之桥”)比语法表更有趣也更容易理解。
-
找到一个会说威尔士语的伙伴 — 威尔士语社区以对学习者友好著称。可以通过 Tandem 等应用,或当地的 Sadwrn Siarad(“周六会话”)活动,结识耐心的母语者。
威尔士语与人工智能翻译
威尔士语对机器翻译系统来说有独特的挑战。
数据难题。 在自然语言处理领域,威尔士语被归类为低资源语言。有研究发现,威尔士语在某大型语言模型的训练数据中仅占 0.00177%。由于版权限制,大量威尔士语材料无法用于训练,因此基础模型对威尔士语的理解远不及法语或德语等语言。
变音难题。 首字母辅音变音导致同一个词可以有多种表面形式(如 Cymru、Gymru、Nghymru、Chymru)。主要以大语种为训练对象的机器翻译系统对此难以应对。Cardiff University 2026 年的一项研究发现,基于语言学规则的系统在变音分析任务上实际上优于 GPT-4o-Mini 和 Claude-4-Sonnet。
方言问题。 大多数威尔士语机器翻译系统输出的是“标准化”文本,这种做法抹平了丰富的南北方言差异,母语者对此一眼就能察觉。
进展正在发生。 2026年1月,DeepL 将威尔士语加入其语言AI平台,首次为威尔士语带来了企业级神经机器翻译。英国政府的 Sovereign AI 计划以 NVIDIA Nemotron 模型为基础,并在 Isambard-AI 超级计算机上训练,将威尔士语列为重点支持语言。班戈大学的 Canolfan Bedwyr 在开发威尔士语自然语言处理工具方面发挥了关键作用,从变音处理到 Welsh Natural Language Toolkit 的推出都离不开他们的努力。
在日常威尔士语翻译需求方面,OpenL 支持威尔士语及100多种其他语言。它的上下文感知神经引擎对威尔士语尤其适用,因为它能整体处理句子,而不是逐词翻译——这对于动词-主语-宾语结构的威尔士语尤为重要,因为句首动词和变音会根据语法环境改变词形。OpenL 支持威尔士语与英语之间的文本、文档和图片翻译,非常适合学习者阅读威尔士语材料、旅行者识别双语标识,或任何需要快速翻译威尔士语内容的人士。
威尔士语机器翻译与英语机器翻译之间的质量差距确实存在——但随着对威尔士语技术投入的加速,这一差距正迅速缩小,步伐与 Cymraeg 2050 目标保持一致。
参考资料
- 威尔士语 — Britannica — 分类、历史及语法概述
- 威尔士语历史 — Wikipedia — 从古布立吞语到现今的完整时间线
- Cymraeg 2050:威尔士语战略行动计划 2026 至 2027 — GOV.WALES — 官方战略文件,包含说话者目标
- 要实现到 2050 年拥有 100 万威尔士语使用者需“革命” — The Guardian — 2026 年 3 月关于 Cymraeg 2050 进展的报道
- 年度人口调查显示威尔士语使用者数量下降 — Nation.Cymru — 最新使用者统计数据
- 威尔士语正字法 — Wikipedia — 字母表、双字母、变音符号及标准化历史
- 口语威尔士语形态学 — Wikipedia — 变音、屈折介词及语法特征
- 巴塔哥尼亚威尔士语 — Wikipedia — Y Wladfa 殖民地历史及现状
- 威尔士语变音触发的无监督标注 — Gutiérrez-Rolón & Alva-Manchego (2026) — LREC 2026 关于计算变音分析的论文
- DeepL将在其语言AI平台上线威尔士语 — UK Tech News — 2026年1月 DeepL 威尔士语上线
- 跨越群岛:UK-LLM为英国语言带来AI — Bangor University / NVIDIA — 英国主权AI计划,包含威尔士语模型
- AI:需更多威尔士语数据提升准确率 — BBC News — 威尔士语自然语言处理的数据稀缺挑战
- 基础威尔士语短语 — Hoseasons — 常用短语及发音指南
- 北威尔士语与南威尔士语词汇对比 — WalesOnline — 方言词汇比较
- 拉丁语如何在威尔士语中延续 — The New World — 拉丁借词词源


