ทมิฬ: หนึ่งในภาษาที่เก่าแก่ที่สุดในโลกที่ยังมีชีวิต
TABLE OF CONTENTS
ภาษาที่มีบทกวีอายุ 2,000 ปี ซึ่งนักวิชาการและผู้อ่านที่ได้รับการฝึกฝนยังคงเข้าถึงได้ในรูปแบบดั้งเดิม — และรูปแบบการเขียนที่แตกต่างจากภาษาพูดอย่างมากจนเด็กชาวทมิฬต้องเรียนรู้ราวกับเป็นภาษาที่สองอีกภาษา
การจัดจำแนก
ทมิฬ (தமிழ், tamiḻ) เป็นสมาชิกของ ตระกูลภาษาดราวิเดียน — ตระกูลภาษาที่มีประมาณ 26 ภาษา ซึ่งเป็นภาษาพื้นเมืองของอนุทวีปอินเดีย และไม่มีความเกี่ยวข้องใด ๆ กับตระกูลภาษาอินโด-ยูโรเปียน (เช่น ฮินดี สันสกฤต อังกฤษ) ที่ล้อมรอบอยู่ในเชิงภูมิศาสตร์ ภายในตระกูลนี้ ทมิฬอยู่ในสาขา ดราวิเดียนใต้ ร่วมกับภาษาญาติใกล้ชิดที่สุดคือ Malayalam รวมถึงกันนาดา โทดา โกตา โกดาวา และบาดากา
ทมิฬและมลยาฬัมมีบรรพบุรุษร่วมกัน และเพิ่งแยกออกเป็นภาษาที่แตกต่างกันอย่างสมบูรณ์ในช่วงต้นยุคกลาง — การแยกตัวเริ่มขึ้นตั้งแต่ศตวรรษที่ 9 หลังคริสตกาล โดยที่มลยาฬัมยังไม่ถือว่าเป็นภาษาที่แยกออกมาโดยสมบูรณ์จนถึงศตวรรษที่ 13–14 (Britannica: Tamil language)
การศึกษาทางวิวัฒนาการแบบ Bayesian โดย Kolipakam et al. (2018) ที่ตีพิมพ์ใน Royal Society Open Science ประเมินว่าตระกูลภาษาดราวิเดียนมีอายุประมาณ 4,500 ปี (Royal Society Open Science) ต้นกำเนิดทางภูมิศาสตร์ของภาษาบรรพบุรุษยังคงเป็นที่ถกเถียงกันอยู่ โดยมีข้อเสนอทั้งจากอินเดียตอนใต้ไปจนถึงภูมิภาคลุ่มแม่น้ำสินธุ
เหตุผลที่การจัดจำแนกของทมิฬมีความสำคัญ: ทมิฬมี ประเพณีวรรณกรรมที่ต่อเนื่องยาวนานที่สุดในบรรดาภาษาที่ไม่ใช่อินโด-อารยันในอินเดีย — ข้อเท็จจริงนี้ได้หล่อหลอมอัตลักษณ์ วรรณกรรม และบทบาททางการเมืองสมัยใหม่ของทมิฬมายาวนานกว่าสองพันปี
พื้นที่ที่ใช้ภาษาทมิฬ
ภาษาทมิฬมีผู้พูดเป็นภาษาแม่ระหว่าง 75 ถึง 90 ล้านคน ทั่วโลก (Worlddata: Tamil) ทำให้เป็นภาษาที่มีผู้พูดมากเป็นอันดับประมาณที่ 17 ของโลก ทมิฬมีสถานะเป็นภาษาราชการใน 3 ประเทศเอกราช (อินเดีย ศรีลังกา สิงคโปร์) รวมถึงรัฐทมิฬนาฑูและดินแดนสหภาพปูดูเชอร์รีในอินเดีย
| ภูมิภาค | จำนวนผู้พูด (โดยประมาณ) | สถานะทางการ |
|---|---|---|
| ทมิฬนาฑู (อินเดีย) | ~70 ล้าน | ภาษาราชการของรัฐ |
| ปูดูเชอร์รี (อินเดีย) | ~1 ล้าน | ภาษาราชการของดินแดนสหภาพ |
| ศรีลังกา | ~3.5–4 ล้าน (ทมิฬเป็นภาษาแม่ของประชากรราว 15–18%) | ร่วมเป็นภาษาราชการกับสิงหล |
| สิงคโปร์ | ชุมชนทมิฬ ~5% ของประชากร; ~100,000+ ครัวเรือนที่พูดทมิฬ | หนึ่งใน 4 ภาษาราชการ |
| มาเลเซีย | ชุมชนเชื้อสายทมิฬ ~1.8 ล้านคน | ชนกลุ่มน้อยที่ได้รับการรับรอง |
| มอริเชียส | เชื้อสายทมิฬ ~5% ของประชากร; ผู้พูดจริงมีจำนวนน้อยกว่า | ชนกลุ่มน้อยที่ได้รับการรับรอง |
| ชาวทมิฬพลัดถิ่น (แคนาดา สหราชอาณาจักร สหรัฐอเมริกา แอฟริกาใต้ รัฐอ่าว) | รวมกันหลายล้านคน | — |
ทมิฬยังได้รับสถานะพิเศษเป็นหนึ่งใน ภาษาคลาสสิกของอินเดีย (ได้รับการประกาศอย่างเป็นทางการในปี 2004) สะท้อนถึงประเพณีวรรณกรรมที่ต่อเนื่องยาวนานกว่า 2,000 ปี
ทำไมทมิฬจึงเป็นภาษาราชการในศรีลังกา?
สถานะของภาษาทมิฬในศรีลังกาเป็นประเด็นที่มีความอ่อนไหวทางการเมือง พระราชบัญญัติภาษาราชการ พ.ศ. 2499 กำหนดให้ภาษาสิงหลเป็นภาษาราชการเพียงภาษาเดียว นำไปสู่ความตึงเครียดทางชาติพันธุ์ยาวนานหลายทศวรรษ หลังข้อตกลงอินโด-ศรีลังกา การแก้ไขรัฐธรรมนูญครั้งที่ 13 ในปี 1987 ได้รับรองให้ทมิฬเป็นภาษาราชการร่วมกับสิงหล โดยมีภาษาอังกฤษเป็น “ภาษาสื่อกลาง” ผู้พูดทมิฬในศรีลังกา — ทั้งชาวทมิฬศรีลังกา ทมิฬอินเดีย และชาวศรีลังกามัวร์ส่วนใหญ่ — เป็นชนกลุ่มน้อยทางภาษาที่ใหญ่ที่สุดของประเทศ
ทำไมทมิฬจึงเป็นภาษาราชการในสิงคโปร์?
รัฐธรรมนูญของสิงคโปร์กำหนดให้มี 4 ภาษาราชการ ได้แก่ ภาษาอังกฤษ ภาษาจีนกลาง ภาษามลายู และภาษาทมิฬ สะท้อนถึงความหลากหลายทางวัฒนธรรมของประเทศนี้ ชาวทมิฬคิดเป็นประมาณ 5% ของประชากรทั้งหมด และเป็นกลุ่มใหญ่ที่สุดในบรรดาชุมชนชาวอินเดียในสิงคโปร์

ประวัติย่อของภาษาทมิฬ
ประวัติของภาษาทมิฬถือว่าโดดเด่น เพราะว่า ภาษาทมิฬที่เราอ่านกันในปัจจุบัน ยังคงเป็นภาษาเดียวกับที่ใช้เมื่อ 2,000 ปีก่อน ผู้พูดภาษาทมิฬยุคใหม่สามารถอ่านจารึกจากศตวรรษที่ 2 ก่อนคริสตกาลได้ แม้จะต้องใช้ความพยายามบ้าง ซึ่งเป็นความต่อเนื่องที่มีเพียงไม่กี่ภาษาบนโลกนี้เท่านั้นที่ทำได้
นักวิชาการแบ่งประวัติศาสตร์ของภาษาทมิฬออกเป็น 3 ยุคหลัก ได้แก่
- ทมิฬโบราณ (ประมาณ 300 ปีก่อนคริสตกาล – ค.ศ. 700)
- ทมิฬยุคกลาง (ค.ศ. 700 – 1600)
- ทมิฬสมัยใหม่ (ค.ศ. 1600 – ปัจจุบัน)
ยุคสังคม (Sangam) และจารึกแรกสุด
หลักฐานภาษาทมิฬที่เก่าแก่ที่สุดคือ จารึกหลายสิบชิ้นบนผนังถ้ำในเขตมทุไรและติรุเนลเวลีของรัฐทมิฬนาฑู ซึ่งมีอายุราว ศตวรรษที่ 2 ก่อนคริสตกาล Iravatham Mahadevan ได้จัดทำแค็ตตาล็อกมาตรฐานในปี 2003 ที่บันทึกจารึกทมิฬ-พราหมีไว้ประมาณ 89 ชิ้น และในเวลาต่อมาได้มีการค้นพบเพิ่มเติมจนมีจำนวนมากกว่า 110 ชิ้น
ยุคนี้ยังเป็นช่วงที่มีการสร้างสรรค์ วรรณกรรมสังคม (Sangam literature) ซึ่งประกอบด้วยบทกวีมากกว่า 2,000 บท ที่แต่งขึ้นระหว่างประมาณ 300 ปีก่อนคริสตกาลถึง 300 ปีหลังคริสตกาล บทกวีสังคมเหล่านี้บรรยายเรื่องความรัก สงคราม จริยธรรม การปกครอง และชีวิตประจำวันอย่างละเอียดลึกซึ้ง และยังคงเป็นรากฐานสำคัญของอัตลักษณ์วัฒนธรรมทมิฬจนถึงปัจจุบัน
ภาษาทมิฬในฐานะภาษากลางทางการเดินเรือ
ในช่วงยุคกลางตอนต้น ภาษาทมิฬทำหน้าที่เป็น ภาษากลางของการค้าทางทะเลในอินเดียใต้ มีการค้นพบจารึกทมิฬใน อินโดนีเซียและไทย และยังมีเศษภาชนะดินเผาที่มีจารึกทมิฬ-พราหมีถูกค้นพบที่ท่าเรือ Quseir al-Qadim บริเวณทะเลแดงใน อียิปต์ (Wikipedia: Tamil language) ซึ่งเป็นหลักฐานถึงอิทธิพลทางการค้าของจักรวรรดิ Chola และสมาคมพ่อค้าทมิฬ
วิวัฒนาการของอักษร
อักษรทมิฬมีพัฒนาการมาจาก Tamil Brahmi ผ่านหลายช่วงเปลี่ยนผ่านสำคัญ เช่น Vatteluttu (“อักษรกลม”) และ Tamil-Grantha ในยุคกลาง ก่อนจะกลายเป็นรูปแบบที่ใกล้เคียงกับปัจจุบัน การปฏิรูปสองระลอกใน ศตวรรษที่ 19 และ 20 ได้มาตรฐานเครื่องหมายสระ ปรับรูปแบบที่ไม่เป็นระเบียบ และทำให้อักษรนี้ง่ายต่อการจัดพิมพ์มากขึ้น

สำเนียงและปรากฏการณ์ Diglossia อันโด่งดังของทมิฬ
ลักษณะเด่นทางภาษาศาสตร์ที่สุดของทมิฬไม่ใช่คำศัพท์หรืออักษร แต่คือ ช่องว่างขนาดใหญ่ระหว่างรูปแบบที่เขียนกับที่พูด ซึ่งเรียกว่า diglossia (ภาวะสองระดับภาษา)
Senthamil กับ Kodunthamil
ภาษา Tamil มีสองรูปแบบหลักที่ผู้พูดใช้สลับกันตามบริบท:
- Senthamil (செந்தமிழ், “ทมิฬบริสุทธิ์/วรรณกรรม”) — ใช้ในการเขียน, รายการข่าว, คำปราศรัยทางการ, ศาสนา, การศึกษา
- Kodunthamil (கொடுந்தமிழ், “ทมิฬพูด/ภาษาพูด”) — ใช้ในการสนทนาในชีวิตประจำวัน, ภาพยนตร์, โทรทัศน์
ทั้งสองรูปแบบไม่ได้แตกต่างกันแค่ระดับทางการหรือไม่ทางการเท่านั้น แต่ยังต่างกันในด้าน คำศัพท์ ไวยากรณ์ และโครงสร้างคำ ตัวอย่างเช่น คำกริยาทั่วไปอย่าง “กำลังไป” ก็ใช้ต่างกันโดยสิ้นเชิง:
| รูปแบบ | ทมิฬพูด | ทมิฬวรรณกรรม |
|---|---|---|
| ”เขากำลังไป” | avan pōṟāṉ (அவன் போறான்) | avaṉ pōkiṉṟāṉ (அவன் போகின்றான்) |
| “ฉันเป็น/อยู่” | nāṉ irukkēṉ (நான் இருக்கேன்) | nāṉ irukkiṉṟēṉ (நான் இருக்கின்றேன்) |
เด็กทมิฬจะเติบโตมากับทมิฬพูดที่บ้าน และเพิ่งจะได้สัมผัสกับทมิฬวรรณกรรมเมื่อเริ่มเข้าโรงเรียน — ราวกับว่าต้องเรียนรู้ภาษาอีกแบบหนึ่งของตนเอง
ภาษา Tamil มีการแบ่งแยกเชิงสไตล์อย่างชัดเจนมาตั้งแต่ยุคคลาสสิก และภาวะ diglossia ในปัจจุบันก็มีประวัติยาวนานหลายศตวรรษ ถือเป็นหนึ่งในตัวอย่างที่ถูกอ้างถึงมากที่สุดในวรรณกรรมเกี่ยวกับ diglossia หลังจากบทความสำคัญของ Charles Ferguson ในปี 1959 เรื่อง Diglossia
สำเนียงภูมิภาค
นอกเหนือจากความแตกต่างระหว่างภาษาพูดกับภาษาเขียนแล้ว ภาษา Tamil ยังมีความหลากหลายตามภูมิภาคอีกด้วย:
- ทมิฬอินเดีย (รัฐทมิฬนาฑู, ปูดูเชอร์รี) — มีสำเนียงทางเหนือ ตะวันตก และใต้ที่แตกต่างกันในด้านเสียงพูด
- ทมิฬศรีลังกา / จาฟนา — รักษาคุณลักษณะโบราณหลายอย่างที่สูญหายไปในทมิฬแผ่นดินใหญ่ บางครั้งถือว่าใกล้เคียงกับทมิฬยุคเก่ามากกว่า
- ทมิฬสิงคโปร์ / มาเลเซีย — ได้รับอิทธิพลจากคำยืมภาษามลายู
- สำเนียงในกลุ่มพลัดถิ่น — มักผสมผสานกับภาษาท้องถิ่น
แม้จะมีความแตกต่างเหล่านี้ มาตรฐานวรรณกรรม (Senthamil) ก็ยังคง เหมือนกันทุกภูมิภาค — รูปแบบการเขียนที่เป็นหนึ่งเดียวกันจากการปรับมาตรฐานมาหลายศตวรรษ แม้ว่ารูปแบบการพูดจะเปลี่ยนแปลงไป
ระบบการเขียน
ภาษาทมิฬเขียนด้วย อักษรทมิฬ (தமிழ் எழுத்து, Tamiḻ Eḻuttu) — เป็น อาบูกิดะ หมายถึงพยัญชนะทุกตัวจะมีสระประจำตัวที่สามารถเปลี่ยนแปลงหรือลบออกได้ด้วยเครื่องหมายกำกับ นี่เป็นประเภทเดียวกับอักษรเทวนาครี (ใช้กับภาษาฮินดี) แต่ตัวอักษรและกฎของทมิฬนั้นมีลักษณะเฉพาะตัว
โครงสร้างของอักษร
อักษรทมิฬมีโครงสร้างที่ชัดเจนและเป็นระเบียบ:
- สระ 12 ตัว (உயிர் எழுத்து, uyir eḻuttu, “อักษรวิญญาณ”) — แบ่งเป็นสั้น (kuril) และยาว (nedil)
- พยัญชนะ 18 ตัว (மெய் எழுத்து, mey eḻuttu, “อักษรร่างกาย”) — แบ่งเป็น vallinam (เสียงแข็ง), mellinam (เสียงนุ่ม รวมถึงเสียงนาสิก), และ idayinam (เสียงกลาง)
- อักขระพิเศษ 1 ตัว (ஃ, aytham) — ไม่ใช่ทั้งสระหรือพยัญชนะ
- อักษรประสม 216 ตัว (உயிர்மெய் எழுத்து, uyirmey eḻuttu, “อักษรวิญญาณ-ร่างกาย”) — เกิดจากการผสมพยัญชนะกับสระ
รวมทั้งหมด 247 ตัวอักษร อักษรประสมเหล่านี้ไม่จำเป็นต้องท่องจำทีละตัว เพราะมีหลักเกณฑ์การผสมสระ 12 ตัวกับพยัญชนะ 18 ตัวอย่างเป็นระบบ
ทำไมตัวอักษรถึงโค้งมน
ตัวอักษรทมิฬส่วนใหญ่มีลักษณะโค้งมน เหตุผลมาจากการใช้งานจริง: อักษรนี้ ถูกเขียนบนใบลานในอดีต หากใช้เส้นเหลี่ยมหรือมุมแหลมจะทำให้ใบลานขาดตามแนวเส้นใย การใช้เส้นโค้งจึงช่วยรักษาพื้นผิวสำหรับการเขียน
ความคงเส้นคงวาทางเสียง
ไม่เหมือนกับอักษรอินเดียส่วนใหญ่ อักษรทมิฬจะไม่แยกเสียงก้องกับเสียงไม่ก้อง หรือเสียงมีลมหายใจกับไม่มีลมหายใจอย่างเป็นระบบ ตัวอักษรเดียว ก์ (க்) แทนเสียงที่ในเทวนาครีจะมีสามหรือสี่ตัวแยกกัน — และการออกเสียงจริง (/k/, /g/, /x/) จะขึ้นอยู่กับตำแหน่งในคำ:
- ก์ (க்) คือ [k] เมื่อต้นคำ
- ก์ (க்) คือ [x] หรือ [ɣ] เมื่อตรงกลางคำ
- ก์ (க்) คือ [kː] เมื่อตัวซ้ำกัน
- ก์ (க்) คือ [ɡ] เมื่อตามหลังเสียงนาสิก
นั่นหมายความว่า การเขียนทมิฬมีความเป็นระบบสูงมาก แต่การอ่านออกเสียงต้องรู้กฎตามบริบทด้วย
ตัวอักษร Grantha: เสียงที่ยืมมา
เสียงอย่าง /f/, /z/, /ʂ/, และ /ʃ/ ซึ่งไม่มีในทมิฬโดยกำเนิด จะเขียนด้วยชุดตัวอักษรเสริมที่เรียกว่า Grantha letters ใช้สำหรับคำยืมจากสันสกฤตและคำต่างประเทศสมัยใหม่เป็นหลัก ตัวอักษรเหล่านี้สอนในโรงเรียนแต่ถือว่าแยกจากอักษรทมิฬหลัก
สรุปไวยากรณ์
ไวยากรณ์ทมิฬมีสองลักษณะเด่น: เป็นภาษาที่ผันคำด้วยการเติมปัจจัย (agglutinative) อย่างชัดเจน (เติมปัจจัยต่อท้ายรากคำ) และใช้ลำดับคำ SOV (ประธาน-กรรม-กริยา เหมือนญี่ปุ่นหรือภาษาตุรกี)
การเติมปัจจัย (Agglutination)
ปัจจัยจะถูกเติมต่อท้ายรากคำนามหรือกริยา โดยแต่ละปัจจัยมีความหมายทางไวยากรณ์เฉพาะ ผลลัพธ์คือ คำทมิฬคำเดียวสามารถสื่อความหมายที่ภาษาอังกฤษต้องใช้ทั้งประโยค:
sel- "ไป" (รากคำ)
sel-l-aa-tiru-pp-avar
"บุคคลที่อยู่ในสภาพของการไม่ไป" / "คนที่ขาดเรียน"
คำนี้ sellātiruppavar (செல்லாதிருப்பவர்) อธิบายว่า “บุคคลที่อยู่ในสภาพของการไม่ไป” ในรูปแบบคำเดียวที่ผันปัจจัยต่อเนื่อง — ลักษณะนี้เองที่ทำให้ทมิฬขึ้นชื่อเรื่องการสื่อความหมายได้กระชับและทรงพลัง
ระบบกรณี (Case System)
คำนามจะผันตามกรณีทางไวยากรณ์ ไวยากรณ์ทมิฬแบบดั้งเดิม (Tolkāppiyam) ระบุว่ามีแปดกรณี; ส่วนไวยากรณ์เชิงพรรณนาในยุคใหม่มักระบุแปดถึงสิบกรณี ขึ้นอยู่กับการวิเคราะห์ (วิกิพีเดีย: ไวยากรณ์ทมิฬ):
- กรณีประธาน (ไม่ระบุเครื่องหมาย) — ประธานของประโยค
- กรณีกรรมตรง (-ai, -ஐ) — กรรมตรง
- กรณีกรรมรอง (-ukku, -உக்கு) — กรรมรอง, “ให้/ถึง”
- กรณีแสดงความเป็นเจ้าของ (-udaya, -உடைய) — การเป็นเจ้าของ
- กรณีเครื่องมือ (-aal, -ஆல்) — “โดยวิธีการ”
- กรณีร่วม (-odu, -ஓடு) — “ร่วมกับ”
- กรณีสถานที่ (-il, -இல்) — “ใน / ที่”
- กรณีแสดงจุดเริ่มต้น (-iliruntu, -இலிருந்து) — “จาก”
- กรณีเรียกขาน — การเรียกตรง
รูปพหูพจน์จะแสดงด้วย -kaḷ (-கள்) วางไว้หน้าปัจจัยกรณีใด ๆ
คำนามมีเหตุผลกับไม่มีเหตุผล
ภาษา Tamil ไม่มีเพศไวยากรณ์สำหรับสิ่งที่ไม่ใช่มนุษย์ แต่จะแบ่งคำนามเป็น มีเหตุผล/ไม่มีเหตุผล ดังนี้:
- คำนามมีเหตุผล — เทพเจ้าและมนุษย์ — จะผันกริยาให้สอดคล้องกับเอกพจน์ชาย, เอกพจน์หญิง หรือพหูพจน์
- คำนามไม่มีเหตุผล — สัตว์, สิ่งของ, นามธรรม — จะผันกริยาแค่เอกพจน์หรือพหูพจน์เท่านั้น
ความแตกต่างนี้มีผลต่อการผันกริยาและคำคุณศัพท์ในทุกประโยค
กริยา
กริยาในภาษา Tamil จะผันตาม บุคคล, จำนวน, เพศ, กาล และมุข โดยมีกาลหลัก 3 กาล (อดีต, ปัจจุบัน, อนาคต) และแต่ละกาลยังมีเครื่องหมายแสดงลักษณะ (กำลังดำเนิน, เสร็จสิ้น, เป็นประจำ):
| กาล | รูป (“ร้องเพลง”) | คำแปล |
|---|---|---|
| ปัจจุบัน | paadukiṟēṉ (பாடுகின்றேன்) | ฉันกำลังร้องเพลง |
| อดีต | paadiṉēṉ (பாடினேன்) | ฉันร้องเพลงแล้ว |
| อนาคต | paaduvēṉ (பாடுவேன்) | ฉันจะร้องเพลง |
สิ่งที่ภาษา Tamil ไม่มี
- ไม่มีคำกริยาเชื่อมในประโยคเปรียบเทียบ — ภาษา Tamil มีคำกริยาแสดงการมีอยู่ iru- (“เป็น/มีอยู่”) แต่ไม่มีคำกริยาเชื่อมเหมือน “is/am/are” ในภาษาอังกฤษที่ใช้เชื่อมคำนามสองคำ เช่น “ฉันเป็นครู” จะพูดว่า “ฉัน ครู” (nāṉ āsiriyar, நான் ஆசிரியர்)
- ไม่มีคำกริยา “มี” — การแสดงความเป็นเจ้าของจะพูดว่า “สำหรับฉัน มี X” เช่น “ฉันมีม้า” จะพูดตรงตัวว่า “มีม้าสำหรับฉัน” (eṉṉiṭam oru kutirai irukkiṟatu)
- ไม่มีคำสรรพนามเชื่อมประโยคย่อย (ไม่มี “who/which/that”) — ความหมายเชิงสัมพันธ์จะใช้ กริยาแบ่งเชิงสัมพันธ์ ที่สร้างด้วยการเติมปัจจัย
- ไม่มีคำนำหน้านาม — ไม่มีคำเทียบเท่า “a” หรือ “the”
ระบบคำสุภาพในตัว
ทมิฬมีระบบคำสุภาพในตัวเองที่ปรับเปลี่ยนคำกริยาตามระดับความสุภาพ ในภาษาทมิฬที่พูดกัน:
- vā (வா) — “มา” (ไม่เป็นทางการ ใช้กับเด็กหรือเพื่อนสนิท)
- vāṅka (வாங்க) — “มา” (สุภาพ ใช้กับผู้ใหญ่หรือคนแปลกหน้า)
- vāruṅkaḷ (வாருங்கள்) — “กรุณามา” (รูปแบบทางการในวรรณกรรม)
คำศัพท์
คำศัพท์หลักของทมิฬส่วนใหญ่เป็น ภาษาดราวิเดียนพื้นเมือง โดยมีการยืมคำจากหลายแหล่ง:
- คำยืมจากสันสกฤต — คำศัพท์ทางศาสนา วิทยาศาสตร์ และวรรณกรรม ที่ผสมผสานเข้ามาตลอดหลายศตวรรษแห่งการติดต่อ
- คำยืมจากโปรตุเกส — ตั้งแต่ศตวรรษที่ 16 เป็นต้นมา (เช่น jaṉṉal, “หน้าต่าง”, จาก janela)
- คำยืมจากอังกฤษ — พบมากในภาษาพูดทมิฬยุคใหม่ โดยเฉพาะในศัพท์เทคนิคและภาษาพูดทั่วไป
- คำยืมจากอาหรับและเปอร์เซีย — พบมากในทมิฬศรีลังกาและในกลุ่มชาวมุสลิมทมิฬ
ลักษณะเด่นที่สืบทอดมาตั้งแต่ยุคคลาสสิกของทมิฬคือ แนวโน้มความบริสุทธิ์ของภาษา — คำที่มาจากสันสกฤตจำนวนมากจะมีคำทมิฬพื้นเมืองที่ใช้คู่ขนานกัน และมีธรรมเนียม (บางครั้งเกี่ยวข้องกับการเมือง) ที่นิยมใช้คำพื้นเมืองมากกว่า

วลีที่ใช้บ่อย & ตัวอย่างข้อความ
คำทักทายและวลีทมิฬที่เป็นประโยชน์สำหรับนักเดินทางและผู้เริ่มต้น (Omniglot: Tamil phrases):
คำทักทาย
| ทมิฬ | ถอดเสียง | ภาษาอังกฤษ |
|---|---|---|
| வணக்கம் | Vaṇakkam | สวัสดี / ทักทาย (สุภาพ ใช้ได้ทั่วไป) |
| காலை வணக்கம் | Kālai vaṇakkam | สวัสดีตอนเช้า |
| மாலை வணக்கம் | Mālai vaṇakkam | สวัสดีตอนเย็น |
| நன்றி | Naṉṟi | ขอบคุณ |
| பரவாயில்லை | Paravāyillai | ไม่เป็นไร / ไม่มีปัญหา |
วลีที่มีประโยชน์
| ทมิฬ | ถอดเสียง | ภาษาอังกฤษ |
|---|---|---|
| எப்படி இருக்கிறீர்கள்? | Eppaḍi irukkiṟīrkaḷ? | สวัสดี สบายดีไหม? (ทางการ) |
| நான் நன்றாக இருக்கிறேன் | Nāṉ naṉṟāka irukkiṟēṉ | ฉันสบายดี |
| என் பெயர்… | Eṉ peyar… | ฉันชื่อ… |
| ஆம் / இல்லை | Ām / Illai | ใช่ / ไม่ใช่ |
| எவ்வளவு? | Evvaḷavu? | ราคาเท่าไหร่? |
| கழிப்பறை எங்கே? | Kaḻippaṟai eṅkē? | ห้องน้ำอยู่ที่ไหน? |
| எனக்கு புரியவில்லை | Eṉakku puriyavillai | ฉันไม่เข้าใจ |
ตัวเลข 1–10
| ตัวเลข | ทมิฬ | ถอดเสียง |
|---|---|---|
| 1 | ஒன்று | oṉṟu |
| 2 | இரண்டு | iraṇṭu |
| 3 | மூன்று | mūṉṟu |
| 4 | நான்கு | nāṉku |
| 5 | ஐந்து | aintu |
| 6 | ஆறு | āṟu |
| 7 | ஏழு | ēḻu |
| 8 | எட்டு | eṭṭu |
| 9 | ஒன்பது | oṉpatu |
| 10 | பத்து | pattu |
ภาษาทมิฬเรียนยากไหม?
สำหรับผู้ที่พูดภาษาอังกฤษเป็นภาษาแม่ ภาษาทมิฬถูกจัดโดย U.S. Foreign Service Institute ให้เป็นภาษา “ยาก” ระดับ III ซึ่งต้องใช้เวลาเรียนเต็มเวลา ประมาณ 44 สัปดาห์ (1,100 ชั่วโมงเรียน) เพื่อให้ถึงระดับใช้งานในวิชาชีพ นั่นทำให้ภาษาทมิฬอยู่ในกลุ่มเดียวกับภาษาฮินดี รัสเซีย ตุรกี และฟินแลนด์ — และยากกว่าภาษาตระกูลโรมานซ์ (ระดับ I, ~600–750 ชั่วโมง) พบบ่อยว่าภาษาทมิฬจะมีเครื่องหมายดอกจันในตารางของ FSI เพื่อระบุว่ามักใช้เวลานานกว่าค่าเฉลี่ยของกลุ่ม (FSI Language Difficulty Rankings)
อะไรที่ทำให้ภาษาทมิฬยาก
- อักษรที่ไม่ใช่ละติน — มีตัวอักษร 247 ตัวที่ต้องเรียนรู้ (แต่โครงสร้างมีความเป็นระบบ)
- ภาวะสองระดับภาษา (Diglossia) — คุณต้องเรียนรู้ทั้งรูปแบบที่ใช้ในการอ่าน/เขียน และรูปแบบที่ใช้พูด
- โครงสร้างคำแบบผสมต่อท้าย (Agglutinative morphology) — คำยาวที่มีปัจจัยต่อท้ายหลายชั้น
- มีกรณีทางไวยากรณ์ 9 แบบ
- พยัญชนะเสียงกระดกลิ้น (Retroflex consonants) (โดยเฉพาะ ழ் /ɻ/) ที่ไม่มีในภาษาอังกฤษ
- โครงสร้างประโยค SOV — ตรงข้ามกับภาษาอังกฤษ
- ไม่มีคำที่มีรากศัพท์ร่วมกับภาษาอังกฤษหรือภาษาในยุโรปที่รู้จักกันทั่วไป
อะไรที่ทำให้ภาษาทมิฬง่ายกว่าที่คิด
- กฎการออกเสียงตามตัวสะกดที่คาดเดาได้ — เมื่อคุณเข้าใจกฎการออกเสียงพยัญชนะตามบริบทแล้ว การออกเสียงจะเป็นไปตามตัวอักษร
- ไวยากรณ์มีเหตุผล — การผสมคำ (agglutination) มีรูปแบบที่สม่ำเสมอ ไม่เหมือนกับกริยาไม่ปกติในภาษาอังกฤษ
- ไม่มีเพศไวยากรณ์สำหรับวัตถุ — มีกฎเกณฑ์ที่ซับซ้อนน้อยกว่าภาษาฝรั่งเศสหรือเยอรมัน
- ไม่มีคำกริยา “เป็น” ในหลายบริบท — ประโยคสามารถเรียบง่ายอย่างน่าทึ่ง
- ชุมชนผู้เรียนเข้มแข็ง — ทั้งออนไลน์และในเมืองใหญ่ที่มีชาวทมิฬพลัดถิ่น
ภาษา Tamil คล้ายกับภาษา Hindi หรือไม่?
ไม่คล้าย นี่เป็นความเข้าใจผิดที่พบบ่อย Hindi เป็นภาษาในตระกูลอินโด-ยูโรเปียน ส่วน Tamil เป็นตระกูลดราวิเดียน ทั้งสองภาษาไม่ได้เกี่ยวข้องกันมากไปกว่าภาษาอังกฤษกับภาษาอาหรับ ระบบตัวอักษร ไวยากรณ์ คำศัพท์ และระบบเสียงของ Tamil แตกต่างจาก Hindi อย่างสิ้นเชิง ภาษาที่ใกล้เคียงกับ Tamil จริง ๆ คือ Malayalam, Telugu, Kannada และภาษาอื่น ๆ ในตระกูลดราวิเดียน
เคล็ดลับสำหรับการเรียนภาษา Tamil
จะเริ่มต้นอย่างไร
- กำหนดเป้าหมายของคุณก่อน หากคุณต้องการพูดคุยกับครอบครัวหรือเดินทางในรัฐทมิฬนาฑู ให้เน้นที่ ภาษาทมิฬพูด (Kodunthamil) หากคุณต้องการอ่านวรรณกรรม ข่าว หรือเอกสารทางการ คุณต้องลงทุนกับ ภาษาทมิฬวรรณกรรม (Senthamil) ผู้เริ่มต้นส่วนใหญ่มักเริ่มจากภาษาพูดก่อน
- เรียนรู้ตัวอักษรตั้งแต่เนิ่น ๆ การฝึกฝนอย่างจริงจัง 1-2 สัปดาห์กับสระ 12 ตัว + พยัญชนะ 18 ตัว จะเปิดประตูสู่ระบบตัวอักษรทั้งหมด 247 ตัว อย่าพึ่งพาการถอดเสียงโรมันไปตลอด — มันไม่สม่ำเสมอ
- ฝึกออกเสียง retroflex ให้คล่อง ட், ண், ள், ழ் — เสียงเหล่านี้คือเอกลักษณ์ของการออกเสียงทมิฬ เจ้าของภาษาจะสังเกตได้ทันที
- ฝึกกับภาพยนตร์และ YouTube — อุตสาหกรรมภาพยนตร์ทมิฬเป็นหนึ่งในวงการที่มีชีวิตชีวาที่สุดในโลก และมีซับไตเติลให้เลือกมากมาย
แหล่งข้อมูลแนะนำ
| แหล่งข้อมูล | เหมาะสำหรับ |
|---|---|
| Preply / italki | เรียนตัวต่อตัวกับเจ้าของภาษา |
| Tamil Virtual Academy | คอร์สออนไลน์ฟรีจากรัฐบาลรัฐทมิฬนาฑู |
| Omniglot Tamil | อ้างอิงตัวอักษรพร้อมเสียงประกอบ |
| American Institute of Indian Studies (AIIS) | ค่ายภาษาทมิฬฤดูร้อนแบบเข้มข้นในอินเดีย |
| HelloTalk / Tandem | แลกเปลี่ยนภาษากับเจ้าของภาษาทมิฬ |
| ภาพยนตร์ทมิฬพร้อมซับไตเติล | ฝึกฟัง + เข้าใจบริบททางวัฒนธรรม |
ไทม์ไลน์ที่สมจริง
หากฝึกฝนอย่างสม่ำเสมอวันละ 30–60 นาที:
- 3 เดือน — อ่านตัวอักษรทมิฬ ทักทาย สั่งอาหาร นับเลข สนทนาเบื้องต้น
- 6 เดือน — สนทนาภาษาทมิฬพูดง่าย ๆ เข้าใจข่าวพื้นฐาน
- 12 เดือน — พูดได้ระดับกลาง อ่านเรื่องสั้นโดยใช้พจนานุกรมช่วย
- 2 ปี — พูดคล่องขั้นสูงในภาษาทมิฬพูดหรือทมิฬวรรณกรรม (หากต้องการเชี่ยวชาญทั้งสองแบบจะใช้เวลานานกว่านี้)
- 5+ ปีของการเรียนอย่างจริงจัง มักต้องมีคอร์สเรียนอย่างเป็นทางการ — อ่านวรรณกรรมสังคมคลาสสิกได้อย่างสบาย (เป็นทักษะเฉพาะทางที่แม้แต่เจ้าของภาษาที่อ่านออกเขียนได้ก็มักต้องฝึกฝนเพิ่มเติม)
การแปลด้วย AI และภาษาทมิฬ
ภาษาทมิฬถือเป็น ภาษาที่มีทรัพยากรปานกลาง ในแวดวงวิจัย NLP: ยังไม่รองรับดีเท่าภาษาอังกฤษหรือจีนกลาง แต่ก็ล้ำหน้ากว่าภาษาขนาดเล็กอีกมากมาย ปัจจุบันระบบแปลภาษาด้วยเครื่องสามารถจัดการกับภาษาทมิฬในเนื้อหาทั่วไปได้ค่อนข้างดี แต่ก็ยังมีความท้าทายหลายประการ
ปัญหา Diglossia
ข้อมูลฝึกสอนภาษา Tamil ส่วนใหญ่บนอินเทอร์เน็ตเป็น Senthamil (ภาษาทางการ) เช่น บทความหนังสือพิมพ์ เอกสารราชการ หรือ Wikipedia แต่สิ่งที่ผู้ใช้พิมพ์และพูดจริง ๆ คือ Kodunthamil (ภาษาพูด) ผลลัพธ์คือ โมเดล AI ที่ฝึกจากข้อความบนเว็บอาจตอบคำถามกันเองด้วยภาษา Tamil ที่สละสลวยแบบวรรณกรรม หรือไม่เข้าใจข้อความแนวแชท (The Federal: Fitting Tamil into AI) ระบบ AI ภาษา Tamil ที่ดีจึงต้องฝึกกับทั้งสองรูปแบบแยกกัน
ปัญหาเรื่องรูปคำ (Morphology)
รากคำกริยาในภาษา Tamil เพียงคำเดียวสามารถสร้าง รูปผันได้เป็นพัน ๆ รูป วิธีตัดคำย่อย (subword tokenization) แบบมาตรฐานที่ใช้ได้ดีกับภาษาอังกฤษ กลับมีปัญหากับภาษาที่มีการผันคำสูง เช่น Tamil เพราะมันจะตัดคำยาว ๆ ออกเป็นส่วนที่เสียความหมายทางไวยากรณ์ ตัวตัดคำที่ออกแบบมาเฉพาะสำหรับโครงสร้างแบบนี้จึงเป็นหัวข้อวิจัยที่สำคัญ
ปัญหาเรื่องอักษร (Script)
ระบบตัวอักษรผสมของ Tamil ทำให้ตัวอักษรที่เห็นเพียงตัวเดียว อาจถูกเข้ารหัสเป็นหลายจุดรหัส Unicode ระบบที่ไม่เข้าใจอาจตัดแบ่งคำผิด นอกจากนี้ เสียง retroflex ḻ (ழ்) ก็ไม่มีรูปถอดเสียงละตินที่แน่นอน — ระบบถอดเสียงต่าง ๆ ใช้ zh, ḻ, l̤ หรือ r — ซึ่งทำให้ข้อมูลฝึกซับซ้อนขึ้น
ปัญหาภาษา Tamil โบราณ
วรรณกรรมต่อเนื่องกว่า 2,000 ปีของ Tamil ทำให้ ภาษาโบราณกับภาษาใหม่ต่างกันมาก โมเดล AI ที่ฝึกเฉพาะภาษา Tamil สมัยใหม่จะไม่สามารถจัดการกับบทกวีสมัย Sangam หรือจารึกยุคกลางได้ ต้องใช้โมเดลเฉพาะทางสำหรับงานวิชาการวรรณกรรม
OpenL ช่วยอย่างไร
OpenL รองรับภาษา Tamil เป็นหนึ่งในกว่า 100 ภาษาที่ครอบคลุม คุณสมบัติบางอย่างที่สำคัญโดยเฉพาะสำหรับงานภาษา Tamil ได้แก่
- การแปลไฟล์ PDF, Word และเอกสาร ที่สามารถแสดงผลอักษรทมิฬและอักขระ Unicode ที่ซับซ้อนได้อย่างถูกต้อง — จุดนี้สำคัญมาก เพราะเครื่องมือแปลภาษาหลายตัวมักแสดงผลอักขระประสมและเครื่องหมายกำกับเสียงของทมิฬผิดพลาด
- การแปลด้วย OCR สำหรับหน้าหนังสือทมิฬที่พิมพ์แล้วหรือภาพหน้าจอ เหมาะกับตำราเรียน ป้ายประกาศ และสแกนหนังสือพิมพ์เก่า
- การแปลภาพ สำหรับข้อความทมิฬที่เขียนด้วยมือหรือถ่ายภาพมา — เป็นความต้องการที่พบได้บ่อย เพราะเนื้อหาทมิฬจำนวนมากไม่ได้อยู่ในคลังข้อมูลดิจิทัลที่มีโครงสร้าง
- การแปลเสียงและวิดีโอ พร้อมระบบรู้จำเสียงพูดทมิฬ เหมาะสำหรับภาพยนตร์ เพลง และเนื้อหาบรรยายในภาษา Tamil
สำหรับข้อความที่มีความสำคัญสูง เช่น สัญญากฎหมาย วรรณกรรมยุค Sangam เนื้อหาภาษาทมิฬถิ่นศรีลังกา หรือเนื้อหาที่ต้องคงความแตกต่างระหว่างภาษาเขียนกับภาษาพูด การตรวจทานโดยมนุษย์ยังคงเป็นสิ่งจำเป็น ผลลัพธ์จากเครื่องควรใช้เป็นเพียงร่างต้นฉบับเท่านั้น
คู่มือที่เกี่ยวข้องบนบล็อก OpenL:
แหล่งข้อมูล
- ภาษาทมิฬ — วิกิพีเดีย — ภาพรวมเกี่ยวกับการจัดจำแนก ประวัติศาสตร์ และข้อมูลประชากร
- ไวยากรณ์ทมิฬ — วิกิพีเดีย — กรณีการใช้คำ การผันกริยา โครงสร้างคำแบบผสมคำ
- อักษรทมิฬ — วิกิพีเดีย — โครงสร้างตัวอักษร ประวัติศาสตร์ และการปฏิรูป
- ทมิฬโบราณ — วิกิพีเดีย — ยุคสังคมสังฆัม และจารึกทมิฬพราหมี
- Britannica: Tamil language — ยุคสมัยทางประวัติศาสตร์และการจัดจำแนก
- Kolipakam et al. (2018), Royal Society Open Science — งานวิจัยทางวิวัฒนาการแบบไบเยเชียนที่ระบุว่าตระกูลดราวิเดียนมีอายุราว 4,500 ปี
- Worlddata: ผู้พูดภาษาทมิฬทั่วโลก — สถิติผู้พูด
- รายชื่อประเทศที่ภาษาทมิฬเป็นภาษาราชการ — วิกิพีเดีย — สถานะภาษาราชการในแต่ละประเทศ
- ภาษาต่าง ๆ ในศรีลังกา — วิกิพีเดีย — สถานะของทมิฬศรีลังกาและการแก้ไขรัฐธรรมนูญครั้งที่ 13 ในปี 1987
- ภาวะสองระดับภาษา — วิกิพีเดีย — ทมิฬในฐานะกรณีศึกษาคลาสสิกของภาวะสองระดับภาษา
- Omniglot: วลีภาษาทมิฬ — วลีที่ใช้บ่อยและการออกเสียง
- FSI Language Difficulty Rankings — กระทรวงการต่างประเทศสหรัฐฯ — ทมิฬอยู่ในหมวดหมู่ III ใช้เวลาประมาณ 1,100 ชั่วโมงเรียน
- The Federal: Fitting Tamil into AI — ความท้าทายด้าน NLP ภาษา Tamil, ภาวะสองระดับภาษา และการเป็นตัวแทนในโลกดิจิทัลที่ยังน้อย


