तमिल: दुनिया की सबसे प्राचीन जीवित भाषाओं में से एक
TABLE OF CONTENTS
एक ऐसी भाषा जिसकी 2,000 साल पुरानी कविता आज भी विद्वान और प्रशिक्षित पाठक मूल रूप में पढ़ सकते हैं — और जिसकी लिखित भाषा बोली से इतनी अलग है कि तमिल बच्चे इसे लगभग दूसरी भाषा की तरह सीखते हैं।
वर्गीकरण
तमिल (தமிழ், tamiḻ) द्रविड़ भाषा परिवार से संबंधित है — यह भारतीय उपमहाद्वीप की लगभग 26 भाषाओं का परिवार है, जो आसपास की भौगोलिक भाषाओं (हिंदी, संस्कृत, अंग्रेज़ी) यानी इंडो-यूरोपीय भाषाओं से पूरी तरह असंबंधित है। इस परिवार के भीतर, तमिल दक्षिण द्रविड़ शाखा में आता है, जिसमें इसका सबसे करीबी प्रमुख संबंधी Malayalam है, साथ ही Kannada, Toda, Kota, Kodava और Badaga भी शामिल हैं।
तमिल और Malayalam का एक साझा पूर्वज था और ये दोनों भाषाएँ पूरी तरह अलग भाषा के रूप में केवल प्रारंभिक मध्यकाल में उभरीं — अलगाव की शुरुआत 9वीं सदी ईस्वी में हुई, और Malayalam 13वीं–14वीं सदी तक पूरी तरह अलग भाषा के रूप में स्थापित नहीं हुआ (Britannica: Tamil language)।
Kolipakam et al. (2018) Bayesian phylogenetic study, जो Royal Society Open Science में प्रकाशित हुई, के अनुसार द्रविड़ भाषा परिवार की उम्र लगभग 4,500 साल है (Royal Society Open Science)। प्रोटो-भाषा की भौगोलिक उत्पत्ति को लेकर अभी भी बहस जारी है, जिसमें प्रस्ताव प्रायद्वीपीय भारत से लेकर सिंधु क्षेत्र तक हैं।
तमिल के वर्गीकरण को महत्वपूर्ण बनाने वाली बात: तमिल के पास भारत में किसी भी गैर-इंडो-आर्यन भाषा की सबसे पुरानी सतत साहित्यिक परंपरा है — यह तथ्य पिछले दो हजार वर्षों से इसकी पहचान, साहित्य और आधुनिक राजनीतिक भूमिका को आकार देता रहा है।
तमिल कहाँ बोली जाती है
तमिल भाषा के दुनिया भर में 75 से 90 मिलियन मातृभाषी बोलने वाले हैं (Worlddata: Tamil), जिससे यह लगभग दुनिया की 17वीं सबसे अधिक बोली जाने वाली भाषा बन जाती है। इसे तीन संप्रभु देशों (भारत, श्रीलंका, सिंगापुर) में आधिकारिक दर्जा प्राप्त है, साथ ही भारतीय राज्य तमिलनाडु और केंद्र शासित प्रदेश पुडुचेरी में भी।
| क्षेत्र | बोलने वाले (लगभग) | आधिकारिक दर्जा |
|---|---|---|
| तमिलनाडु (भारत) | ~70 मिलियन | राज्य की आधिकारिक भाषा |
| पुडुचेरी (भारत) | ~1 मिलियन | केंद्र शासित प्रदेश की आधिकारिक भाषा |
| श्रीलंका | ~3.5–4 मिलियन (तमिल लगभग 15–18% आबादी की मातृभाषा है) | सिंहली के साथ सह-आधिकारिक |
| सिंगापुर | तमिल समुदाय ~5% आबादी; ~100,000+ तमिल बोलने वाले परिवार | 4 आधिकारिक भाषाओं में से एक |
| मलेशिया | ~1.8 मिलियन जातीय तमिल समुदाय | मान्यता प्राप्त अल्पसंख्यक |
| मॉरीशस | तमिल वंश ~5% आबादी; सक्रिय बोलने वाले कम | मान्यता प्राप्त अल्पसंख्यक |
| प्रवासी (कनाडा, यूके, अमेरिका, दक्षिण अफ्रीका, खाड़ी देश) | कुल मिलाकर कई मिलियन | — |
तमिल को भारत की शास्त्रीय भाषाओं में भी विशेष दर्जा प्राप्त है (आधिकारिक रूप से 2004 में घोषित), जो इसकी 2,000+ वर्षों की सतत साहित्यिक परंपरा को दर्शाता है।
श्रीलंका में तमिल आधिकारिक भाषा क्यों है?
श्रीलंका में तमिल का दर्जा राजनीतिक रूप से संवेदनशील रहा है। Official Language Act of 1956 ने सिंहली को एकमात्र आधिकारिक भाषा बना दिया, जिससे दशकों तक जातीय तनाव रहा। इंडो-श्रीलंका समझौते के बाद, Thirteenth Amendment of 1987 ने तमिल को सिंहली के साथ आधिकारिक भाषा के रूप में मान्यता दी, और अंग्रेज़ी को “लिंक भाषा” के रूप में रखा गया। श्रीलंका में तमिल बोलने वाले — श्रीलंकाई तमिल, भारतीय तमिल और अधिकांश श्रीलंकाई मूर — देश की सबसे बड़ी भाषाई अल्पसंख्यक हैं।
सिंगापुर में तमिल आधिकारिक भाषा क्यों है?
सिंगापुर के संविधान में चार आधिकारिक भाषाओं — अंग्रेज़ी, मंदारिन, मलय और तमिल — का उल्लेख है, जो देश की बहुसांस्कृतिक संरचना को दर्शाता है। तमिल समुदाय सिंगापुर की कुल जनसंख्या का लगभग 5% है और भारतीय समुदाय का सबसे बड़ा हिस्सा बनाता है।

तमिल का संक्षिप्त इतिहास
तमिल भाषा का इतिहास अनूठा है क्योंकि आज जो तमिल पढ़ी जाती है, वह 2,000 साल पहले बोली जाने वाली भाषा से स्पष्ट रूप से पहचानी जा सकती है। आधुनिक तमिल बोलने वाले कुछ प्रयास के साथ दूसरी शताब्दी ईसा पूर्व की शिलालेखों को पढ़ सकते हैं — यह निरंतरता बहुत कम भाषाओं में देखने को मिलती है।
विद्वान तमिल के इतिहास को तीन कालखंडों में बांटते हैं:
- पुरातन तमिल (लगभग 300 ईसा पूर्व – 700 ईस्वी)
- मध्यकालीन तमिल (700 – 1600 ईस्वी)
- आधुनिक तमिल (1600 ईस्वी – वर्तमान)
संगम युग और प्रारंभिक शिलालेख
तमिल के सबसे पुराने प्रमाण मदुरै और तिरुनेलवेली जिलों की गुफाओं की दीवारों पर दर्जनों शिलालेखों के रूप में मिलते हैं, जिनकी तिथि दूसरी शताब्दी ईसा पूर्व मानी जाती है। इरावथम महादेवन की 2003 की मानक सूची में लगभग 89 तमिल-ब्राह्मी शिलालेख दर्ज हैं; बाद की सूचियों में यह संख्या 110 से अधिक हो गई है।
इसी काल में संगम साहित्य की रचना हुई — लगभग 2,000 से अधिक कविताएँ, जो लगभग 300 ईसा पूर्व से 300 ईस्वी के बीच लिखी गई थीं। संगम कविताएँ प्रेम, युद्ध, नैतिकता, राजशाही और दैनिक जीवन का असाधारण विस्तार से वर्णन करती हैं और आज भी तमिल सांस्कृतिक पहचान का एक महत्वपूर्ण आधार हैं।
समुद्री व्यापार की संपर्क भाषा के रूप में तमिल
प्रारंभिक मध्यकाल में तमिल दक्षिण भारतीय समुद्री व्यापार की संपर्क भाषा के रूप में प्रयुक्त होती थी। तमिल शिलालेख इंडोनेशिया और थाईलैंड में मिले हैं, और एक तमिल-ब्राह्मी शिलालेखित मिट्टी का टुकड़ा तो मिस्र के लाल सागर बंदरगाह कुसैर अल-कदीम से भी प्राप्त हुआ है (विकिपीडिया: तमिल भाषा) — यह चोल साम्राज्य की व्यापारिक पहुँच और तमिल व्यापारी संघों का प्रमाण है।
लिपि का विकास
यह लिपि तमिल ब्राह्मी से विकसित हुई, जिसमें कई मध्यवर्ती चरण शामिल थे — जैसे कि वट्टेलुट्टु (“गोल लिपि”) और मध्यकालीन तमिल-ग्रंथ — और अंततः यह आज के स्वरूप के क़रीब पहुँच गई। 19वीं और 20वीं सदी में दो बार सुधार की लहरें आईं, जिनमें स्वर चिह्नों का मानकीकरण किया गया, अनियमित रूपों को नियमित किया गया, और लिपि को मुद्रण के लिए अधिक अनुकूल बनाया गया।

उपभाषाएँ और प्रसिद्ध तमिल डाइग्लोसिया
तमिल की सबसे विशिष्ट भाषाई विशेषता उसका शब्दकोश या लिपि नहीं है — बल्कि यह है लिखित और बोली जाने वाली रूपों के बीच विशाल अंतर, जिसे डाइग्लोसिया कहा जाता है।
सेंतमिल बनाम कोडुंतमिल
तमिल दो समानांतर रूपों में अस्तित्व में है, जिन्हें एक ही वक्ता अलग-अलग परिस्थितियों में उपयोग करते हैं:
- सेंतमिल (செந்தமிழ், “शुद्ध/साहित्यिक तमिल”) — लेखन, समाचार प्रसारण, औपचारिक भाषण, धर्म, शिक्षा में प्रयुक्त
- कोडुंतमिल (கொடுந்தமிழ், “बोली/सामान्य तमिल”) — रोज़मर्रा की बातचीत, फिल्मों और टीवी में प्रयुक्त
ये केवल औपचारिक/अनौपचारिक शैलियाँ नहीं हैं — इनमें शब्दावली, व्याकरण और रूपविज्ञान में भी अंतर है। जैसे “जा रहा है” जैसे सामान्य क्रिया-पदांत पूरी तरह अलग हो सकते हैं:
| रूप | बोली तमिल | साहित्यिक तमिल |
|---|---|---|
| ”वह जा रहा है” | avan pōṟāṉ (அவன் போறான்) | avaṉ pōkiṉṟāṉ (அவன் போகின்றான்) |
| “मैं हूँ” | nāṉ irukkēṉ (நான் இருக்கேன்) | nāṉ irukkiṉṟēṉ (நான் இருக்கின்றேன்) |
तमिल बच्चे घर पर बोली तमिल बोलते हुए बड़े होते हैं और साहित्यिक रूप से वे पहली बार स्कूल में ही परिचित होते हैं — मानो अपनी ही भाषा का दूसरा रूप सीख रहे हों।
तमिल में शास्त्रीय काल से ही शैलीगत स्तर स्पष्ट रहे हैं, और आधुनिक डाइग्लोसिया विभाजन सदियों पुराना है। यह चार्ल्स फर्ग्यूसन के 1959 के प्रतिष्ठित शोधपत्र Diglossia के बाद डाइग्लोसिया साहित्य में सबसे अधिक उद्धृत उदाहरणों में से एक है।
क्षेत्रीय उपभाषाएँ
बोली/लिखित विभाजन के अलावा, तमिल में क्षेत्रीय विविधता भी महत्वपूर्ण है:
- भारतीय तमिल (तमिलनाडु, पुडुचेरी) — उत्तरी, पश्चिमी और दक्षिणी उपभाषाएँ, जिनमें ध्वन्यात्मक भिन्नताएँ हैं
- श्रीलंकाई / जाफना तमिल — मुख्यभूमि की बोलियों में खोई कई प्राचीन विशेषताओं को संरक्षित रखता है; कभी-कभी इसे पुराने तमिल के अधिक निकट माना जाता है
- सिंगापुर / मलेशिया तमिल — मलय शब्दों के प्रभाव में
- प्रवासी तमिल — अक्सर स्थानीय भाषा के साथ मिश्रित
इन भिन्नताओं के बावजूद, साहित्यिक मानक (Senthamil) सभी क्षेत्रों में एक समान है — यह लिखित रूप सदियों की मानकीकरण प्रक्रिया से एकीकृत हुआ है, भले ही बोली रूपों में विविधता हो।
लेखन प्रणाली
तमिल तमिल लिपि (தமிழ் எழுத்து, Tamiḻ Eḻuttu) में लिखी जाती है — यह एक अबुगिडा है, यानी प्रत्येक व्यंजन में एक अंतर्निहित स्वर होता है, जिसे चिह्नों द्वारा बदला या हटाया जा सकता है। यह वही लिपि वर्ग है जिसमें देवनागरी (हिंदी के लिए प्रयुक्त) आती है, लेकिन तमिल के अक्षर और नियम विशिष्ट हैं।
वर्णमाला की संरचना
तमिल वर्णमाला की संरचना अत्यंत सुव्यवस्थित है:
- 12 स्वर (உயிர் எழுத்து, uyir eḻuttu, “आत्मा अक्षर”) — छोटे (kuril) और लंबे (nedil) स्वर
- 18 व्यंजन (மெய் எழுத்து, mey eḻuttu, “शरीर अक्षर”) — vallinam (कठोर), mellinam (मुलायम, जिनमें नासिक्य भी शामिल), और idayinam (मध्यम) वर्गों में विभाजित
- 1 विशेष अक्षर (ஃ, aytham) — न स्वर, न व्यंजन
- 216 संयुक्त अक्षर (உயிர்மெய் எழுத்து, uyirmey eḻuttu, “आत्मा-शरीर अक्षर”) — जब व्यंजन और स्वर मिलते हैं, तब बनते हैं
कुल मिलाकर, 247 अक्षर। संयुक्त अक्षरों को अलग से याद नहीं किया जाता — ये 12 स्वरों और 18 व्यंजनों के संयोजन के नियमों का अनुसरण करते हैं।
अक्षर वक्र क्यों हैं
तमिल अक्षर मुख्यतः वक्राकार होते हैं। इसका कारण व्यावहारिक है: वर्णमाला मूल रूप से ताड़ के पत्तों पर लिखी जाती थी, और तीखे या सीधे खींचे गए रेखाएँ पत्ते को रेशा-रेखा में फाड़ देतीं। वक्र रेखाएँ लेखन सतह को सुरक्षित रखती थीं।
ध्वन्यात्मक संरक्षणवाद
अधिकांश अन्य भारतीय लिपियों के विपरीत, तमिल में व्यवस्थित रूप से न तो घोष और अघोष, और न ही महाप्राण और अल्पप्राण व्यंजन अलग-अलग दर्शाए जाते हैं। एक ही अक्षर க் वह ध्वनि दर्शाता है, जिसे देवनागरी में तीन या चार अलग-अलग अक्षरों से लिखा जाता — और वास्तविक उच्चारण (/k/, /g/, /x/) शब्द में स्थिति के अनुसार तय होता है:
- शब्द की शुरुआत में க் [k] होता है
- शब्द के मध्य में க் [x] या [ɣ] होता है
- जब दोहराया जाता है तो க் [kː] होता है
- नासिक्य के बाद க் [ɡ] होता है
इसका अर्थ है कि तमिल की वर्तनी अत्यंत नियमित है, लेकिन सही उच्चारण के लिए संदर्भगत नियम जानना आवश्यक है।
ग्रंथ अक्षर: उधार लिए गए स्वर
/f/, /z/, /ʂ/, और /ʃ/ जैसी ध्वनियाँ, जो तमिल में स्वाभाविक रूप से नहीं पाई जातीं, उन्हें एक पूरक सेट ग्रंथ अक्षरों के माध्यम से लिखा जाता है, जो मुख्यतः संस्कृत से आए शब्दों और आधुनिक विदेशी शब्दों के लिए प्रयुक्त होते हैं। इन्हें स्कूलों में पढ़ाया जाता है, लेकिन इन्हें तमिल की मूल वर्णमाला से अलग माना जाता है।
व्याकरण एक नजर में
तमिल व्याकरण दो प्रमुख विशेषताओं से आकार लेता है: यह अत्यंत अग्लूटिनेटिव (मूल शब्दों पर प्रत्यय जोड़ना) है और इसमें SOV शब्द क्रम (कर्ता- कर्म- क्रिया, जैसे जापानी या तुर्की में) का पालन किया जाता है।
अग्लूटिनेशन
संज्ञा या क्रिया के मूल शब्द में एक के बाद एक प्रत्यय जोड़े जाते हैं, और प्रत्येक प्रत्यय का एक विशिष्ट व्याकरणिक अर्थ होता है। परिणामस्वरूप, एक ही तमिल शब्द वह अर्थ व्यक्त कर सकता है, जिसके लिए अंग्रेज़ी में पूरा वाक्यांश चाहिए:
sel- "जाना" (मूल)
sel-l-aa-tiru-pp-avar
"जो न जाने की स्थिति में है" / "अनुपस्थित व्यक्ति"
यह शब्द, sellātiruppavar (செல்லாதிருப்பவர்), “जो न जाने की स्थिति में है” को एक ही अग्लूटिनेटेड रूप में व्यक्त करता है — इसी तरह की संरचना तमिल को संक्षिप्त और प्रभावशाली अभिव्यक्ति के लिए प्रसिद्ध बनाती है।
कारक प्रणाली
संज्ञाएँ व्याकरणिक कारकों के अनुसार रूप बदलती हैं। पारंपरिक तमिल व्याकरण (तोल्काप्पियम) आठ कारकों को मान्यता देता है; आधुनिक विवरणात्मक व्याकरण आमतौर पर विश्लेषण के अनुसार आठ से दस कारकों की सूची देते हैं (विकिपीडिया: तमिल व्याकरण):
- कर्तृ कारक (अचिह्नित) — कर्ता
- कर्म कारक (-ai, -ஐ) — सीधा कर्म
- सम्प्रदान कारक (-ukku, -உக்கு) — अप्रत्यक्ष कर्म, “को”
- सम्बन्ध कारक (-udaya, -உடைய) — स्वामित्व
- करण कारक (-aal, -ஆல்) — “के माध्यम से”
- सहचर कारक (-odu, -ஓடு) — “के साथ”
- अधिकरण कारक (-il, -இல்) — “में / पर”
- अपादान कारक (-iliruntu, -இலிருந்து) — “से”
- संबोधन कारक — प्रत्यक्ष संबोधन
बहुवचन को किसी भी कारक प्रत्यय से पहले -kaḷ (-கள்) द्वारा चिह्नित किया जाता है।
विवेकी बनाम अविवेकी संज्ञाएँ
तमिल में गैर-मानव वस्तुओं के लिए व्याकरणिक लिंग नहीं होता। इसके बजाय, इसमें विवेकी/अविवेकी का भेद किया जाता है:
- विवेकी संज्ञाएँ — देवता और मनुष्य — क्रियाओं के साथ पुल्लिंग एकवचन, स्त्रीलिंग एकवचन, या बहुवचन के अनुसार मेल खाती हैं
- अविवेकी संज्ञाएँ — जानवर, वस्तुएँ, अमूर्त विचार — केवल एकवचन या बहुवचन के अनुसार मेल खाती हैं
यह भेद किसी भी वाक्य में क्रिया और विशेषणों के रूप को निर्धारित करता है।
क्रियाएँ
तमिल क्रियाएँ पुरुष, संख्या, लिंग, काल और विधि के अनुसार रूपांतरित होती हैं। तीन मुख्य काल होते हैं (भूत, वर्तमान, भविष्य), और प्रत्येक को पहलू (चल रही, पूर्ण, अभ्यस्त) के अनुसार और चिह्नित किया जाता है:
| काल | रूप (“गाना”) | अनुवाद |
|---|---|---|
| वर्तमान | paadukiṟēṉ (பாடுகின்றேன்) | मैं गा रहा हूँ |
| भूत | paadiṉēṉ (பாடினேன்) | मैंने गाया |
| भविष्य | paaduvēṉ (பாடுவேன்) | मैं गाऊँगा |
तमिल में क्या नहीं है
- समानता वाक्यों में कोई कॉपुला नहीं — तमिल में अस्तित्व सूचक क्रिया iru- (“होना/अस्तित्व में होना”) तो है, लेकिन अंग्रेज़ी के “is/am/are” जैसी कोई कॉपुला नहीं है जो दो संज्ञाओं को जोड़ती हो। “I am a teacher” को “मैं शिक्षक” (nāṉ āsiriyar, நான் ஆசிரியர்) के रूप में कहा जाता है।
- “to have” क्रिया नहीं है — स्वामित्व को “मेरे पास X है” की बजाय “मेरे पास X मौजूद है” के रूप में व्यक्त किया जाता है। “I have a horse” शाब्दिक रूप से “मेरे पास एक घोड़ा है” (eṉṉiṭam oru kutirai irukkiṟatu) बन जाता है।
- कोई संबंधवाचक सर्वनाम नहीं (कोई “who/which/that” नहीं) — संबंधवाचक अर्थ संबंधवाचक कृदंत के माध्यम से व्यक्त किया जाता है, जो प्रत्ययों के जोड़ से बनते हैं।
- कोई उपपद (articles) नहीं — “a” या “the” के लिए कोई समकक्ष नहीं है।
एक अंतर्निहित सम्मानसूचक प्रणाली
तमिल में एक अंतर्निहित सम्मानसूचक प्रणाली है जो क्रिया को सामाजिक स्तर के अनुसार बदलती है। बोली जाने वाली तमिल में:
- vā (வா) — “आओ” (अनौपचारिक, बच्चे या करीबी साथी के लिए)
- vāṅka (வாங்க) — “आइए” (सम्मानजनक, बुजुर्ग या अपरिचित के लिए)
- vāruṅkaḷ (வாருங்கள்) — “कृपया आइए” (औपचारिक साहित्यिक रूप)
शब्दावली
तमिल की मुख्य शब्दावली मुख्य रूप से मूल द्रविड़ है, जिसमें कई स्तरों पर उधार लिए गए शब्द शामिल हैं:
- संस्कृत से लिए गए शब्द — धार्मिक, वैज्ञानिक और साहित्यिक शब्दावली, सदियों के संपर्क के माध्यम से समाहित
- पुर्तगाली से लिए गए शब्द — 16वीं सदी से (जैसे, jaṉṉal, “खिड़की”, janela से)
- अंग्रेज़ी से लिए गए शब्द — आधुनिक तकनीकी और सामान्य बोलचाल में व्यापक (विशेष रूप से बोली जाने वाली तमिल में)
- अरबी और फारसी से लिए गए शब्द — मुख्य रूप से श्रीलंकाई तमिल और तमिल मुस्लिम समुदाय में
तमिल की एक स्थायी विशेषता, शास्त्रीय काल से, शुद्धतावाद की प्रवृत्ति रही है — कई संस्कृत मूल के शब्दों के लिए समानांतर मूल तमिल विकल्प मौजूद हैं, और मूल रूप को प्राथमिकता देने की सक्रिय परंपरा (कभी-कभी राजनीतिक रूप से प्रेरित) रही है।

सामान्य वाक्यांश और उदाहरण पाठ
यात्रियों और शुरुआती लोगों के लिए तमिल अभिवादन और उपयोगी वाक्यांश (Omniglot: Tamil phrases):
अभिवादन
| तमिल | लिप्यंतरण | अंग्रेज़ी |
|---|---|---|
| வணக்கம் | Vaṇakkam | नमस्ते / अभिवादन (औपचारिक, सार्वभौमिक) |
| காலை வணக்கம் | Kālai vaṇakkam | सुप्रभात |
| மாலை வணக்கம் | Mālai vaṇakkam | शुभ संध्या |
| நன்றி | Naṉṟi | धन्यवाद |
| பரவாயில்லை | Paravāyillai | ठीक है / कोई समस्या नहीं |
उपयोगी वाक्यांश
| தமிழ் | लिप्यंतरण | अंग्रेज़ी |
|---|---|---|
| எப்படி இருக்கிறீர்கள்? | Eppaḍi irukkiṟīrkaḷ? | आप कैसे हैं? (औपचारिक) |
| நான் நன்றாக இருக்கிறேன் | Nāṉ naṉṟāka irukkiṟēṉ | मैं ठीक हूँ |
| என் பெயர்… | Eṉ peyar… | मेरा नाम… है |
| ஆம் / இல்லை | Ām / Illai | हाँ / नहीं |
| எவ்வளவு? | Evvaḷavu? | कितना? |
| கழிப்பறை எங்கே? | Kaḻippaṟai eṅkē? | शौचालय कहाँ है? |
| எனக்கு புரியவில்லை | Eṉakku puriyavillai | मुझे समझ नहीं आया |
1–10 तक की संख्याएँ
| अंक | தமிழ் | लिप्यंतरण |
|---|---|---|
| 1 | ஒன்று | oṉṟu |
| 2 | இரண்டு | iraṇṭu |
| 3 | மூன்று | mūṉṟu |
| 4 | நான்கு | nāṉku |
| 5 | ஐந்து | aintu |
| 6 | ஆறு | āṟu |
| 7 | ஏழு | ēḻu |
| 8 | எட்டு | eṭṭu |
| 9 | ஒன்பது | oṉpatu |
| 10 | பத்து | pattu |
क्या तमिल सीखना कठिन है?
मूल अंग्रेज़ी बोलने वालों के लिए, तमिल को यू.एस. फॉरेन सर्विस इंस्टीट्यूट द्वारा श्रेणी III “कठिन भाषा” के रूप में वर्गीकृत किया गया है, जिसमें लगभग 44 सप्ताह (1,100 कक्षा घंटे) पूर्णकालिक अध्ययन की आवश्यकता होती है ताकि व्यावसायिक स्तर की दक्षता हासिल की जा सके। यह तमिल को हिंदी, रूसी, तुर्की और फिनिश जैसी भाषाओं के समूह में रखता है — और रोमांस भाषाओं (श्रेणी I, लगभग 600–750 घंटे) से काफी ऊपर। FSI की तालिकाओं में तमिल के आगे कभी-कभी एक तारांकन चिह्न (*) भी होता है, जो दर्शाता है कि इसे औसत से अधिक समय लगता है (FSI Language Difficulty Rankings)।
तमिल को कठिन बनाने वाले कारण
- गैर-लैटिन लिपि — 247 अक्षर सीखने होते हैं (हालाँकि इसकी संरचना नियमित है)
- डाइग्लोसिया — आपको पढ़ने/लिखने के लिए एक रूप और बोलचाल के लिए दूसरा रूप सीखना पड़ता है
- अग्लूटिनेटिव संरचना — लंबे शब्द जिनमें कई प्रत्यय जुड़े होते हैं
- नौ व्याकरणिक कारक
- रेट्रोफ्लेक्स व्यंजन (खासकर ழ் /ɻ/) जिनका अंग्रेज़ी में कोई समकक्ष नहीं है
- SOV (कर्ता–कर्म–क्रिया) वाक्य संरचना — जो अंग्रेज़ी के उलट है
- अंग्रेज़ी या अन्य प्रमुख यूरोपीय भाषाओं से कोई समान शब्द नहीं
तमिल को अपेक्षा से आसान बनाने वाले पहलू
- पूर्वानुमेय वर्तनी-से-ध्वनि नियम — एक बार जब आप स्टॉप्स के लिए संदर्भगत नियमों को आत्मसात कर लेते हैं, तो उच्चारण लिपि से स्वतः स्पष्ट हो जाता है
- तार्किक व्याकरण — संलग्नता (agglutination) लगातार नियमों का पालन करती है, अंग्रेज़ी के अनियमित क्रियाओं के विपरीत
- वस्तुओं के लिए कोई व्याकरणिक लिंग नहीं — फ़्रेंच या जर्मन की तुलना में कम मनमाने नियम
- कई संदर्भों में ‘to be’ क्रिया नहीं — वाक्य आश्चर्यजनक रूप से सरल हो सकते हैं
- मजबूत सीखने वाला समुदाय — ऑनलाइन और प्रमुख प्रवासी शहरों में दोनों जगह
क्या तमिल हिंदी जैसी है?
नहीं। यह एक आम गलतफहमी है। हिंदी इंडो-यूरोपीय है; तमिल द्रविड़ियन है। ये दोनों उतनी ही असंबंधित हैं जितनी अंग्रेज़ी और अरबी। तमिल की लिपि, व्याकरण, शब्दावली और ध्वनि प्रणाली हिंदी से पूरी तरह अलग हैं। तमिल की असली रिश्तेदार भाषाएँ मलयालम, तेलुगु, कन्नड़ और अन्य द्रविड़ियन भाषाएँ हैं।
तमिल सीखने के सुझाव
कहाँ से शुरू करें
- सबसे पहले अपना लक्ष्य तय करें। अगर आप परिवार से बात करना या तमिलनाडु में यात्रा करना चाहते हैं, तो बोली जाने वाली तमिल (Kodunthamil) पर ध्यान दें। अगर आप साहित्य, समाचार या आधिकारिक दस्तावेज़ पढ़ना चाहते हैं, तो आपको साहित्यिक तमिल (Senthamil) में निवेश करना होगा। ज़्यादातर शुरुआती लोग पहले बोली जाने वाली तमिल सीखते हैं।
- लिपि जल्दी सीखें। 12 स्वर + 18 व्यंजन पर एक या दो हफ्ते का केंद्रित अभ्यास पूरे 247-अक्षर प्रणाली को खोल देता है। रोमन लिप्यंतरण पर हमेशा निर्भर न रहें — यह असंगत है।
- रेट्रोफ्लेक्स ध्वनियों में महारत हासिल करें। ட், ண், ள், ழ் — ये वे ध्वनियाँ हैं जो तमिल उच्चारण को विशिष्ट बनाती हैं। मूल वक्ता तुरंत पहचान लेते हैं।
- फ़िल्मों और YouTube के साथ अभ्यास करें — तमिल सिनेमा दुनिया के सबसे जीवंत फ़िल्म उद्योगों में से एक है, और उपशीर्षक आसानी से उपलब्ध हैं।
अनुशंसित संसाधन
| संसाधन | किसके लिए सबसे अच्छा है |
|---|---|
| Preply / italki | मूल वक्ताओं के साथ 1-ऑन-1 ट्यूटरिंग |
| Tamil Virtual Academy | तमिलनाडु सरकार द्वारा मुफ्त ऑनलाइन पाठ्यक्रम |
| Omniglot Tamil | ऑडियो के साथ लिपि संदर्भ |
| American Institute of Indian Studies (AIIS) | भारत में गहन ग्रीष्मकालीन तमिल कार्यक्रम |
| HelloTalk / Tandem | तमिल मूल वक्ताओं के साथ भाषा विनिमय |
| सबटाइटल के साथ तमिल फिल्में | सुनने का अभ्यास + सांस्कृतिक संदर्भ |
यथार्थवादी समयरेखा
अगर आप रोज़ाना 30–60 मिनट लगातार अभ्यास करते हैं:
- 3 महीने — लिपि पढ़ना, लोगों का अभिवादन करना, खाना ऑर्डर करना, गिनती, बुनियादी बातचीत
- 6 महीने — सरल बोली तमिल में बातचीत करना, बुनियादी समाचार समझना
- 12 महीने — मध्यवर्ती प्रवाह, शब्दकोश के साथ छोटी कहानियाँ पढ़ना
- 2 साल — बोली या साहित्यिक तमिल में उन्नत प्रवाह (दोनों में महारत के लिए अधिक समय लगेगा)
- 5+ साल की समर्पित पढ़ाई, अक्सर औपचारिक पाठ्यक्रम के साथ — शास्त्रीय संगम साहित्य को आसानी से पढ़ना (यह एक विशेषज्ञता है, जिसमें आमतौर पर पढ़े-लिखे मूल वक्ताओं को भी प्रशिक्षण की आवश्यकता होती है)
एआई अनुवाद और तमिल
तमिल को NLP शोधकर्ता मध्यम संसाधित भाषा कहते हैं: यह अंग्रेज़ी या मंदारिन जितनी समर्थित नहीं है, लेकिन कई छोटी भाषाओं से काफी आगे है। आधुनिक मशीन अनुवाद सामान्य पाठ के लिए तमिल को ठीक-ठाक संभाल लेता है, लेकिन कई चुनौतियाँ अब भी बनी हुई हैं।
डाइग्लोसिया की समस्या
इंटरनेट पर उपलब्ध अधिकांश तमिल प्रशिक्षण डेटा Senthamil (औपचारिक) है — जैसे अखबारों के लेख, सरकारी दस्तावेज़, विकिपीडिया। लेकिन असल में उपयोगकर्ता जो टाइप और बोलते हैं, वह Kodunthamil (बोलचाल की भाषा) है। नतीजा: वेब टेक्स्ट पर प्रशिक्षित एआई मॉडल कभी-कभी अनौपचारिक सवाल का जवाब भी साहित्यिक तमिल में दे देते हैं, या चैट-स्टाइल इनपुट को समझ नहीं पाते (The Federal: Fitting Tamil into AI)। अच्छे तमिल एआई सिस्टम दोनों रजिस्टरों पर अलग-अलग प्रशिक्षण लेते हैं।
रूपविज्ञान (Morphology) की समस्या
एक तमिल क्रिया-मूल से हजारों रूपांतरित रूप बन सकते हैं। अंग्रेज़ी के लिए उपयुक्त मानक सबवर्ड टोकनाइज़ेशन, संलग्नक भाषाओं (agglutinative languages) के लिए कारगर नहीं है — यह तमिल के लंबे शब्दों को ऐसे टुकड़ों में तोड़ देता है जिनका व्याकरणिक अर्थ खो जाता है। संलग्नक संरचना के अनुरूप बेहतर टोकनाइज़र विकसित करना शोध का सक्रिय क्षेत्र है।
लिपि की समस्या
तमिल की संयुक्त-अक्षर प्रणाली के कारण एक दृश्य अक्षर को कई यूनिकोड कोडपॉइंट्स के रूप में एन्कोड किया जा सकता है। साधारण सिस्टम शब्दों को गलत तरीके से विभाजित कर सकते हैं। इसके अलावा, रेट्रोफ्लेक्स ḻ (ழ்) के लिए कोई स्पष्ट लैटिन लिप्यंतरण नहीं है — अलग-अलग लिप्यंतरण स्कीम में zh, ḻ, l̤, या r का प्रयोग होता है — जिससे प्रशिक्षण डेटा जटिल हो जाता है।
शास्त्रीय तमिल की समस्या
तमिल की 2,000 साल पुरानी सतत साहित्यिक परंपरा के कारण शास्त्रीय और आधुनिक रूपों में काफी अंतर है। केवल आधुनिक तमिल पर प्रशिक्षित एआई मॉडल Sangam काल की कविता या मध्यकालीन अभिलेखों को संभाल नहीं सकते। साहित्यिक शोध के लिए विशेष मॉडल की आवश्यकता होती है।
OpenL कैसे मदद करता है
OpenL अपनी 100+ भाषाओं की कवरेज में तमिल का समर्थन करता है। तमिल कार्य के लिए कुछ विशेष फीचर महत्वपूर्ण हैं:
- PDF, Word और दस्तावेज़ अनुवाद जो तमिल लिपि और जटिल यूनिकोड अक्षरों को सही ढंग से प्रस्तुत करता है — यह इसलिए महत्वपूर्ण है क्योंकि कई अनुवाद टूल तमिल के संयुक्त अक्षरों और मात्रा चिह्नों को सही से नहीं संभाल पाते हैं
- OCR अनुवाद मुद्रित तमिल पृष्ठों और स्क्रीनशॉट्स के लिए, जो पाठ्यपुस्तकों, साइनबोर्ड्स और पुराने अखबारों की स्कैनिंग में उपयोगी है
- इमेज अनुवाद हस्तलिखित या फोटो खींचे गए तमिल पाठ के लिए — यह आम जरूरत है क्योंकि तमिल सामग्री का बड़ा हिस्सा संरचित डिजिटल संग्रहों के बाहर मौजूद है
- ऑडियो और वीडियो अनुवाद तमिल स्पीच रिकग्निशन के साथ, जो तमिल फिल्म, गीत और व्याख्यान सामग्री के लिए सहायक है
महत्वपूर्ण दस्तावेज़ों के लिए — जैसे कानूनी अनुबंध, संगम युग का साहित्य, श्रीलंकाई तमिल बोली की सामग्री, या वह सामग्री जिसमें साहित्यिक/बोलचाल की भाषा का अंतर बनाए रखना जरूरी हो — मानव संपादन अनिवार्य है। मशीन द्वारा तैयार आउटपुट को केवल प्रारंभिक मसौदे के रूप में ही देखा जाना चाहिए।
OpenL ब्लॉग पर संबंधित गाइड्स:
- Word दस्तावेज़ का अनुवाद कैसे करें
- स्कैन किए गए PDF का अनुवाद कैसे करें
- 30 दिनों में नई भाषा कैसे सीखें
स्रोत
- तमिल भाषा — विकिपीडिया — वर्गीकरण, इतिहास और जनसांख्यिकी का व्यापक विवरण
- तमिल व्याकरण — विकिपीडिया — कारक, क्रिया रूपांतरण, और संयोजक संरचना
- तमिल लिपि — विकिपीडिया — वर्णमाला की संरचना, इतिहास और सुधार
- पुरानी तमिल — विकिपीडिया — संगम काल, तमिल ब्राह्मी अभिलेख
- ब्रिटानिका: तमिल भाषा — ऐतिहासिक कालखंड और वर्गीकरण
- कोलिपाकम आदि (2018), रॉयल सोसाइटी ओपन साइंस — द्रविड़ भाषा परिवार की उम्र ~4,500 वर्ष बताने वाला बायेसियन वंशावली अध्ययन
- वर्ल्डडेटा: विश्वभर में तमिल बोलने वाले — वक्ताओं के आंकड़े
- वे देश जहाँ तमिल आधिकारिक भाषा है — विकिपीडिया — देशों के अनुसार आधिकारिक स्थिति
- श्रीलंका की भाषाएँ — विकिपीडिया — श्रीलंकाई तमिल की स्थिति और 1987 का तेरहवां संशोधन
- डाइग्लोसिया — विकिपीडिया — तमिल एक पाठ्यपुस्तक डाइग्लोसिया उदाहरण के रूप में
- Omniglot: तमिल वाक्यांश — सामान्य वाक्यांश और उच्चारण
- FSI भाषा कठिनाई रैंकिंग — अमेरिकी विदेश विभाग — तमिल श्रेणी III में, लगभग 1,100 कक्षा घंटे
- The Federal: एआई में तमिल की भूमिका — तमिल NLP की चुनौतियाँ, डाइग्लोसिया और डिजिटल प्रतिनिधित्व की कमी


