16 आश्चर्यजनक भाषा तथ्य जो झूठे लगते हैं (लेकिन असली हैं)
TABLE OF CONTENTS
इनमें से कुछ इतने अजीब हैं कि आपको लगेगा हमने इन्हें बना लिया। हमने नहीं बनाया। हर एक तथ्य भाषाई शोध द्वारा समर्थित है।
शब्दावली
1. “Run” के 645 अर्थ हैं — और एक व्यक्ति को इन सबको लिखने में 9 महीने लगे।
Oxford English Dictionary की सबसे लंबी प्रविष्टि अब “set” के लिए नहीं है। कोशकार Peter Gilliver ने क्रिया “run” को संकलित करने में नौ महीने बिताए — मशीनों द्वारा संचालित 645 अलग-अलग अर्थ (programs run), तरल पदार्थ (rivers run), कपड़े (colors run), और दर्जनों अन्य क्षेत्र। “set” की प्रविष्टि में लगभग 430 अर्थ हैं और अब यह तीसरे स्थान पर है, “run” और “put” दोनों के पीछे।
2. दुनिया का सबसे लंबा शब्द बोलने में 3 घंटे से अधिक समय लेता है।
इसका उत्तर इस बात पर निर्भर करता है कि आप “शब्द” के रूप में क्या गिनते हैं। यदि आप रासायनिक नामकरण की अनुमति दें, तो प्रोटीन titin 189,819 अक्षरों का है। Guinness World Records 16वीं सदी की एक कविता के 195-अक्षर वाले संस्कृत यौगिक को ताज पहनाता है — लिप्यंतरण करने पर 428 अक्षर। और German, एक agglutinative भाषा होने के नाते, संज्ञाओं को बिना सीमा के जोड़ सकती है, जिसका अर्थ है कि कोई सबसे लंबा German शब्द ही नहीं है।
3. Arabic में ऊँट के लिए 400 शब्द नहीं हैं। और न ही Inuit के पास बर्फ के लिए 100 शब्द हैं।
दोनों दावे एक ही भाषाई मिथक हैं जो अलग-अलग वेशभूषा में है। “400 ऊँट शब्द” का आंकड़ा — जो दशकों तक विश्वकोशों और पाठ्यपुस्तकों में दोहराया गया — हर वर्णनात्मक वाक्यांश, बोली रूप, और व्युत्पन्न रूप को एक अलग “शब्द” के रूप में गिनता है। उस तर्क से, English में पानी के लिए सैकड़ों “शब्द” हैं (liquid, moisture, dew, condensation, precipitation, rainwater, seawater…)। दोनों मिथकों को भाषाविदों ने “विद्वता से अधिक नृजातीय अज्ञानता से प्रेरित” कहकर खारिज कर दिया।
4. 20 से अधिक English शब्द अपने स्वयं के विपरीतार्थक हैं।
इन्हें contronyms (या Janus words, दोमुंहे रोमन देवता के नाम पर) कहा जाता है। Sanction का अर्थ “अनुमोदन” और “दंडित करना” दोनों हो सकता है। Cleave का अर्थ “अलग करना” और “चिपकना” दोनों हो सकता है। Dust का अर्थ “धूल हटाना” और “धूल छिड़कना” दोनों हो सकता है। Oversight का अर्थ “सावधानीपूर्वक निगरानी” और “लापरवाही भरी गलती” दोनों हो सकता है। Off का अर्थ “सक्रिय” (the alarm went off) और “निष्क्रिय” (turn it off) दोनों हो सकता है। संदर्भ ही सब कुछ तय करता है।
शब्द अपने आप में काफी अजीब हैं। लेकिन व्याकरण — वे अदृश्य नियम जिनका हम बिना सोचे पालन करते हैं — और भी विचित्र हो जाता है।
व्याकरण जो आपका दिमाग घुमा दे
5. एक ऐसी भाषा है जिसमें कोई संख्या नहीं है — “एक” और “दो” भी नहीं।
Pirahã, जो ब्राज़ीलियाई Amazon में कुछ सौ लोगों द्वारा बोली जाती है, में सटीक मात्राओं के लिए कोई शब्द नहीं है। भाषाविद् Daniel Everett ने केवल तीन सापेक्ष शब्दों का दस्तावेजीकरण किया: hói (थोड़ी मात्रा), hoí (बड़ी मात्रा), और baágiso (बहुत सारे)। जब MIT के शोधकर्ताओं ने 2008 में वस्तुओं को घटते क्रम (10 → 1) में दिखाकर इसका परीक्षण किया, तो वक्ताओं ने hói — कथित रूप से “एक” — का उपयोग छह तक की मात्राओं के लिए किया। वे गिनती नहीं कर रहे हैं। वे अनुमान लगा रहे हैं।
6. कुछ भाषाओं में, आप यह बताए बिना एक भी वाक्य नहीं बोल सकते कि आपको वह बात कैसे पता चली।
दुनिया की लगभग एक चौथाई भाषाओं में अनिवार्य evidentiality है — एक व्याकरणिक प्रणाली जो वक्ताओं को अपनी जानकारी के स्रोत को चिह्नित करने के लिए मजबूर करती है। Amazon में बोली जाने वाली Tariana में, “José ने फुटबॉल खेला” के लिए पाँच क्रिया प्रत्ययों में से एक की आवश्यकता होती है: -ka (मैंने देखा), -mahka (मैंने सुना), -nihka (मैंने साक्ष्य से अनुमान लगाया), -sika (मैंने सामान्य ज्ञान से मान लिया), या -pidaka (किसी ने मुझे बताया)। एक के बिना, वाक्य व्याकरणिक रूप से अधूरा है — और गलत का उपयोग करना बेईमानी माना जाता है।
7. Mandarin Chinese में कोई भूतकाल नहीं है। न ही भविष्यकाल। न ही कोई काल बिल्कुल।
Chinese क्रियाएँ कभी भी समय के लिए रूप नहीं बदलतीं। इसके बजाय, समय को संदर्भ शब्दों (昨天 “yesterday,” 明天 “tomorrow”), पहलू चिह्नकों (了 le पूर्ण क्रियाओं के लिए), और सामान्य ज्ञान के माध्यम से व्यक्त किया जाता है। वाक्य “我去” (wǒ qù) का अर्थ “मैं जाता हूँ,” “मैं गया,” या “मैं जाऊँगा” हो सकता है जो पूरी तरह से इस बात पर निर्भर करता है कि आप इसे कब कहते हैं और इसके आसपास क्या है। कई Mayan भाषाएँ और West Greenlandic भी इसी तरह काम करती हैं — साबित करती हैं कि काल वैकल्पिक है, सार्वभौमिक नहीं।
8. Japanese में लगभग कोई अपशब्द नहीं है — और यह इसे और अधिक क्रूर बनाता है, कम नहीं।
Japanese में उस तरह के “निषिद्ध शब्द” नहीं हैं जो English में चौंकाते हैं। Kuso (“धत्/बकवास”) और baka (“मूर्ख”) इतने हल्के हैं कि ये बच्चों के anime में बिना सेंसर के दिखाई देते हैं। लेकिन Japanese अलग तरीके से आहत करता है — सर्वनाम चयन के माध्यम से। “तुम” कहने के एक दर्जन से अधिक तरीके हैं, और गलत का चयन करना विनाशकारी है। Temē का शाब्दिक रूप से कोई अश्लील अर्थ नहीं है, लेकिन इसका उपयोग करना किसी को कचरा कहने के सामाजिक समकक्ष है। जैसा कि एक भाषाविद् ने कहा: कुछ भाषाओं ने गाली देने के लिए हथौड़े का आविष्कार किया; Japanese ने सर्जिकल स्कैल्पल का आविष्कार किया।
व्याकरण आपको बताता है कि क्या कहना है। लेकिन लेखन और ध्वनि यह निर्धारित करते हैं कि यह दुनिया तक कैसे पहुँचता है — और यहाँ भी, भाषाएँ बेतहाशा अलग-अलग विकल्प चुनती हैं।
ध्वनि और प्रतीक
9. दुनिया की सबसे छोटी वर्णमाला में केवल 12 अक्षर हैं।
Rotokas, जो Papua New Guinea के Bougainville Island पर लगभग 4,300 लोगों द्वारा बोली जाती है, केवल A, E, G, I, K, O, P, R, S, T, U, V से काम चलाती है। यह 5 स्वर और प्रभावी रूप से केवल 6 व्यंजन ध्वनियाँ हैं। इसकी तुलना English (26 अक्षर) या Khmer (74 अक्षर) से करें — यह अंतर चौंकाने वाला है।
10. Click consonants प्राकृतिक रूप से पृथ्वी पर केवल एक ही स्थान पर मौजूद हैं — Africa।
वह “tsk-tsk” ध्वनि जो आप अस्वीकृति दिखाने के लिए बनाते हैं? यह दक्षिणी Africa की Khoisan भाषाओं में एक वैध वाक् ध्वनि है, जहाँ 70% तक शब्द एक click से शुरू होते हैं। इस परिवार की कुछ भाषाओं में पाँच बुनियादी click प्रकारों (dental, lateral, alveolar, palatal, bilabial) के विभिन्न स्वर और वायुप्रवाह पैटर्न के साथ संयोजन के कारण 100 से अधिक व्यंजन हैं। Xhosa और Zulu ने संपर्क के माध्यम से clicks उधार लिए — लेकिन Africa के बाहर, एक भी प्राकृतिक भाषा उनका उपयोग नहीं करती।
11. Tonal भाषाएँ बहुमत नहीं हैं — ये दुनिया की लगभग 42% भाषाएँ हैं।
अक्सर उद्धृत किया जाने वाला दावा कि “60–70% भाषाएँ tonal हैं” गलत है। ThoT Database (Maslinsky & Vydrin, 2025) ने 7,674 भाषाओं का विश्लेषण किया और पाया कि ~42.8% tonal हैं। पुराना आंकड़ा पक्षपाती नमूने से आया था। फिर भी, यह 3,000 से अधिक भाषाएँ हैं जहाँ पिच किसी शब्द का अर्थ बदल देती है — Mandarin में, mā (妈, माँ) और mǎ (马, घोड़ा) केवल स्वर में भिन्न हैं।
12. Chinese दुनिया की सबसे पुरानी लेखन प्रणाली है जो अभी भी उपयोग में है — बहुत अधिक अंतर से।
Chinese अक्षर लगभग 1200 BCE के oracle bone inscriptions से उत्पन्न हुए हैं, जो इस लेखन प्रणाली को 3,200 वर्ष से अधिक पुराना बनाता है। Egyptian hieroglyphs पुराने हैं लेकिन विलुप्त हैं। Sumerian cuneiform पुराना है लेकिन विलुप्त है। Chinese अक्षर विकसित हुए, सरलीकृत हुए, और फैल गए — लेकिन एक आधुनिक पाठक अभी भी उन रूपों को पहचान सकता है जिन्हें उनके पूर्वजों ने तीन सहस्राब्दी पहले कछुए के खोल पर उकेरा था। Greek के पास सबसे लंबी निरंतर लिखित-और-मौखिक परंपरा है (Linear B लगभग ~1700 BCE से), लेकिन इसकी वर्तमान वर्णमाला “केवल” 8वीं शताब्दी BCE से है।
कुछ भाषाओं के लिखित रिकॉर्ड सहस्राब्दियों पीछे जाते हैं। अन्य कभी लिखे जाने से पहले ही गायब हो रही हैं।
खोया और पाया
13. Basque का कोई ज्ञात रिश्तेदार नहीं है। कोई नहीं। यह अपनी तरह की आखिरी है।
Basque (Euskara) पश्चिमी यूरोप में एकमात्र जीवित pre-Indo-European भाषा है। यह Pyrenees में तब बोली जाती थी जब English, Spanish, French, और Hindi के पूर्वज आए थे। इसे किसी अन्य भाषा परिवार — Iberian, Berber, Caucasian — से जोड़ने का हर प्रयास विफल रहा है। सबसे पुराना Basque शिलालेख, Hand of Irulegi (पहली शताब्दी BCE), sorioneku पढ़ा जाता है — आधुनिक Basque zorioneko, जिसका अर्थ “भाग्यशाली” है। यह भाषा Roman विजय, Spanish और French के सदियों के दबाव, और Franco के स्पष्ट प्रतिबंध से बच गई। आज लगभग 700,000 लोग इसे बोलते हैं। Welsh की तरह, एक और प्राचीन यूरोपीय भाषा जो सभी बाधाओं के बावजूद बची रही, Basque अब एक सांस्कृतिक पुनर्जागरण का अनुभव कर रही है।
14. Esperanto के मातृभाषी हैं — लगभग 1,000।
Esperanto-भाषी परिवारों में जन्मे लोगों को denaskuloj कहा जाता है। पहली Emilia Burillo थीं, जो 1904 में Spain में पैदा हुई थीं। आज, दुनिया भर में लगभग 1,000 से 2,000 लोगों ने जन्म से Esperanto सीखी — आमतौर पर अंतरराष्ट्रीय परिवारों में जहाँ माता-पिता Esperanto आंदोलन के माध्यम से मिले। वे हमेशा कम से कम द्विभाषी होते हैं (किसी भी देश में Esperanto आधिकारिक भाषा नहीं है), और कुछ परिवारों ने इस परंपरा को चार पीढ़ियों तक आगे बढ़ाया है। यह एकमात्र निर्मित भाषा है जिसने एक मातृभाषी समुदाय विकसित किया है।
15. हर दो सप्ताह में एक भाषा मर जाती है।
UNESCO का अनुमान है कि दुनिया में लगभग 8,300 भाषाएँ हैं। लगभग 40% — 3,000 से अधिक — संकटग्रस्त हैं। 1950 के बाद से, कम से कम 230 भाषाएँ विलुप्त हो चुकी हैं, और वर्तमान दर लगभग हर 14 दिन में एक है। 2100 तक, भाषाविद् अनुमान लगाते हैं कि सभी भाषाओं का 50% से 90% गायब हो सकता है, प्रत्येक अपने साथ दुनिया को देखने का एक अपूरणीय तरीका ले जाती है।
16. इतिहास का सबसे अधिक अनुवादित दस्तावेज़ Bible नहीं है — यह केवल 1,800 शब्द लंबा है।
Universal Declaration of Human Rights के पास सबसे अधिक अनुवादित दस्तावेज़ का Guinness World Record है, जो 525 से अधिक भाषाओं में उपलब्ध है। 1948 में UN द्वारा अपनाया गया, इसमें लगभग 1,800 शब्दों में 30 अनुच्छेद हैं। Bible का पूर्ण रूप से अधिक भाषाओं (700+) में अनुवाद किया गया है, लेकिन UDHR एक एकल, संपूर्ण दस्तावेज़ के रूप में सबसे व्यापक भाषाओं में उपलब्ध होने का रिकॉर्ड जीतता है — Abkhaz से Zulu तक।
UDHR अब 525 से अधिक भाषाओं में मौजूद है, जो भाषा बाधाओं के पार काम करने वाले अनुवादकों की बदौलत है। OpenL आज उनमें से 100+ भाषाओं का समर्थन करता है।
अधिक भाषा विचित्रताएँ: 12 untranslatable words that will change how you see the world
Sources
- OED — “Run” as most complex word — New York Times interview with OED editor
- Longest words — Wikipedia — Cross-language comparison of longest words
- Pirahã number experiment — MIT-led team finds language without numbers (2008)
- Evidentiality — The Grammar of Knowledge — Aikhenvald & Dixon, Oxford University Press
- Japanese swearing — Language Log — Discussion of Japanese profanity mechanisms
- Rotokas language — Wikipedia — Smallest modern alphabet
- Click languages — Britannica — Overview of click consonants
- ThoT Database — Tonal status of world languages (Maslinsky & Vydrin, 2025)
- Basque language — BBC Travel — The mysterious origins of Europe’s oldest language
- Native Esperanto speakers — Ethnologue — Denaskuloj demographics
- Endangered languages — UNESCO — UNESCO Bangkok 2025 report
- Most translated document — Guinness World Records — UDHR record
- Contronyms — MIT — Seth Teller’s auto-antonym collection
- Color terms — The Conversation — Why languages differ in color vocabulary


