16 עובדות שפה מפתיעות שנשמעות כמו בדיחה (אבל הן אמיתיות)
TABLE OF CONTENTS
חלק מאלה כל כך מוזרים שתחשבו שהמצאנו אותם. לא המצאנו. כל אחת ואחת מגובה במחקר בלשני.
אוצר מילים
1. ל-”Run” יש 645 משמעויות — ולאדם אחד לקח 9 חודשים לכתוב את כולן.
הערך הארוך ביותר ב-Oxford English Dictionary כבר אינו “set”. הלקסיקוגרף Peter Gilliver הקדיש תשעה חודשים לעריכת הפועל “run” — 645 מובנים נפרדים המונעים על ידי מכונות (programs run), נוזלים (rivers run), בדים (colors run), ועשרות תחומים נוספים. לערך “set” יש כ-430 משמעויות וכעת הוא נמצא במקום השלישי, אחרי “run” וגם “put”.
2. המילה הארוכה ביותר בעולם דורשת יותר מ-3 שעות להגיד.
התשובה תלויה במה נחשב כ”מילה”. אם מאפשרים מינוח כימי, החלבון titin משתרע על 189,819 אותיות. Guinness World Records מעניק את הכתר לצירוף סנסקריט בן 195 תווים משיר מהמאה ה-16 — 428 אותיות בתעתיק. ו-German, כשפה agglutinative, יכולה לערום שמות עצם ללא הגבלה, כלומר אין מילה גרמנית הכי ארוכה בכלל.
3. ב-Arabic אין 400 מילים ל”גמל”. גם ל-Inuit אין 100 מילים ל”שלג”.
שתי הטענות הן אותו מיתוס בלשני בלבוש שונה. הנתון של “400 מילים לגמל” — שחזר על עצמו באנציקלופדיות ובספרי לימוד במשך עשורים — סופר כל ביטוי תיאורי, וריאנט ניב וצורה נגזרת כ”מילה” נפרדת. לפי ההיגיון הזה, ל-English יש מאות “מילים” למים (liquid, moisture, dew, condensation, precipitation, rainwater, seawater…). שני המיתוסים הופרכו על ידי בלשנים כ”מונעים יותר מבורות אתנוצנטרית מאשר ממחקר”.
4. ליותר מ-20 מילים ב-English יש משמעות הפוכה לעצמן.
הן נקראות contronyms (או Janus words, על שם האל הרומי דו-הפרצופי). Sanction יכול להיות גם “לאשר” וגם “להטיל סנקציות”. Cleave יכול להיות גם “לבקע” וגם “להיצמד”. Dust יכול להיות גם “להסיר אבק” וגם “לפזר אבק על”. Oversight יכול להיות גם “פיקוח זהיר” וגם “טעות רשלנית”. Off יכול להיות גם “מופעל” (the alarm went off) וגם “מכובה” (turn it off). ההקשר עושה את כל העבודה.
מילים הן מוזרות מספיק. אבל דקדוק — הכללים הבלתי נראים שאנו מצייתים להם בלי לחשוב — נהיה מוזר עוד יותר.
דקדוק שיפוצץ לכם את המוח
5. יש שפה שאין בה מספרים — אפילו לא “אחת” ו”שתיים”.
Pirahã, המדוברת על ידי כמה מאות אנשים ב-Amazon הברזילאי, היא חסרת מילים לכמויות מדויקות. הבלשן Daniel Everett תיעד רק שלושה מונחים יחסיים: hói (כמות קטנה), hoí (כמות גדולה יותר), ו-baágiso (הרבה). כשחוקרי MIT בחנו זאת ב-2008 על ידי הצגת חפצים בסדר יורד (10 ← 1), הדוברים השתמשו ב-hói — לכאורה “אחת” — לכמויות של עד שש. הם לא סופרים. הם מעריכים.
6. בחלק מהשפות, אי אפשר להגיד משפט אחד בלי לחשוף איך אתם יודעים אותו.
לכרבע מהשפות בעולם יש evidentiality מחייבת — מערכת דקדוקית שמאלצת דוברים לסמן את מקור המידע שלהם. ב-Tariana, המדוברת ב-Amazon, “José שיחק כדורגל” דורש אחת מחמש סיומות פועל: -ka (ראיתי את זה), -mahka (שמעתי את זה), -nihka (הסקתי את זה מראיות), -sika (אני מניח מידע כללי), או -pidaka (מישהו סיפר לי). בלי אחת, המשפט אינו שלם דקדוקית — ושימוש בסיומת הלא נכונה נחשב ללא ישר.
7. ל-Mandarin Chinese אין עבר. או עתיד. אין בכלל זמנים דקדוקיים.
פעלים ב-Chinese לעולם אינם מוטים לזמן. במקום זאת, זמן מבוטא דרך מילות הקשר (昨天 “אתמול”, 明天 “מחר”), סמני אספקט (了 le לפעולות שהושלמו), והגיון בריא. המשפט “我去” (wǒ qù) יכול להיות “אני הולך”, “הלכתי”, או “אלך” תלוי לחלוטין במתי אתם אומרים אותו ומה שמסביבו. כמה שפות Mayan ו-West Greenlandic פועלות באותה צורה — מוכיחות שזמן דקדוקי הוא אופציונלי, לא אוניברסלי.
8. ב-Japanese אין כמעט מילות גנאי — וזה הופך אותה לאכזרית יותר, לא פחות.
ב-Japanese חסרות “מילים אסורות” מהסוג שמזעזע ב-English. Kuso (“לעזאזל/שטויות”) ו-baka (“טיפש”) הן כל כך מתונות שהן מופיעות ללא צנזורה ב-anime לילדים. אבל Japanese פוגעת אחרת — דרך בחירת כינוי גוף. יש יותר מתריסר דרכים להגיד “אתה”, ובחירה לא נכונה היא הרסנית. Temē לא אומר שום דבר מגונה מילולית, אבל השימוש בו הוא המקבילה החברתית לקרוא למישהו חתיכת זבל. כפי שאמר בלשן אחד: חלק מהשפות המציאו את הפטיש לקללות; Japanese המציאה את האזמל הניתוחי.
דקדוק אומר לכם מה להגיד. אבל כתיבה וצליל קובעים איך זה מגיע לעולם — וגם כאן, שפות בוחרות בדרכים שונות לגמרי.
צליל וסמל
9. האלפבית הקטן בעולם כולל רק 12 אותיות.
Rotokas, המדוברת על ידי כ-4,300 איש באי Bougainville ב-Papua New Guinea, מסתדרת עם A, E, G, I, K, O, P, R, S, T, U, V בלבד. אלה 5 תנועות ולמעשה רק 6 צלילי עיצור. השוו זאת ל-English (26 אותיות) או Khmer (74 אותיות) — הפער מדהים.
10. Click consonants קיימות באופן טבעי רק במקום אחד על פני כדור הארץ — Africa.
צליל ה-”tsk-tsk” הזה שאתם משמיעים כדי להביע אי-הסכמה? זהו צליל דיבור לגיטימי בשפות ה-Khoisan של דרום Africa, שם עד 70% מהמילים מתחילות ב-click. לחלק מהשפות במשפחה זו יש מעל 100 עיצורים הודות לשילובים של חמישה סוגי click בסיסיים (dental, lateral, alveolar, palatal, bilabial) עם דפוסי קול וזרימת אוויר שונים. Xhosa ו-Zulu שאלו clicks דרך מגע — אבל מחוץ ל-Africa, אף שפה טבעית לא משתמשת בהן.
11. שפות tonal אינן הרוב — הן בערך 42% מהשפות בעולם.
הטענה המצוטטת תכופות ש-”60–70% מהשפות הן tonal” שגויה. מסד הנתונים ThoT Database (Maslinsky & Vydrin, 2025) ניתח 7,674 שפות ומצא ש-42.8%~ הן tonal. הנתון הישן הגיע מדגימה מוטה. ובכל זאת, אלה מעל 3,000 שפות שבהן גובה הצליל משנה את משמעות המילה — ב-Mandarin, mā (妈, אמא) ו-mǎ (马, סוס) נבדלות רק בטון.
12. Chinese היא מערכת הכתב העתיקה ביותר שעדיין בשימוש — בהפרש גדול.
הסימניות הסיניות מתוארכות לכתובות oracle bone inscriptions מסביבות 1200 לפני הספירה, מה שהופך את מערכת הכתב לבת יותר מ-3,200 שנה. Egyptian hieroglyphs עתיקות יותר אך נכחדו. Sumerian cuneiform עתיקה יותר אך נכחדה. הסימניות הסיניות התפתחו, פשטו והתפשטו — אך קורא מודרני עדיין יכול לזהות צורות שאבות אבותיו חרטו על שריון צב לפני שלושת אלפים שנה. ל-Greek יש את המסורת הכתובה-ומדוברת הרציפה הארוכה ביותר (Linear B מסביבות 1700~ לפני הספירה), אך האלפבית הנוכחי שלה הוא “רק” מהמאה ה-8 לפני הספירה.
לחלק מהשפות יש תיעוד כתוב בן אלפי שנים. אחרות נעלמות לפני שאי פעם נכתבות.
אבוד ומצא
13. ל-Basque אין קרובי משפחה ידועים. אף לא אחד. היא האחרונה מסוגה.
Basque (Euskara) היא השפה ה-pre-Indo-European היחידה ששרדה במערב אירופה. היא דוברה ב-Pyrenees לפני שאבותיהם של English, Spanish, French ו-Hindi הגיעו. כל ניסיון לקשר אותה למשפחת שפות אחרת — Iberian, Berber, Caucasian — נכשל. הכתובת הבסקית העתיקה ביותר, Hand of Irulegi (המאה ה-1 לפני הספירה), נקראת sorioneku — בבסקית מודרנית zorioneko, שמשמעה “בר מזל”. השפה שרדה את הכיבוש ה-Roman, מאות שנים של לחץ מ-Spanish ו-French, והאיסור המפורש של Franco. כיום מדברים אותה כ-700,000 איש. כמו Welsh, שפה אירופאית עתיקה נוספת ששרדה כנגד כל הסיכויים, Basque חווה כעת תחייה תרבותית.
14. ל-Esperanto יש דוברים ילידיים — בערך 1,000 מהם.
אנשים שנולדו למשפחות דוברות Esperanto נקראים denaskuloj. הראשונה הייתה Emilia Burillo, שנולדה ב-Spain ב-1904. כיום, בערך 1,000 עד 2,000 איש ברחבי העולם למדו Esperanto מלידה — בדרך כלל במשפחות בין-לאומיות שבהן ההורים הכירו דרך תנועת ה-Esperanto. הם תמיד דו-לשוניים לפחות (לאף מדינה אין Esperanto כשפה רשמית), וכמה משפחות נשאו את המסורת במשך ארבעה דורות. זוהי השפה המתוכננת היחידה שפיתחה קהילת דוברים ילידיים.
15. שפה אחת מתה כל שבועיים.
UNESCO מעריכה שיש כ-8,300 שפות בעולם. כ-40% — מעל 3,000 — נמצאות בסכנת הכחדה. מאז 1950, לפחות 230 שפות נכחדו, והקצב הנוכחי הוא בערך אחת כל 14 ימים. עד שנת 2100, בלשנים צופים ש-50% עד 90% מכל השפות עלולות להיעלם, כל אחת לוקחת איתה דרך שאין לה תחליף לראות את העולם.
16. המסמך המתורגם ביותר בהיסטוריה אינו ה-Bible — הוא רק באורך 1,800 מילים.
Universal Declaration of Human Rights מחזיקה בשיא Guinness World Records עבור המסמך המתורגם ביותר, זמין ביותר מ-525 שפות. ההכרזה, שאומצה על ידי ה-UN ב-1948, מכילה 30 סעיפים בכ-1,800 מילים. ה-Bible תורגם במלואו ליותר שפות (700+), אך UDHR זוכה כמסמך יחיד ושלם הזמין במגוון הרחב ביותר של שפות — מ-Abkhaz ועד Zulu.
UDHR קיים כעת ביותר מ-525 שפות הודות למתרגמים שעובדים מעבר למחסומי שפה. OpenL תומכת היום ב-100+ מהן.
עוד מוזרויות שפה: 12 untranslatable words that will change how you see the world
Sources
- OED — “Run” as most complex word — New York Times interview with OED editor
- Longest words — Wikipedia — Cross-language comparison of longest words
- Pirahã number experiment — MIT-led team finds language without numbers (2008)
- Evidentiality — The Grammar of Knowledge — Aikhenvald & Dixon, Oxford University Press
- Japanese swearing — Language Log — Discussion of Japanese profanity mechanisms
- Rotokas language — Wikipedia — Smallest modern alphabet
- Click languages — Britannica — Overview of click consonants
- ThoT Database — Tonal status of world languages (Maslinsky & Vydrin, 2025)
- Basque language — BBC Travel — The mysterious origins of Europe’s oldest language
- Native Esperanto speakers — Ethnologue — Denaskuloj demographics
- Endangered languages — UNESCO — UNESCO Bangkok 2025 report
- Most translated document — Guinness World Records — UDHR record
- Contronyms — MIT — Seth Teller’s auto-antonym collection
- Color terms — The Conversation — Why languages differ in color vocabulary


