가짜처럼 들리지만 (실제로 진짜인) 놀라운 언어 사실 16가지

OpenL Team 6/8/2026
가짜처럼 들리지만 (실제로 진짜인) 놀라운 언어 사실 16가지

TABLE OF CONTENTS

너무 이상해서 우리가 지어냈다고 생각할 만한 것들도 있습니다. 하지만 아닙니다. 모든 것은 언어학 연구에 의해 뒷받침됩니다.

어휘

1. “Run”에는 645가지 의미가 있으며—한 사람이 그것을 모두 작성하는 데 9개월이 걸렸다.

옥스퍼드 영어 사전의 가장 긴 항목은 더 이상 “set”이 아닙니다. 사전 편찬자 Peter Gilliver는 동사 “run”을 집필하는 데 9개월을 보냈습니다—프로그램이 실행되고(programs run), 강이 흐르고(rivers run), 색이 번지고(colors run), 그리고 수십 개의 다른 영역에 걸쳐 645개의 뚜렷한 의미를 포괄했습니다. “set” 항목은 약 430개의 의미를 가지고 있으며 현재 “run”과 “put”에 이어 3위입니다.

2. 세계에서 가장 긴 단어는 읽는 데 3시간 이상 걸린다.

답은 무엇을 “단어”로 간주하느냐에 달려 있습니다. 화학 명명법을 허용한다면, 단백질 titin은 189,819자에 달합니다. 기네스 세계 기록은 16세기 시에 나오는 195자의 산스크리트어 복합어에 왕관을 수여합니다—전사하면 428글자입니다. 그리고 독일어는 교착어로서 명사를 무한히 결합할 수 있어, 가장 긴 독일어 단어란 존재하지 않습니다.

3. 아랍어에는 “낙타”를 뜻하는 400개의 단어가 없다. 이누이트족에게도 “눈”을 뜻하는 100개의 단어가 없다.

두 주장은 옷만 바꿔 입은 동일한 언어학적 신화입니다. 수십 년 동안 백과사전과 교과서에서 반복된 “낙타 400 단어”라는 숫자는 모든 설명적 구문, 방언 변형, 파생 형태를 별개의 “단어”로 세는 방식입니다. 그 논리라면, 영어에는 “물”을 뜻하는 수백 개의 “단어”가 있는 셈입니다(liquid, moisture, dew, condensation, precipitation, rainwater, seawater…). 두 신화 모두 언어학자들에 의해 “학문보다는 자민족 중심적 무지에서 비롯된 것”이라고 반박되었습니다.

4. 20개 이상의 영어 단어는 자기 자신의 반대말이기도 하다.

이를 contronym(또는 두 얼굴의 로마 신을 따서 Janus words)이라고 합니다. Sanction은 “승인하다”와 “제재하다” 모두를 의미할 수 있습니다. Cleave는 “쪼개다”와 “밀착하다” 모두를 의미할 수 있습니다. Dust는 “먼지를 제거하다”와 “먼지를 뿌리다” 모두를 의미할 수 있습니다. Oversight는 “세심한 감독”과 “부주의한 실수” 모두를 의미할 수 있습니다. Off는 “작동하다”(the alarm went off)와 “정지하다”(turn it off) 모두를 의미할 수 있습니다. 문맥이 모든 것을 결정합니다.

단어만으로도 충분히 이상합니다. 하지만 문법—우리가 생각 없이 따르는 보이지 않는 규칙—은 훨씬 더 이상합니다.

두뇌를 깨는 문법

5. 숫자가 전혀 없는 언어가 있다—“하나”와 “둘”조차도 없다.

브라질 아마존에서 수백 명이 사용하는 Pirahã어에는 정확한 수량을 나타내는 단어가 없습니다. 언어학자 Daniel Everett는 단 세 개의 상대적 용어만을 기록했습니다: hói(소량), hoí(더 많은 양), baágiso(많음). MIT 연구진이 2008년 물체를 내림차순(10 → 1)으로 제시하며 테스트했을 때, 화자들은 hói—표면적으로는 “하나”—를 최대 여섯 개의 수량에 대해 사용했습니다. 그들은 세는 것이 아니라 추정하는 것입니다.

6. 어떤 언어에서는 어떻게 알게 되었는지 밝히지 않고는 단 한 문장도 말할 수 없다.

세계 언어의 약 4분의 1은 의무적 evidentiality(증거성)—화자가 정보의 출처를 표시하도록 강제하는 문법 체계—를 가지고 있습니다. 아마존에서 사용되는 Tariana어에서 “José가 축구를 했다”는 다섯 가지 동사 접미사 중 하나가 필요합니다: -ka(내가 직접 보았다), -mahka(내가 들었다), -nihka(내가 증거를 통해 추론했다), -sika(일반적 지식으로 추정했다), -pidaka(누군가 내게 말해주었다). 접미사가 없으면 문장은 문법적으로 불완전하며—잘못된 것을 사용하는 것은 부정직한 것으로 간주됩니다.

7. 표준 중국어에는 과거형이 없다. 미래형도 없다. 시제 자체가 전혀 없다.

중국어 동사는 절대 시제에 따라 변화하지 않습니다. 대신 시간은 문맥어(昨天 “어제”, 明天 “내일”), 상 표지(완료된 동작을 나타내는 了 le), 그리고 상식으로 표현됩니다. “我去”(wǒ qù)라는 문장은 말하는 시점과 주변 상황에 따라 “I go”, “I went”, “I will go”를 의미할 수 있습니다. 여러 마야어와 서그린란드어도 같은 방식으로 작동합니다—시제가 보편적인 것이 아니라 선택적임을 증명하는 것입니다.

8. 일본어에는 욕설이 거의 없다—그리고 그것이 더 온건한 것이 아니라, 더 잔인하게 만든다.

일본어에는 영어에서 충격을 주는 종류의 “금지된 단어”가 부족합니다. Kuso(“젠장/짜증”)와 baka(“바보”)는 너무 순해서 어린이 애니메이션에서 검열 없이 등장합니다. 그러나 일본어는 다른 방식으로 공격합니다—대명사 선택을 통해서입니다. “당신”을 말하는 방법은 12가지 이상 있으며, 잘못된 것을 고르는 것은 파괴적입니다. Temē는 문자 그대로 외설적인 의미는 없지만, 사용하는 것은 사회적으로 상대를 쓰레기라고 부르는 것과 같습니다. 한 언어학자의 표현대로: 욕설을 위해 큰 망치를 발명한 언어도 있지만, 일본어는 외과용 메스를 발명했다.

문법은 무엇을 말할지 알려준다. 그러나 글과 소리는 그것이 어떻게 세상에 전달될지 결정한다—그리고 여기서도 언어는 극적으로 다른 선택을 한다.

소리와 기호

9. 세계에서 가장 작은 알파벳은 고작 12글자뿐이다.

파푸아뉴기니 부건빌 섬에서 약 4,300명이 사용하는 Rotokas어는 A, E, G, I, K, O, P, R, S, T, U, V만으로 운영됩니다. 5개의 모음과 실질적으로 6개의 자음뿐입니다. 영어(26자)나 크메르어(74자)와 비교하면—그 차이는 놀랍습니다.

10. 흡착음(클릭 자음)은 지구상에서 단 한 곳에만 자연적으로 존재한다—아프리카.

당신이 못마땅함을 표시할 때 내는 “쯧쯧” 소리? 그것은 남아프리카 Khoisan 제어에서 정당한 음성으로, 단어의 최대 70%가 흡착음으로 시작합니다. 이 어족의 일부 언어는 다섯 가지 기본 흡착음 유형(치음, 설측음, 치경음, 경구개음, 양순음)과 다양한 발성 및 기류 패턴의 조합 덕분에 100개가 넘는 자음을 가지고 있습니다. Xhosa어와 Zulu어는 접촉을 통해 흡착음을 차용했습니다—하지만 아프리카 이외에서는 자연 언어 중 이를 사용하는 경우가 하나도 없습니다.

11. 성조 언어는 다수를 차지하지 않는다—세계 언어의 약 42%이다.

자주 인용되는 “언어의 60-70%가 성조 언어”라는 주장은 틀렸습니다. ThoT 데이터베이스(Maslinsky와 Vydrin, 2025)는 7,674개 언어를 분석하여 약 42.8%가 성조 언어임을 발견했습니다. 기존 수치는 편향된 샘플링에서 비롯된 것입니다. 그럼에도 불구하고, 이는 3,000개 이상의 언어에서 음높이가 단어의 의미를 바꾼다는 것을 의미합니다—표준 중국어에서 (妈, 어머니)와 (马, 말)는 오직 성조로만 구별됩니다.

12. 중국어는 여전히 사용 중인 가장 오래된 문자 체계다—큰 차이로.

한자는 기원전 1200년경 갑골문으로 거슬러 올라가며, 이 문자 체계는 3,200년 이상의 역사를 가지고 있습니다. 이집트 상형문자는 더 오래되었지만 소멸했습니다. 수메르 쐐기문자는 더 오래되었지만 소멸했습니다. 한자는 진화하고, 간소화되고, 확산되었습니다—하지만 현대 독자는 여전히 3천 년 전 조상들이 거북 등껍질에 새긴 형태를 알아볼 수 있습니다. 그리스어는 가장 긴 연속적인 문자 및 구어 전통(Linear B, 기원전 1700년경~)을 가지고 있지만, 현재의 알파벳은 “겨우” 기원전 8세기부터입니다.

수천 년 전으로 거슬러 올라가는 문자 기록을 가진 언어가 있는 반면, 기록되기도 전에 사라지고 있는 언어들도 있습니다.

사라진 것과 발견된 것

13. Basque어는 알려진 친척 언어가 없다. 전혀 없다. 그것은 마지막 생존자다.

Basque어(Euskara)는 서유럽에서 유일하게 살아남은 선인도유럽어입니다. 영어, 스페인어, 프랑스어, 힌디어의 조상이 도착하기 전부터 피레네 산맥에서 사용되었습니다. 다른 어족—Iberian어, Berber어, 캅카스 제어—과 연결하려는 모든 시도는 실패했습니다. 가장 오래된 Basque어 비문인 이루레기의 손(기원전 1세기)에는 sorioneku라고 쓰여 있습니다—현대 Basque어 zorioneko, “운이 좋은”이라는 뜻입니다. 이 언어는 로마의 정복, 수세기 동안의 스페인어와 프랑스어의 압박, 그리고 프랑코의 명시적 금지를 모두 견뎌냈습니다. 오늘날 약 70만 명이 사용합니다. 역경을 딛고 살아남은 또 다른 고대 유럽 언어인 Welsh처럼, Basque어는 현재 문화적 부흥을 겪고 있습니다.

14. 에스페란토에는 원어민이 있다—약 1,000명이다.

에스페란토어 사용 가정에서 태어난 사람들은 denaskuloj라고 불립니다. 최초의 인물은 Emilia Burillo로, 1904년 스페인에서 태어났습니다. 오늘날 전 세계적으로 약 1,000명에서 2,000명이 태어날 때부터 에스페란토를 배웠습니다—보통 부모가 에스페란토 운동을 통해 만난 국제 가정에서입니다. 그들은 항상 최소한 이중 언어 구사자이며(어떤 나라도 에스페란토를 공용어로 하지 않습니다), 일부 가정은 4대째 전통을 이어가고 있습니다. 원어민 커뮤니티를 발전시킨 유일한 인공 언어입니다.

15. 2주마다 하나의 언어가 사라진다.

UNESCO는 세계에 약 8,300개의 언어가 있다고 추정합니다. 약 40%—3,000개 이상—가 멸종 위기에 처해 있습니다. 1950년 이후, 최소 230개의 언어가 멸종했으며, 현재 속도는 약 14일에 하나입니다. 2100년까지 언어학자들은 모든 언어의 50%에서 90%가 사라질 수 있으며, 각각이 대체할 수 없는 세계를 보는 방식을 함께 가져갈 것이라고 예측합니다.

16. 역사상 가장 많이 번역된 문서는 성경이 아니다—겨우 1,800단어다.

세계인권선언(UDHR)은 가장 많이 번역된 문서로 기네스 세계 기록을 보유하고 있으며, 525개 이상의 언어로 이용 가능합니다. 1948년 UN에서 채택되어 약 1,800단어로 30개의 조항을 포함하고 있습니다. 성경은 더 많은 언어(700개 이상)로 완역되었지만, UDHR은 Abkhaz어에서 Zulu어까지 가장 광범위한 언어로 이용 가능한 단일 완전 문서로서 승리합니다.

세계인권선언은 현재 언어 장벽을 넘어 일하는 번역가들 덕분에 525개 이상의 언어로 존재합니다. OpenL은 그중 100개 이상의 언어를 현재 지원하고 있습니다.

더 많은 언어의 특이점들: 세상을 보는 방식을 바꿀 번역 불가능한 12가지 단어

Sources