Bay Alpine Club - <창칼 10> 한국어 신화 깨기

<창칼 10> 한국어 신화 깨기

최근에 여기 <회원들 이야기> 코너에 올린 나의 글들을 재미 삼아 Google 번역기로 영어 번역을 시켜 본 적이 있다.

문단을 복사하고 붙이기를 했을 때 번개보다 더 빠른 속도로 번역이 이루어졌다. 계산기 같은 속도에 입을 다물지 못했을 뿐만 아니라, 더욱 나를 놀라게 한 것은 번역의 질적 수준이었다. 기계가 번역을 했는데도 사람이 번역한 것처럼 정교하기가 그지 없었다. 과연 내가 쓴 복잡한 한국어 글들을 기계가 제대로 이해할까하고 얕잡아 봤는데, 아뿔사, 대상 글들을 거의 95% 수준으로 다 소화해 버리는 것이었다. 글을 정연하고도 쉽게 쓴 것도 아닌데 기계가 내 글의 복잡한 구절들을 다 파악하고 디코딩을 척척 해내버리다니. 호기심이 더 발동하여, ChatGPT에서도 같은 텍스트를 번역시켜 보았다. 그 속도는 구글 번역기만큼 빠르지 않았지만 정교함이나 세련됨은 구글 번역기보다 더 탁월났다. 이렇게 두 풀랫폼이 모두 AI 기술을 채택해서 한국어의 미묘하고도 정교한 표현들을 거의 다 훌륭하게 영어로 번역해내고 있는 걸 보면서 나는 아연해졌다. 더 나아가, 언어야 말로 최정점의 복잡한 인간의 인지 능력의 산물인데 이 언어 번역의 수준을 보면서 이제 AI가 인간의 두뇌를 거의 다 따라잡고 있다는 생각에 소름까지도 돋았다.

이제 언어가 달라도 AI의 도움을 받아 웬만한 것은 다 소통이 되는 시대가 된 것 같다. 한 때 번역은 컴퓨터 같은 기계가 할 수 있는 영역이 아니라는 인식이 만연했었고, 구글 번역기 초창기에는 번역이 너무 어설프고 엉성해서 과연 온전한 기계 번역이 가능할까 하는 의문도 많았었다. 그런데 어느 새 인공지능이 나와서 Neural Network 학습과 Deep Learning을 통해 해가 갈 수록 번역이 나아지고 세련되더니, 이제는 한국어의 미묘한 뜻까지도 쉽게 파악해서 번역해 버리는 단계까지 와버린 것이다. 좀 있으면 99.9%의 정확성으로 번역이 이루어지는 날이 빠른 시일내로 올 것 같다. 가끔 고향에 있는 내 숙소에 외국인들이 찾아 온다. 관리인 아주머니가 외국어 한 자도 모르지만 생판 모르는 외국인이 와도 이 번역기 덕분에 웬만한 소통을 다 한다고 하니, 기계 번역의 힘을 실감한다.

인공 지능의 언어 번역 얘기가 나온 김에 오늘은 우리가 늘상 사용하는 모국어인 한국어와 관련된 오해와 신화 한, 두 가지를 끄적거려 볼까한다.

먼저, 한국어를 지칭하는 용어에 대해서다. 한국어를 가르켜 ‘우리말’이라고도 하고, ‘한국말’이라고도 하고, 일부는 ‘한글'이라고 말하는 사람도 적지 않다. 그 외에 한국내 공교육에는 과목으로서 ‘국어'라는 용어가 쓰이고 한국어를 외국어로서 가르칠 때는 ‘한국어'라고 부른다. 언어학에서도 물론 ‘한국어'라고 한다.

훈민정음(한글 메뉴얼)의 첫 문장에 ‘우리말(씀)이 중국말과 달라…”라는 구절을 보면 ‘말'이라는 순수 국어 단어가 소리(speech)로써의 말을 예전부터 지칭한 것을 알 수 있다. 말소리(=한국말)를 적을 방법이 없어 글자로서 ‘정음’인 한글을 만들었다는 것이다. 그런데, 아이러니 하게도 '글자 매뉴얼' 제목을 '정문(正文)'이라하지 않고 '정음(正音)'이라고 한 것으로 보아 소리 언어와 글자를 혼동하는 그 깊은 신화의 뿌리가 여기서 벌써 시작된 것을 알 수 있다. 물론, 세종대왕의 학자들이 만든 글자를 지칭해서 ‘한글’이라는 용어를 쓰기 시작한 것은 훨씬 뒤인 20세기 초(주시경 선생님에 의한 것)이긴 하지만, ‘말’이라는 말은 예전부터 말소리를 지칭했던 게 분명해 보인다. 하지만 글자를 가르켜 음(音, 소리)이라고 해 버림으로서 불행히도 말과 글의 혼동이 글자가 만들어진 시작점부터 기인한 것도 알 수 있다.

이런 혼란은 오늘까지 이어져서 안타깝게도 이 말을 받아적는 문자인, '한글'의 위대성을 강조하고 이를 사랑하는 마음이 지나치다 보니 많은 사람들이 한국말 혹은 한국어를 지칭할 때 ‘한글'이라고 말하는 사람들을 많이 만난다. 즉, 소리 언어와 글자를 섞어 버리는 것이다. '요즘 한글을 배워요?', ‘학교에서 한글을 가르치세요?’ 등이 그 예라면 예이다. 특히 미국 같은 외국에서 교포 자녀를 위한 ‘한글 학교'가 퍼지면서 그런 인식이 더 부추기어진 감도 없지 않다. 애초에 이 학교들이 만들어질 때 ‘한국어 학교'로 불리었으면 이런 인식이 확장되지는 않았을 거 같고 학교를 글자만 배우는 장소로 전락을 시키지 않았을 것 같다. 언어는 글자 이전에 말인 것이다. 물론, 집에서 한국말을 어느 정도 배운 교포 학생들이 '한글(=한국어)' 학교에 가서 글자를 배우게 한다는 일차적은 욕구는 이해를 하지만 글자 이전에 말을 제대로 배워야 하는 것이고 주말학교에서 글자외에 말도 가르쳐야 하는 것이니 "한국어 학교"라고 해야 맞다고 본다.

외국어에 반해서 국내어라는 뜻으로서, ‘국어'는 그 용어의 정당성을 얻는 것처럼 보인다. 그렇지만 학교 과목으로써 National Language라고 지칭하는 것은 복수 언어들이 사용되는 인도, 말레지아, 필리핀 같은 아시아의 일부 국가들에서 그 국민들이 사용하는 여러 복수 언어 중, 국가 공식 언어(official language) 하나를 지칭할 때 쓰는 것으로서, 비교적 단일한 민족에다 단일한 언어를 쓰는 한국에서 굳이 ‘국어’라고 할 필요가 있었을까 싶다. 단어에 국수주의적인 냄새도 묻어나기도 하니, 한국인, 한국 땅, 한국 상품이라고 하듯 그냥 과목 이름도 '한국어'라고 하는 게 낫지 않나 싶다. 더 나아가 한국 역사 과목인 국사도 '한국사'라고 하는 게 더 맞아 보인다.

말이 소리 언어이니 만치 ‘한국말'이라는 것도 중국말, 일본말처럼 발화된 스피치 언어를 지칭할 때 쓰는 게 맞는데, 음성 언어와 글자 언어를 통칭해서 한국어를 뜻하는 용어로 한국말이라고 쓰는 이들도 꽤 많다. “한국말을 참 잘 하시네요”는 잘 어울리지만 “한국말을 공부하고 있어요"라든가 “한국말은 참 어려운 언어예요"라고 하면 좀 어색해진다. 즉, ‘한국어를 공부하고 있’고 ‘한국어가 어렵다’라고 말해야 듣기에 더 좋다. 특히, ‘한국말 문법도 배워요'라고 하는 것 보다는 ‘한국어 문법도 배워요'라고 하는 게 더 자연스럽다.

고유명사로서 ‘우리말’은 우리집, 우리가족, 우리나라처럼 ‘우리'라는 단어를 좋아하는 집단주의 선호 현상에서 나오는 문화적 현상이기에 더 언급해서 무엇하랴.

가끔은 한국어는 영어에 비해 훨씬 비논리적인 언어라고 생각하거나 말하는 사람들을 접한다. 과연 그럴까?

일단, 생각처럼 비논리적인 언어였다만, 앞에서 언급한 대로 구글 번역기 같은 AI가 그렇게 정연하게 번역을 잘 해 낼 수가 없을 것이다. 반대로 말해, 인공지능이 번역을 기똥차게(?) 잘해 낸다는 것은 한국어가 그만큼 논리적이라는 얘기도 되는 것이다.

두 번째로는 논리학과 논리적인 개념이 서양 철학에서 발달된 만큼 이런 논리 개념들을 자주 표출해온 영어 같은 서양 언어가 더 논리적으로 들릴 수는 있다고 본다. 하지만, 한국어도 논리를 담는 그릇으로 손색이 없는 언어이다. 이는, 엄밀히 말하면 논리의 문제가 아니고 언어 유형과 구조의 문제라고 생각한다.

유형적으로 영어는 ‘분석어’로써 미묘한 화자의 다양한 심리적 태도를 고정된 수의 조동사 (may, could.. etc)와 인토네이션을 통해 전달한다. 반면, 한국어는 ‘교착어’로써 문장 어미를 다양하게 바꿈으로써 그것을 전달한다. ~(으)ㄹ까 해요, ~(으)ㄹ래요, ~(으)ㄹ게요, ~(으)ㄹ거에요, ~겠어요, ~(으)려고 해요, 등등이 그 예이다. 복잡하기는 하지만 어떤 측면에서는 다양한 어미가 많아서 다양한 미묘한 뉘앙스의 화자의 심리적 태도와 의도들을을 보다 더 정교하고도 다양하게 전달을 하니 더 섬세한 언어라고 주장할 수도 있을 것이다. 반대로 배우는 사람 입장에서는 배워야 할 것도 많고 뜻도 헥갈리는 어미들이 많으니 소통 효율이 떨어진다고도 주장할 수도 있다. 다 보기 나름이다.

구조적으로는 가장 기본적인 것 하나만 든다면, 영어는 말하는 초점이 먼저 나오고 한국어는 초점이 뒤에 나오는 언어이다. 기술적으로 Head-first, Head-final이라는 말을 쓴다. 재미있는 것은 이게 문장 구조뿐만 아니라 사람들의 사고방식과 생활 습관까지도 반영한다는 것이다. 즉, 영어처럼 선초점 언어는 기본 문장구조 (동사(Head) + 목적어), ‘I like you’ 나 관계사절, (초점명사 + 관계대명사), ‘the person(Head) who I like’ 처럼, 말하는 초점 혹은 핵심을 앞으로 당겨서 먼저 얘기하는데, 영어 화자들이 얘기를 하는 방식도 두괄식을 선호해서, 핵심을 먼저 말하고 그에 대한 배경 설명이나 이유 설명은 나중에 펼쳐낸다. 이뿐만 아니라 생활 속에서도, 사람 이름인 경우, 초점인 first name을 먼저 말하고 배경이 되는 family name은 나중에, 그리고 주소도 개인 이름 먼저 쓰고 마을, 군, 주, 나라 순서로 마이크로 단위에서 매크로 단위로 넓혀 간다. 한국어는 이와 반대로 '후초점(Head-final)' 언어로서 ‘나 너를 좋아해(H)’/ (내가) 좋아하는 사람(H) 처럼 초점이나 핵심은 나중에 말하고, 담화나 이야기를 펼치는 방식도 미괄식을 좋아해서, 배경을 풀어낸 후에 핵심은 나중에 말하는 경향이 있다. 위에서 든 이름이나 주소를 말하는 방식도 핵심을 나중에 말하는 방식으로 영어와 거꾸로다.

즉, 문화와 사물을 인식하는 방법의 차이가 언어 구조에도 반영이 된 것이라 참 흥미롭다. 스피드 시대에 두괄식이 미괄식보다 언어 소통 방식에 있어 더 효율적인 측면이 있다고 주장할 수도 있겠지만 이는 담화구조의 차이일 뿐 어느 언어가 더 소통에 유리하다, 더 논리적이다라고 연결시키는 건 무리한 견해라고 볼 수 밖에 없다.

이외에도 한국어에 대해서 장점으로서, 혹은 약점으로서의 이런 저런 오해나 잘못 알려진 '신화'들이 꽤 많이 있는데 지면 관계 상 다 소개하지 못함이 아쉽다. 언어는 사회, 문화, 화자의 정서 등을 반영하고 더 나아가 화자들의 인지 구조까지도 담아 낸다고 한다. 한 나라의 언어를 보면 그 나라의 문화가 보이고 정서가 보이고 심지어 생각하는 방식까지도 보인다는 것이다. 이런 유기체적인 현상으로서 언어를 들여다 보는 것은 그래서 흥미롭고 유익한 일이다. 더 나아가, 이렇게 한 언어에 다양한 요소들이 복잡하게 얽혀있는 양상이라든지, 두 언어 간의 서로 다른 구조와 유형 같은 많은 차이를 초월해서 이제 인공지능이 언어들을 넘나들면서 서로 연결시켜주는 능력을 보이고 있다는 것을 우리는 간단하지 않게 지켜봐야 할 것 같다. 한국어가 점점 세계화돼 가고 있고, 인공지능이 나와 세상에서 가장 정교하고 복잡한 인류 언어 중의 하나인 한국어를 기계가 따라 잡고 있는 이 시점에서 우리는 보다 큰 틀에서 한국어를 들여다 보고, 또 이와 관련된 여러 현상을 고찰해 보는 것은 아주 뜻깊은 일이 될 것이다.

<창칼 10> 한국어 신화 깨기

Shortcut

Articles