혁신적 기술이 만드는 새로운 미래, 인공지능 번역의 시대

조회수 2018. 1. 11. 08:20 수정
번역beta Translated by kaka i
번역중 Now in translation
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 다양한 분야의 재밌고 유익한 콘텐츠를 카카오 플랫폼 곳곳에서 발견하고, 공감하고, 공유해보세요.

외국어 실력이 '능력'인 시대

기독교의 경전인 성경에 ‘바벨탑’ 이야기가 있다. 원래 하나의 언어를 쓰던 인간들이 신처럼 높아지려고 함께 높은 탑을 쌓다가, 진노한 신이 그들의 언어를 서로 다르게 만들어 결국 다 쌓지 못 하고 사방으로 흩어졌다는 이야기다. 구글이나 네이버가 요즘 그 바벨탑을 다시 쌓고 싶어서는 아니겠지만, 인공지능 번역으로 언어의 장벽을 허물고 있다. 번역기 성능은 예전보다 더 정확해졌고, 번역기의 인공지능은 언어 고유의 문맥과 맥락을 이해한다. 자고로, 혁신적 기술은 새로운 미래를 만들기 마련이다. 인공지능 번역 기술의 발전은 언어의 장벽이 있던 시대와 없는 시대를 가름할 것이다. 이제 그 새로운 시대의 도래를 맞이해본다.

▲ 서로 말이 안 통하면 같이 일을 할 수 없으니, 바벨탑은 결국 다 만들어지지 못 했다

외국어 실력이 ‘능력’인 시대 

외국어 실력은 곧 그 사람의 능력이다. 다른 사람은 못 하는 일을 하기 때문이다. 다른 사람이 못 알아듣는 말을 알아듣고, 다른 사람이 모르는 글을 알아본다. 심지어 다른 사람이 모르는 말도 할 줄 알아서 다른 사람이 무슨 말인지 모르는 말을 하는 사람과 대화도 할 줄 안다. 지난 강화도 조약 이후, 해외 교류가 잦아진 오늘날 이 시대에, 언제 어디서 어떻게 들이닥칠지 모르는 외국문물에 대응하기 위해서는 외국어 실력이 필요하다. 여행을 가든, 사업을 하든, 대기업에 취직하든, 중소기업에 취직하든, 심지어 혼자 공부를 하려고 해도 해외 서적을 보거나 유학을 가기 위해 외국어 실력이 필요하다.


그래서 우리나라를 기준으로, 외국어 실력을 갖추기 위해 거의 대부분의 어린이들이 영문도 모른 채 영어부터 도전 당한다. 기업에서는 승진의 길목마다 영어가 버티고 서 있다. 무역, 관광, 숙박업 등 해외 문물과 보다 직접적으로 관련된 업종에서는 영어뿐 아니라 일본어, 중국어, 스페인어 등 주요 언어를 동시에 요구하기도 한다. 

▲ 감사하다고 말하고 싶어도 언어의 장벽을 뛰어넘어야 가능하다

언어는 일종의 장벽이다. 바벨론 탑을 쌓던 사람들은 그 장벽에 막혀 일을 그만두었다. 해외여행을 갈 때 두려움이 엄습하는 이유는, 그 언어의 장벽 때문이다. 인재 채용에서 외국어 실력이 기본적으로 필요한 이유는, 일단 그 장벽을 없애야 무슨 일이든 시킬 수 있기 때문이다. 언어가 장벽으로 느껴지는 이유는 우리가 글로벌 시대에 살고 있기 때문이다. 물론 신라도 아랍 상인들과 교역을 했고, 고려 시대에도 송나라에 인삼을 실어 날랐으며, 조선 조정에도 통역관이 있었지만, 지금처럼 외국과 우리나라가 가까운 시대는 없었다. 세계화든 글로벌이든, 우리는 그 어느 시대보다 더 치열하게 외국과 외국인, 외국 문물과 밀접한 시대를 살고 있다. 


새로운 시대를 만드는 기술 

증기기관을 만든 사람이 식민지를 개척했다고 말할 순 없다. 하지만 증기기관은 제국주의 시대를 만들었다. 증기선은 돛단배보다 월등히 강력한 군함이 되었고, 그 군함은 유럽 이외의 세계를 침략하는 첨병이 되었기 때문이다. 지금 우리는 온라인이 지배하는 시대를 살고 있다. 좀 더 집적된 회로를 개발했기 때문에 가능했고, 구리 전선보다 더 빠르게 전력을 전달한 전선을 개발했기 때문에 가능했으며, 끊기지 않는 무선 통신망을 개발했기 때문에 가능했다. 우리가 역사적으로 지나왔던 수많은 ‘시대’는 금속 제련 기술의 발달에서부터 지금까지 모두 ‘기술’의 발전으로 도래했다.

▲ 막부시대 일본에 처음 등장한 미국 증기선은 참으로 무시무시하게 생겼다

‘인공지능 번역’이란 말에는 크게 두 가지 기술이 등장한다. ‘인공지능’은 사람이 아님에도 불구하고 스스로 생각해서 처리하는 알고리즘 기술을 말하고, ‘번역’이라 함은 외국어를 이해하여 우리말로 전환하는 사람의 기술을 일컫는다. 결국 ‘인공지능 번역’이란, 외국어를 스스로 생각해서 번역하는 행위를 사람이 하지 않는다는 뜻이다. 이전까지 번역은 인간 고유의 영역이었다. ‘새로운 시대’는 이전에 있던 것을 없애는가 하면, 이전에 없던 것을 만들어낸다. 인공지능 번역 기술은, 이전에 사람의 힘을 필요로 하던 ‘번역’이란 영역에서 사람을 제거할 것이다. 하지만 아직은 인공지능이 사람을 100% 대체할 수 있을지는 확실하지 않다. 오히려 이보다 더 중요한 사실은, 앞서 말한 ‘외국어 실력’에 대해 드디어 의문을 제기할 때가 왔다는 것이다. 


인공지능 번역의 등장

사실 번역기는 꽤 옛날부터 있었다. 한편으론 사람들의 조롱거리가 되기도 했다. ‘I love you’를 ‘나는 사랑 너’라고 알려주었기 때문이다. ‘I love you’가 ‘난 널 사랑해’가 될 수 있도록 개발자들은 컴퓨터에 수많은 경우의 수를 입력시켜야 했다. 단어와 구문별로 미리 내용을 저장시켜놓아야 했다. 사람이 미리 만들어놓은 상황에 맞는 상황이 되어야 정확히 번역할 수 있었다. 하지만 당연히 모든 경우의 수를 모두 저장해놓을 수는 없다. 결국 이러한 통계기반 번역(SMT: Statistical Machine Translation)은 제갈량이 아닌 이상 늘 한계에 봉착할 수밖에 없었다.


스마트워치가 아직 새로운 시대를 만들지 못 하고 있는 이유는, 자기가 오늘 몇 걸음을 걸었는지 궁금하지 않은 사람에겐 필요하지 않기 때문이다. 이전의 번역기 역시 늘 정확하지가 않았기 때문에 굳이 그 번역에 의존할 필요가 없었다. 어렸을 때부터 끊임없이 도전 당한 결과 어느 정도 만들어진 내 영어 실력이 아직은 그보다 나았다. 하지만 인공신경망 번역(NMT: Neural Machine Translation)은 이전과 다르다. 통계기반 번역이 단어에서 구문까지만 해석할 수 있는 것에 비해 인공신경망 번역은 문장 자체를 이해하고 앞뒤 맥락과 순서에 따라 최종적 의미를 파악하기 때문이다. 예를 들어, ‘나는 오늘 아침, 아침 빵을 먹었다’를 영어로 번역할 때, ‘오늘 아침’에 따른 종결어미가 ‘먹었다’라는 과거형임을 인지하고, ‘eat’을 ‘ate’로 바꿔준다. 여기서 ‘오늘 아침’을 빼면 다시 ‘ate’를 ‘eat’로 전환한다. ‘아침’은 ‘morning’으로, ‘아침 빵’은 ‘breakfast’로 구분하여 의역한다. 그리고 모든 단어와 구문을 사람이 저장시키지 않아도, 인공지능이 한번 학습하면 비슷한 다른 상황에도 스스로 적용한다. 구글이 ‘알파고’에 적용한 ‘머신러닝(Machine Learning’ 기술이 기반이 되기 때문이다. 

▲ 인간의 뉴런처럼, 방대한 데이터를 서로 촘촘하게 연결하여 스스로 학습하고 깨달을 수 있도록 인공지능은 발전하고 있다

머신러닝은 명시적 규칙을 일일이 미리 저장하지 않아도, 표면적이지만 방대한 데이터만 있다면 새로운 질문에 대해 컴퓨터가 잠재적 규칙을 발견하고 정답을 찾는 기술이다. 1950년대 등장하여, 2000년대 중반, ‘딥 러닝(Deep Learning)’ 기술로 획기적인 전환점을 마련한 이후 알파고까지 이르렀다. TPU의 단일 버전과 분산 버전, 그리고 수많은 학습 기술의 발전은 인공지능을 더욱 무섭게 만들고 있다. 기술은 편리함의 중력에 의해 발전한다. 문장을 타이핑해야 번역할 수 있었던 것이 어느새 말과 소리만 듣고 통역을 하기 시작했다. 그리고 이제는 증강현실 기술이 접목되어 사진을 찍어도 이미지로 번역이 가능하다. 심지어 2015년 CVPR (IEEE Conference on Computer Vision and Pattern Recognition, 컴퓨터 비전 및 패턴 인식 컨퍼런스)에서는 사진만 보고 그것을 영어로 묘사하여 문장으로 나타내는 알고리즘 기술이 등장했다. 머지않아 인공지능 번역은 어떠한 방식이든, 어떠한 결과로든 자유자재로 인간의 욕구에 화답할 것이다. 

▲ 인디고고를 통해 클라우드펀딩이 진행되었던 동시통역기 파일럿

지난 2월, 국내 한 대학교에서 ‘인간 번역사’와 ‘인공지능 번역기’의 대결이 펼쳐졌다. 60점 만점에 인간은49점, 구글 번역은 28점, 네이버 파파고는 17점을 기록했다. 그런데 놀라운 것은 속도의 차이였다. 인간들이 한 지문을 번역하는데 약 50분이 걸린 반면 인공지능은 네 개 지문을 10여 분 만에 번역한 것이다. 이미 속도에서 인간을 제압한 인공지능이 정확성 면에서 인간보다 앞서게 될 것은 시간문제다. 구글 ‘알파고’가 2016년 바둑으로 인간을 제압한 것은, 체스로 인간을 제압한 1997년 IBM ‘딥 블루’ 이후 약 20년 만의 일이었다. 알파고는 2015년 중국 프로기사 2단과의 대국에서 승리한 ‘알파고 판’ 이후, 이세돌과의 대국에서 승리한 ‘알파고 리’, 커제 9단을 이긴 ‘알파고 마스터’, 그리고 ‘알파고 리’와 바둑 대결에서 100승 무패를 기록한 ‘알파고 제로’까지 발전했다. 판에서 제로까지 불과 2년이 걸렸다.


현재, 인공지능 번역의 모습 

모든 미래를 다 만들고 있다 해도 과언이 아닌 구글은 인공지능 번역의 선두주자다. 이전까지의 통계기반 번역에서 탈피하여 본격적인 인공지능 번역을 2007년부터 시작했다. 현재 지원되는 언어가 영어부터 줄루어까지 103개에 이른다. 물론 라틴계열 언어에 최적화되어 있어서 우리나라 사람들에겐 여전히 온갖 오역과 엉터리 논란의 중심에 서 있지만 적어도 그 방대한 데이터만큼은 세계 최고다. 우리나라의 모든 미래를 다 만들 것 같은 네이버도 인공지능 번역에 박차를 가하고 있다. 2016년부터 ‘파파고’ 서비스를 시작했고 놀라운 속도로 발전하고 있다. 특히 우리나라 말과 최근 언어습관의 트렌드를 더 자세하게 솎아낸다.


한국정보통신연구원(ETRI)이 개발한 ‘지니톡’은 2012년 출시되어 다양한 국제행사에서 특히 주목받고 있다. 2014년 인천 아시안게임에서 자동 통역 서비스를 제공했고 2018년 평창 동계올림픽에서는 더 많은 언어를 추가하여 ‘언어장벽 없는 올림픽’을 목표로 하고 있다. ‘만통’은 ㈜소프트파워에서 올해 초 출시한 번역 어플로, 주요 10개국 언어가 지원된다. 국내 공공기관과 기업에서 자동번역 업무제휴를 맺는 등 활발히 사용되고 있다.


이상 네 개 인공지능 번역의 차이는 무엇인지 예를 들어 살펴보고자 한다. 최근 우리말 언어습관의 유행이 반영되며, 혼동을 야기할 수 있는 표현이 담긴 동일한 우리말 문장을 입력해보았다. 각 번역기가 영어 문장으로 번역하는 결과값은 아래와 같다.

[테스트문구] 
‘나는 오늘 베프랑 같이 레알 대박 빵을 먹었다’

▲ 구글 번역은 이전에 입력했던 문장을 바로 쓸 수 있도록 준비해놓는다.

▶구글 번역 결과 : I ate Real Bread with Beef Franc today

▲ 네이버 파파고는 문자를 문자로, 음성을 문자로, 음성을 음성으로, 이미지를 문자로 번역해주는 툴을 제공한다.

▶파파고 번역 결과 : Today, I ate REAL bread with my best friend

▲ 지니톡도 파파고와 유사한 형태의 번역 툴을 제공하는데, 각 툴에 대한 친절한 설명까지 써놓았다.

▶지니톡 번역 결과 : I ate the Real big win bread with Veff today

▲ 만통은 문자 대 문자를 번역할 수 있는 툴을 음성인식과 동시에 제공하여 양쪽 다 직관적으로 한 번에 처리할 수 있게 만들었다.

▶만통 번역 결과 : I ate Real Bread with Beef Franc today.


문제는 ‘베프랑’이란 부분이다. 구글과 만통은 ‘베프’와 발음이 유사한 ‘Beef’를 등장시킨 동시에 ‘프랑’이란 단어를 별개로 인식하여 ‘Franc’을 도출해냈다. 프랑스의 옛 화폐단위 ‘프랑’과 철자가 동일한 단어다. 반면 파파고는 ‘레알’이란 최근 우리말 언어습관의 트렌드를 반영하여 ‘REAL’이라는 고유명사 처리를 했고 ‘베프’라는 약어도 이해했다. 지니톡은 ‘레알’이란 표현에 심취하여 ‘Real big win’이란 구문을 창조하는 등 각고의 노력을 기울였으나 ‘베프’를 ‘Veff’로 내뱉는 치명적인 실수를 하고 말았다.

추가적으로 흥미로운 사실은, 예시 문장의 ‘먹었다’를 ‘먹엇다’로 바꿨을 때의 반응이다.


1. 구글 번역 : ‘먹었다’로 입력하시겠습니까?라고 별도로 물어본다.

2. 파파고 : Today, I ate real bad bread with my best friend

3. 지니톡 : I ate the Real big win bread with Veff today(이전과 동일)

4. 만통 : I have eaten Real Bread like Befran today


즉, 구글 번역은, 한국어 맞춤법 자체를 우선 판별하는 반면 지니톡은 그 차이를 아직 인지하지 못 하는 듯하다. 파파고는 무슨 영문인지 갑자기 ‘레알’이라는 고유명사 대신에 ‘real bad’라는 표현을 등장시켰다. 만통은 시제 변화로 인식하여 ‘ate’를 ‘have eaten’으로 이해했는데, 이어서 아까 ‘소고기 프랑’으로 이해한 부분을 ‘Befran’으로 바꿔 말했다. 생각이 달라졌나 보다. 네 개의 인공지능 번역 모두, 앞서 언급한 인공신경망 번역 기술에 기반을 두고 있다. 따라서, 더 많은 사용자가 참여하면 할수록 스스로 학습한 결과는 더욱 정확해질 것이다. 그리고 동일한 문장을 음성으로 번역시켰을 때 결과값은 근소하게 달랐으나 문장 입력 값과 크게 다르진 않았다. 



새로운 시대를 만들게 될 인공지능 번역

 

한반도의 모든 영어학원을 문 닫게 하는 것이 시대의 변화는 아니다. 애초에 영어 공부는 일종의 장벽을 뛰어넘기 위해 부모가 아이에게 강요했고, 내가 나에게 스스로 강요했다. 외국어를 하나라도 더 알아야, 외국어를 조금 더 유창하게 할 줄 알아야, 이 험난한 글로벌 시대에 생존할 수 있기 때문이다. 만약 그 장벽이 없어진다면 진정 새로운 시대가 도래하지 않을까?

▲ 일본의 스타트업이 선보인 실시간 통역기 iLi

최근 한 언론 기사에 따르면, 4차 산업혁명으로 위협받는 직종 중 하나로 통번역사가 꼽혔다. 통번역사 양성과 관련된 업계도 동시에 위협받을 것으로 보인다. 스마트폰 어플로 더 빠르게 더 정확히 번역할 수 있다면 당연히 인간의 능력은 그것에 대체될 것이다. 그동안 사회의 일각을 구성해 온 업종과 업계가 존폐의 위기에 서게 된 것이다. 물론, ‘아직은’ 인공지능 번역기가 인간이 구사할 수 있는 ‘고도의’ 능력을 다 갖추진 못 했기 때문에 당장 새로운 시대의 문을 연 것은 아니다. 하지만 적어도 문고리는 잡았다. 좀 더 단순하게 바라보면 인공지능 번역은 여행과 관광을 보다 쉽게 만들어 줄 수 있다. 일단 여기서부터 관광 가이드의 역할은 즉시 축소될 것이다. 가이드가 주는 효용과 불편함 대비 인공지능 번역의 효용성이 훨씬 더 높기 때문이다. 그리고 언어의 장벽 때문에 가로막혔던 여행의 자유가 보다 확보되면서, 망설였던 사람은 여행을 결심하게 되고, 포기했던 사람은 새로운 것을 시도하게 될 것이다.

▲ 굳이 무너지지 않아도 더 이상 아무 의미 없어진 장벽도 있다.

여행에 있어 ‘개인’ 자유의 확대는 이전에 볼 수 없던 새로운 물결을 만들 수 있다. 각자 전혀 다른 언어 문화권에 있는 각 개인들이 그들 사이의 어떠한 중간 개입자도 없이 자유롭게 소통할 기회를 만들어지기 때문이다. 수많은 문물이 더 빠르게 교류될 것이고, 지구 반대편의 문화가 파일럿이나 출장 다녀온 아빠보다 더 빠르게 개인과 개인 사이에 전해질 것이다. 여행하기 쉬워진다는 건, 서로 다른 문화를 더 자주 접하는 사람들이 더 많아진다는 뜻이다. 역사적으로 문화의 교류는 문명 발전의 원동력이었다. 언어의 장벽이 해소되면 보다 궁극적인 사회 변화가 나타날 것이다. 과거부터 지금까지 외국어 실력은 한 사람의 ‘능력’이었다. 언어의 ‘장벽’이 있다는 것은, 그 장벽을 해소할 능력을 갖춘 사람에게 권력을 부여한다. 그 권력을 얻기 위해 수많은 교육이 필요하며, 그러한 교육을 제공할 수 있는 사람과 제공받을 수 있는 사람은 일종의 특권 계층을 만들어낸다. 그것이 작금의 우리나라 어학교육의 행태이며, ‘유학파’가 누리고 있는 특권 의식이다.


중세 유럽에서 카톨릭의 권력은 라틴어로만 쓰인 성경에서 비롯되었다. 세종대왕이 한글을 창제했을 때 ‘못 배운 것들’도 글을 읽게 될까 양반 계층은 두려워했다. 로스쿨이 국내에 처음 도입될 때 법조계의 반발은 한반도를 뒤흔들었다. 누구나 쉽게 성경을 읽는 것이, 누구나 쉽게 글을 읽는 것이, 누구나 쉽게 법률 서비스를 받는 것이 그들의 특권을 그토록 위협한 것이다. 이처럼 언어뿐 아니라 그 무엇이든 ‘장벽’이 존재하면 그 장벽 때문에 사회 구조가 만들어지고 특수한 계층이 존재한다. 단순히 통번역사 직업이 위협받아서, 여행이 쉬워져서, 외국인들과 자유롭게 대화할 수 있어서 사회가 변화하는 것이 아니다. 그동안 우리 사회에 존재했던 외국어 교육의 장벽, 외국어 능력의 장벽, 그러한 장벽을 허문 사람과 그렇지 못 한 사람, 그 차이로 인해 발생한 빈부가 만든 또 다른 장벽 등이 켜켜이 쌓여 이 사회의 일부를 지탱해왔다. 하지만 인공지능 번역은 종국에 그것을 바꿀 수 있다. 이전에 그렇지 못 했던 일을 이제 ‘누구나 쉽게’ 하게 된다는 것은 새로운 시대의 단초다.

▲ CES 2018에서 최고 혁신상 수상한 네이버 마스

이전보다 편리하기 위해 기술은 발전한다. 통역사 대신 스마트폰 하나로 자기 혼자 외국어를 통역하고 번역한다는 것은 굉장히 편리한 일이다. 그래서 이 분야의 기술은 발전할 수밖에 없다. 알파고가 그랬듯, 인공지능 번역도 조만간 인간을 제압할 것이다. 번역 분야에서 인공지능 기술을 연구하는 사람들이 사회적 장벽을 허물기 위해 연구에 몰두하는 것은 아니다. 하지만 인공지능 번역은 사회 구조를 바꾸고 장벽을 허물 것이다. 지난날 우리는 늘 그렇게 새로운 시대를 맞이해왔다. 




최근 인기 IT 동영상 리뷰 보기


이 콘텐츠에 대해 어떻게 생각하시나요?