본문 바로가기

댓글0
번역beta

Translated by kakao i

번역할 언어 선택

뷰 본문

테크플러스

사흘=four days? 외신 번역기의 굴욕

4,181 읽음
댓글0
번역beta

Translated by kakao i

번역할 언어 선택

직장인으로 사는 날은 휴일이다. 공휴일이 휴일과 겹치는 것만큼 애석하고 안타까운 일이 없다.

그런데 이를 구제해주는 제도가 있다. 바로 임시공휴일이다.


광복절이 토요일과 겹쳐 한숨짓던 직장인들이 환호했다. 정부가 내수진작을 위해 8월 17일을 임시공휴일로 지정했기 때문이다. 덕분에 토,일,월 3일간 황금연휴를 맞게 됐다.


뉴스가 발표되자 직장인들이 반색했다. 그런데 생각도 못 한 단어 하나가 실시간 인기검색어에 등장하면서 관심을 다른 곳으로 집중시켰다. 


검색 키워드는 '사흘'이다. 사흘이라는 단어의 뜻을 검색하려는 시도가 많았다는 의미겠다. 광복절인 15일부터 17일까지 3일간 이어지는 연휴 기간을 기사에서 사흘이라고 다뤘고 이 뜻을 이해하지 못한 사람들이 단어를 검색했던 것이었다.


사람들은 당황했다. 사흘이라는 단어를 아는 사람은 이런 것도 검색해야 하나며 당황했고 모르는 사람은 도대체 며칠을 쉬라는 건지 몰라 당황했다. 이번 일을 계기로 적어도 사흘의 뜻을 아는 사람들의 진영이 더 커졌으리라 믿는다.

구글 번역과 파파고에서 한글 '사흘'을 영어로 번역한 결과

사흘의 뜻을 아는지 검증하고 싶은 사람들은 짓궂게도 번역기로도 사흘이라는 단어를 돌려봤다. 결과는 뜻밖이었다. 대표적인 번역기 구글 번역에서는 사흘을 "four days"라고 번역했다. 연휴가 3일에서 4일로 늘어나는 일은 상상만으로도 기쁜 일이지만 그저 잘못된 번역일뿐이다. 반대로 four days를 한국어로 번역하면 나흘이라고 하니 어느 장단에 맞춰야 할지 어리둥절할 수밖에. 마이크로소프트(MS) 번역기에서는 사흘을 "three"라는 다소 찜찜한 결과를 내놓았다.


반면 네이버 파파고나 카카오 i 번역과 같은 국산 번역기에서는 사흘을 "three days"라고 정확하게 번역하고 있다. 과연 무엇이 이런 차이를 만들었을까.

현재 대부분의 번역기는 '인공신경망 기반 기계번역(Neural Machine Translation)'을 사용한다. 2010년대 중반부터 채택되기 시작한 기술로 통계 기반 기계 번역(SMT)보다 더 발전된 형태다. 줄여서 NMT라 부른다. 같은 NMT를 사용하더라도 기업마다 자체적으로 수정하고 보완해 사용하고 있다. 물론 기계 학습에 사용되는 학습데이터도 서로 다를 수밖에 없다.

대표적인 번역기 구글 번역과 파파고에 대해 살펴보자. 구글 번역은 구글 신경망 기계번역(GNMT)을 사용한다. 특징은 한국어와 일본어, 터키어처럼 서로 구조가 비슷한 언어의 번역 모델을 공유한다는 점이다. 그러다 보니 학습을 위해 투입되는 데이터가 줄어들어 결과적으로 한 번에 여러 언어를 익히는 효과가 있다. 역시나 구글이라는 브랜드에 걸맞게 전 세계에서 가장 많은 사람들이 사용하면 번역기다. 지원하는 언어만 해도 103개에 달하며 매일 수억 명의 사람들이 구글 번역을 이용하고 있다.


네이버 파파고는 '파파고 NMT(Papago NMT)'를 사용한다. 네이버에 밝힌 내용에 따르면 파파고는 네이버 서비스에 올라온 방대한 데이터를 가지고 실사용 단어 위주로 학습을 한다. V라이브(V LIVE)에 올라온 영상 번역 자막도 학습자료로 요긴하게 사용된다. 또한, 문구 전체를 그대로 번역하기에 맥락을 고려한 번역이 가능하다고 설명했다.

다른 언어는 모르겠으나 적어도 한영 번역에 있어서만큼은 파파고가 구글 번역보다 좋은 평가를 받고 있다. 사흘이라는 단어를 구글 번역보다 정확하게 번역한 배경에는 국내 환경에서 태어났으며 축적된 한국어 데이터를 이용한 학습의 결과라고 짐작해볼 수 있다. 높임말 번역도 파파고에서만 누릴 수 있는 깨알 기능이다.


물론 단어 몇 개 번역 결과를 가지고 어떤 번역기가 더 우수하다고 속단해서는 안 된다. 번역이란 것은 정답이 정해져 있는 것이 아니다. 같은 문장을 놓고도 번역가에 따라 다른 번역이 나오는 법이다. 지구상에 존재하는 언어의 특징도 제각기 다르기에 성능을 면밀하게 측정하기 어려운 부분도 있다. 자신이 생각하기에 본문의 뜻을 오역하지 않고 잘 번역하는 번역기라 생각되는 것을 선택해 사용하면 된다. 대부분의 번역기는 분명 이전보다 번역 실력이 상당히 좋아졌다. 


테크플러스 에디터 나유권

tech-plus@naver.com

해시태그

작성자 정보

테크플러스

    실시간 인기

      번역중 Now in translation
      잠시 후 다시 시도해 주세요 Please try again in a moment