통합 검색어 입력폼

"미국·중국보다 훨씬 뛰어나다"..전세계를 놀라게 한 국내 기술

조회수 2020. 9. 25. 17:59 수정
번역beta Translated by kaka i
번역중 Now in translation
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 다양한 분야의 재밌고 유익한 콘텐츠를 카카오 플랫폼 곳곳에서 발견하고, 공감하고, 공유해보세요.

어제와 다를 것 없이 뉴스 읽어주던 아나운서..알고보니 "인공지능 입니다"
머니브레인 장세영 대표
국내 최초 인공지능 아나운서 선보여
“미래엔 AI 혼자 뉴스·영화·홈쇼핑 찍을 것”

“앞으로 한국이 집중해야 할 것은 첫째도 인공지능(AI), 둘째도 인공지능, 셋째도 인공지능이다.”


손정의 일본 소프트뱅크 회장이 7월4일 한국을 방문했다. 손 회장은 교육·기업·정책 등 전 분야에서 AI 육성책을 마련해야 한다고 강조했다. AI가 인류 역사상 최대 수준의 혁명을 불러올 것이라는 전망도 내놨다. 그는 22년 전에도 비슷한 이야기를 했다. “한국은 첫째도 둘째도 셋째도 초고속 인터넷에 집중해야 한다.” 실제로 한국은 그렇게 했다. 한국은 지난 20년 동안 전세계에서 가장 빠른 인터넷망을 갖춘 나라였다. 초고속 인터넷을 인프라로 산업 전 분야에 걸쳐 IT(정보기술) 혁신을 일궈냈다.


그러나 지금은 22년전과 좀 다르다. 미국·중국은 인공지능 기술을 축적하기 위해 치열한 경쟁을 펼치고 있다. 한국은 이 경쟁 대열에 끼지 못했다는 평가다. 우리나라가 AI기술 후발주자가 되는 것 아니냐는 우려도 나온다. 이런 상황에서 세계 최고 수준의 AI기술을 선보인 한국 기업이 있다. 바로 인공지능 스타트업 머니브레인이다.

출처: jobsN
머니브레인 본사에서 만난 장세영 대표가 최근 선보인 인공지능 아나운서를 설명하고 있다.

“인공지능 영상 합성 기술에서만큼은 머니브레인이 세계 최고 수준이라고 자신합니다. 앞으로 인공지능이 드라마·영화·뉴스를 만드는 시대가 올겁니다. 기획부터 촬영, 편집까지 전부 다 AI가 하는 셈이죠.”


머니브레인 장세영(40) 대표는 최근 열린 국제 인공지능대전에서 아나운서의 얼굴을 합성해 AI 앵커를 선보였다. 머니브레인의 AI 아나운서는 입력한 뉴스 텍스트를 정확한 발음으로 전달했다. 사람과 똑같은 입술·피부·눈썹 근육 움직임이었다. 영상을 본 네티즌은 “말하지 않았으면 인공지능 아나운서인 줄 몰랐을 것”이라는 반응이었다.


사람의 표정과 음성을 덧씌워 영상을 합성하는 기술은 난이도 높은 인공지능 기술이다. 지금까지 이 기술에 성공한 나라는 중국·미국뿐이었다. 머니브레인이 내놓은 영상은 다른 나라가 앞서 발표한 기술보다 훨씬 자연스러웠다. 장 대표는 “머니브레인의 머신러닝 엔지니어들이 수백번의 시행착오를 거쳐 자체적으로 개발한 기술”이라고 설명했다.

-어쩌다 인공지능 스타트업을 창업했나.


“AI가 세상을 바꿀 것이라는 확신이 있었어요. 어릴 적부터 컴퓨터를 좋아했어요. 초등학생 때 빌 게이츠 자서전을 본 뒤로 IT 사업가를 꿈꿨습니다. 98년 서울대학교 전기정보공학부에 입학한 이후 창업에만 관심을 가져왔어요.”


-청년 창업가라고 하기엔 나이가 있다. 20·30대엔 무슨 일을 했나.


“소프트웨어·인공지능 개발에 몰두해왔죠. 머니브레인 창업 전까지 만든 기술은 총 3개입니다. 대학생 시절, 창업동아리 친구들과 모여 음성인식 소프트웨어를 개발했습니다. 2010년에는 모바일 앱을 편리하게 개발·보수할 수 있는 모바일 솔루션 기술을 개발했어요. 기존 방식대로라면 오류가 생긴 알고리즘을 고치려면 여러 과정을 거쳐 수정해야 했습니다. 저희가 개발한 크로스 플랫폼 솔루션은 핵심 OS를 보완하면 관련 알고리즘까지 자동으로 수정해주는 자동화 시스템이었습니다. 이 기술을 신한은행·농협 등 은행·금융계 회사에 판매했죠. 2016년에 만든 챗봇은 고객응대·금융상담 등을 해주는 로봇이었습니다. 동아리 후배인 인턴 한명과 만들어 3개월만에 NH농협에 납품했어요.”


-빠르게 창업해 바로바로 매각하는 것 같다.


“혹시 린 스타트업(Lean Startup)이라고 들어보셨나요? 노트북 두개와 두명의 개발자, 그리고 피로회복 음료 레드불만 있다면 일주일만에 창업할 수 있다는 의미죠. IT업계에선 이렇게 간단하게 회사를 차려 수익을 내는 스타트업이 많아지고 있어요.”

jobsN

◇”영상 합성 AI 기술, 한국이 선점할 가능성 있어”


-머니브레인은 어떻게 탄생했나.


“2016년 7월, 영상합성 AI 기술을 목표로 머니브레인을 창업했습니다. 지금껏 개발해왔던 소프트웨어 개발 역량과 영상합성 기술을 더하면 영상합성 AI를 선보일 수 있다 생각했죠. 현재 우리나라 인공지능 기술의 경우, ‘인식’하는 기술력은 많이 떨어져요. 미국·중국에 비해 말입니다. 하지만 ‘합성’만큼은 1위를 노려볼 수 있어요. 이 점에서 처음부터 인공지능 딥러닝 알고리즘을 개발할 때 인식보다 합성 기술을 개발하는데 주력했던 겁니다. 그 결과 최근 내놓은 영상합성 기술은 전세계 최고 수준까지 끌어올릴 수 있었죠.”


-인공지능에 인식하는 기능이 있어야 합성도 가능한 것 아닌가.


“인공지능에 있어 ‘인식’과 ‘합성’은 개념과 목적 자체가 달라요. 예를 들어 중국은 13억 인구의 얼굴을 모두 데이터로 저장해놨어요. CCTV에 찍힌 보행자 한명을 정확히 인식해 신원을 판별할 수 있죠. 중국 정부가 범죄자를 엄격하게 처벌하기 위해 밀어붙였기 때문에 가능한 일입니다. 반면 우리나라는 얼굴이나 음성을 인식하는 기술이 많이 뒤처져있죠. 하지만 영상을 합성하는 것에서만큼은 가능성이 있습니다. 이 점을 주목했어요. 3년 전 창업 초창기부터 영상합성 기술만 주력왔기 때문에 오늘날 상용화하는 단계에 이를 수 있었죠.”


머니브레인의 영상 합성 과정은 다음과 같다. 실존인물인 아나운서와 계약을 맺고 촬영을 한다. 아나운서에게 다양한 텍스트를 읽게 한다. 뉴스를 읽는 아나운서를 촬영한다. 이 영상데이터를 인공지능에게 주입한다. 인공지능은 카메라에 찍힌 아나운서의 얼굴·목소리·움직임 등을 학습(딥러닝)한다. 인공지능은 데이터를 바탕으로 완전히 새로운 텍스트를 읽는 음성과 영상을 만들어낸다. 이때 기존 영상에 새로 덧씌워지는 영상은 입 주변과 턱, 얼굴근육이다. 얼굴 표정뿐 아니라 목소리도 똑같이 흉내 낼 수 있다. 기존 아나운서의 음성을 완벽하게 따라해 새로운 문장을 기존 속도·발음·억양 등과 동일하게 만들어내는 것이다.

출처: 머니브레인 제공
머니브레인의 인공지능 영상 합성기술, 오른쪽은 최근 선보인 AI 아나운서.

◇”인공지능이 일자리 없애는 건 사실···그러나 새로운 직업도 많이 탄생할 것”


-인공지능이 인력을 전부 대체하는 시대가 올까. 그땐 무엇을 할 건가.


“AI 아나운서가 나온다 해서 기존 아나운서들이 전부 없어질 거라곤 생각지 않습니다. 하지만 시간이 많이 지나 기술이 정밀해지면 정말 일자리가 줄어들지도 모르죠. AI가 다 하는 시대가 오면 전 뭐 할 거냐고요? 글쎄요. 가족과 시간을 보내지 않을까요? 일단 앞으로 10년간은 일자리 소멸보다는 AI 관련 직업이 훨씬 많아질 거라 생각합니다.”


-AI 관련 직업이라면 뭐가 있는지. 앞으로 비전공자는 일자리 구하기 더 어려워지나.


“AI 관련 직업이라 해서 반드시 컴퓨터공학을 전공해야만 하는 것은 아니에요. AI에게 학습시키기 위해 데이터를 가공하고 정제하는 역할, 오류가 발생할 때마다 교정해주는 역할 등이 필요합니다. 기술직만 얘기하는 게 아닙니다. 앞으로 도래할 AI 시대에 윤리적으로 어떤 규범이 필요한지, 어떤 시민의식을 갖춰야 하는지 등도 인류가 논의해야 할 주제죠. 이런 논의를 이끌어갈 각 분야의 전문가도 필요할 거고요. AI 기술 개발은 저희가 아니었어도 누군가 반드시 했을 일입니다. 앞으로 AI 기술 발전은 더 빠르게 펼쳐질거예요.”

출처: 머니브레인 제공
머니브레인이 내놓은 딥러닝 음성 합성 기술과 인공지능 영어회화 서비스.

-실제와 똑같이 구현한 영상 합성기술을 범죄에 악용할 가능성도 있다.


“페이크 뉴스나 비디오피싱(영상으로 속이는 행위)이 많아질거란 우려도 알고 있습니다. 머니브레인은 진짜 영상과 합성 영상을 판별할 수 있는 소프트웨어도 개발하고 있어요. 그냥 봤을 땐 찾아낼 수 없는 워터마크를 합성 영상에 새긴다거나 음성에 센서를 집어넣는 방식으로 구별할 수 있도록 만들겁니다.”


-머니브레인 매출과 영업이익, 비즈니스 모델을 말해달라.

 

“작년 매출 15억, 올해는 20억을 바라보고 있어요. 국내 기업으로는 카카오 등 대기업과 기술 협업을 맺고 있습니다. 앞으로 머니브레인의 기술력을 어떻게 자체적으로 사업화할 수 있을지 고민하는 단계에 있습니다. 엔터테인먼트·방송사와 협의 중입니다. 또 홈쇼핑에 진출하는데 많은 비용이 들어 어려움을 겪었던 기업들도 관심을 갖고 있어요. 맞춤형 AI 쇼호스트를 제공할 수 있거든요. 기획·촬영·편집에 들었던 모든 비용을 훨씬 단축할 수 있습니다. AI 영상 합성으로 만들 수 있는 사업은 무궁무진해요. AI 영상 합성 기술은 전세계 사람들이 찾을 콘텐츠입니다. 제가 꿈에 그리던 스타가 나와 제 이름을 불러주며 함께 영상통화할 수 있는 시대가 곧 옵니다.”

출처: jobsN
머니브레인 본사 내부.

머니브레인은 작년 3월부터 카카오 I 오픈빌더 공식 에이전시로 활동하고 있다. 머니브레인은 그동안 연구·개발해온 챗봇·음성 인식·딥러닝 대화분석 기술 노하우를 갖고 기업들에게 AI 솔루션을 제공해주는 계약을 맺었다. 오픈빌더란 카카오의 AI 기술이 필요한 파트너나 개인에게 제공하는 개발 플랫폼이다.


뿐만 아니라 머니브레인은 2017년 중국 항저우에서 진행한 KIC(미래창조과학부 한국혁신센터)와 알리바바가 주관한 케이-데모데이(K-DEMO DAY)에 참가해 좋은 성적을 냈다. 과학기술정보통신부 장관상과 상금 1억원을 수상했다. 이 대회 수상자는 미국 실리콘밸리 스타트업과 협업할 수 있는 진출권이 자동으로 주어진다.


-올해 채용 계획은.


“현재 머니브레인 홈페이지에는 8개 직군을 채용하고 있어요. 지원해주신다면 세계 최고 수준의 AI 기술을 개발하는 동료들과 일할 수 있습니다. 전문성과 열정을 지닌 이들을 찾습니다.”


글 jobsN 김지아
jobarajob@naver.com

잡스엔

이 콘텐츠에 대해 어떻게 생각하시나요?