"음성인식 AI 시대가 온다"

조회수 2017. 11. 17. 12:24 수정
번역beta Translated by kaka i
번역중 Now in translation
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 다양한 분야의 재밌고 유익한 콘텐츠를 카카오 플랫폼 곳곳에서 발견하고, 공감하고, 공유해보세요.

사운드하운드, 한국지사 설립.."한국어 음성인식 AI 선보일 것"

음성인식 인공지능(AI) 기업 사운드하운드가 한국지사를 설립합니다.

케이반 모헤이에르 사운드하운드 대표는 11월15일 협력사인 솔트룩스가 서울에서 개최한 ‘SAC 2017’에서 이를 발표했습니다. 이경일 솔트룩스 대표는 “사운드하운드와 한국어로 제공되는 음성인식 인공지능(AI) 서비스를 선보일 예정”이라고 밝혔습니다.

온라인을 통해 SAC 2017 키노트 발표를 한 케이반 모헤이에르 사운드하운드 대표.

12년간 한우물…독보적 ‘스피치 투 미닝’ 기술 소유

“사업 초기, 많은 사람들이 음성 AI에 대해 의구심을 가졌습니다. 사람들은 ‘누가 커피머신과 대화를 하고 싶어하겠어?’라며 비웃었죠. 하지만 이제 음성AI 사업에 의구심을 갖는 사람은 없습니다.” - 케이반 모헤이에르 대표

케이반 대표가 사운드하운드를 설립한 것은 2005년으로 거슬러 올라갑니다. 일찍이 음성인식 AI 분야의 잠재력을 본 것이죠. 설립 이후 12년 동안 한 우물을 판 사운드하운드는 현재 직원 200명 규모이지만, 기업가치는 1조원에 가까운 기업으로 성장했습니다.

12년간 축적된 기술력은 ‘스피치 투 미닝(Speech-To-Meaning)’ 기술에 집약돼 있습니다. 

케이반 대표가 “전 세계에서 우리가 유일하게 보유한 기술”이라고 자신감을 드러낸 이 기술은 음성인식과 동시에 의미를 분석하는 기술입니다.

여타 음성인식 기술은 보통 두 단계를 거칩니다. 

①음성-텍스트 변환

②텍스트-의미 분석

사운드하운드는 이 두 단계를 하나로 묶었습니다. 케이반 대표는 “스피치 투 미닝 기술은 2단계를 거쳐야 하는 기술보다 속도와 정확성에 있어 우위를 가진다”라며 “경쟁사들도 이 방식이 좋다는 것을 다 인정하고 시도하고 있지만, 아직 상용화에 성공한 사례는 없다”라고 말했습니다.

차세대 컴퓨팅 인터페이스는 ‘음성 인터페이스’

케이반 대표는 또 음성 인터페이스가 차세대 컴퓨팅 인터페이스로 부상할 것이라고 자신했습니다.

컴퓨팅 인터페이스는 PC→웹→모바일→소셜 기반으로 발전해왔는데, 소셜을 이을 차세대 인터페이스는 ‘음성인식 AI’가 될 것이라는 예측이죠. 

“앞으로 소형 사물인터넷(IoT) 기기나 아마존 에코 같은, 말 그대로 보이스 온니 인터페이스가 부상할 것이다. 음성인식 AI 전략 수립에 먼저 뛰어든 기업은 가치를 만들 것이고 후발주자들은 뒤처질 것이다."

이어 ‘하운디파이 플랫폼’을 소개했습니다. 하운디파이는 기업 고객사의 제품에 음성인식 AI를 탑재해주는 플랫폼이다. 

“현재 구글, 아마존에서 음성AI 플랫폼을 만들고 있는데, (이 플랫폼을 통해 사업을 하면) 브랜드와 고객을 플랫폼 제공사에 빼앗기는 것이다. 우리는 하운디파이 플랫폼을 사용하는 고객과 경쟁하지 않는다. 음성인식 AI가 고객의 제품에 들어갈 수 있게 하고, 고객의 데이터를 지킬 수 있게 할 것이다."

이 콘텐츠에 대해 어떻게 생각하시나요?