"인공지능? 작은 거 하나부터 잘 하자"

조회수 2017. 11. 10. 15:20 수정
번역beta Translated by kaka i
번역중 Now in translation
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 다양한 분야의 재밌고 유익한 콘텐츠를 카카오 플랫폼 곳곳에서 발견하고, 공감하고, 공유해보세요.

인공지능 휴머노이드 로봇, 아직은 현실과 이상간의 괴리가 존재한다.

로봇 산업은 놀라울 정도로 많이 발전했다. 단순히 사람을 도와주는 기계에서, 이제는 인공지능으로 학습하고 감정을 넣는 실험을 하는 등 계속해서 여러가지 시도가 이뤄지고 있다. 심지어 얼마 전 인공지능 휴머노이드 로봇 ‘소피아’는 사우디아라비아로부터 최초로 시민권을 부여받기도 했다.

오오...

이 정도 되니, 사람들이 로봇에 가지는 기대치가 점점 올라간다. 공상 과학 영화에서 보는 것처럼 뭐든 만능으로 척척 해 줄 것 같다. 두려움도 옵션으로 따라붙는다.


박창현 이마트 S-랩 팀장은 이런 기대치를 몸소 느껴온 한 사람이다. 박 팀장은 11월9일 열린 ‘IBM 디벨로퍼 커넥트 2017’ 행사에서 이마트 인공지능 휴머노이드 로봇 프로그램을 개발하고 선보이면서 깨달은 점들을 공유했다.

박창현 이마트 S-랩 팀장과 인공지능 휴머노이드 로봇

3가지 도전과제

이마트 인공지능 로봇은 일본 소프트뱅크 로보틱스가 개발한 휴머노이드 로봇 ‘나오’에 미국 IBM이 개발한 인공지능 플랫폼인 ‘왓슨’을 탑재했다. 서비스를 위해 필요한 모든 프로그램은 이마트가 자체적으로 개발했다. 개발 당시 팀이 가지고 있던 고민은 3가지다.

■ 다양한 자연어 처리


사람이 말하는 방식은 제각각이다. 교과서에서 배우는 것처럼 “안녕하세요? 오늘 날씨 참 좋죠?”, “그렇네요. 날씨가 참 좋아요”라고 부자연스럽게 말하지 않는다. 그중에는 또 사투리도 있고 아이들의 말도 있다. 이 모든 것을 이해하는 인공지능 로봇을 만들기 위해서 인텐트를 쉽게 만들 수 있었던 IBM 왓슨을 선택했다. 이해하지 못한 부분은 왓슨으로 집중·반복적 학습을 통해 강화했다.

■ 음성 인터페이스의 한계


인공지능 스피커를 비롯해 음성 인터페이스의 한계로 꼽히는 것 중 하나가 ‘휘발성이 강하다’라는 점이 아닐까. 박 팀장은 “음성만으로 대화는 긴 대화가 어려웠다. 두 단계 이상의 대화가 진행되기에는 사람들이 귀찮아하기도 하고 정보 전달에도 한계가 있었다”라고 말했다. 그래서 ‘스크린’을 붙였다. 시각 데이터로 더 많은 정보를 전달했고, 자연스럽게 입력도 가능해졌다.

■ 움직임의 중요성


박 팀장은 ‘로봇은 감정적인(이모셔널) 존재’라고 말했다. 생김새는 사람처럼 생겼으나 아무 동작도 하지 않으면 비효율적이라고 생각했다. 따라서 소심한 움직임이라도 어떤 움직임을 취하게 하는 것에는 그렇지 않은 것과 차이가 있음을 고려해, 음성과 함께 또는 선행적이든 후행적이든 움직임을 추가했다.


만반의 준비의 결과는?…또 다른 과제


이런 고민 끝에 지난 9월 국내 쇼핑 매장에 최초로 등장한 대화형 인공지능 휴머노이드라는 점에서 주목을 받으며 휴머노이드 로봇을 실제 매장에 공개했다. 여기서 모든 것이 생각한 대로 흘러갔다면 좋았겠지만 서비스를 하면서 또 다시 새로운 문제를 만났다.

너를 선보이고… 또 다른 시작이.

첫째, 사람들이 로봇을 낯설어했다.

로봇을 두면 사람들이 신기해하며 잘 사용할 줄 알았지만, 오히려 사람들은 끔뻑끔뻑 눈을 움직이는 작은 그 로봇을 낯설어하고 무서워했다. 팀에서는 당황스러울 수밖에 없었다. 처음에는 자유롭게 말로 명령하고 선택하는 기능을 넣어뒀는데, 사람들이 말을 걸지 않아 사용도가 떨어졌다.

환상을 버리고 스크린과 터치 기능을 충분히 사용했다. 터치 인터페이스로 세부 기능 이동을 돕고, 어떻게 말해야 할지 시각적인 가이드를 줬다. 그렇게 좀 더 편안한 사용 환경을 만들었다.

둘째, 매장이 너무 시끄럽다.

스타필드에서 온종일 들리는 평균 소음이 75-85dB이다. 이 정도는 지하철 승강장 소음이다. 사람은 잘 듣지만, 로봇에게 이야기하려면 코앞까지 얼굴을 들이밀고 이야기해야 했다.

추가 스피커를 탑재하고 외장 스피커를 사용해 음량을 증폭시켜 극복했다. 거기에 넥밴드 타입의 무선 마이크를 블루투스로 연결했다. 추가 도구를 사용해야 하는 점은 불편할 수 있으나 시끄러운 매장에서도 인식률을 높여 충분히 서비스할 수 있게 하는 목적은 달성했다.

셋째, 복잡한 대화 시 집중도가 떨어진다.

휴머노이드 로봇으로 상품 추천도 많이 한다. 이를 위해서는 나이, 성별을 물어보는 단계를 거쳐야 하는데, 조금 더 복잡한 대화로 들어가면 집중도가 떨어졌다.

로봇에 카메라를 장착해 얼굴 인식으로 사용자 정보를 얻고 정보 취득 경로를 단축했다. 얼굴을 보고 성별과 연령을 파악하고 어떤 물건을 사면 좋을지 추천한다. 얼굴 정보로 모든 것을 파악할 수는 없겠지만 사람들 입장에서는 이 기능이 신기해 보이는 듯하다. 실제로 가장 많이 쓰이는 기능이라고 박 팀장은 이야기했다.

현실과 이상의 차이…작은 단위부터 ‘잘’ 적용하는 것이 필요

박 팀장이 휴머노이드 로봇을 개발하고 연구하면서 많이 듣는 말은 ‘‘엑스마키나’, ‘아이로봇’, ‘블레이드 러너’에서 보는 로봇같이 되는가?’라고 한다. 환상과는 달리 실제로는 서비스를 해도 생각처럼 잘 안 되는 경우가 있는 것을 보며 그는 아직까지는 ‘현실과 이상간의 괴리’가 있다고 이야기했다.

아직은 ‘이상과 현실과의 괴리’가.

그는 “이마트는 그래서 현실적인 적용 점을 연구하고 생각한다. 아주 작은 단위 서비스라도 ‘하나만 잘하자’라는 것이다”라며 “또한, 인간을 대체하는 것보다 매장 내 단순 마케팅 업무, 반복적인 업무, 간단한 설명 정도에 이를 적용해 사람과 협업을 통한 매끄러운 쇼핑 경험을 제공하고자 한다”라고 덧붙였다.


S-랩 팀은 앞으로도 계속 연구를 거듭하며 이마트 외에도 이마트 트레이더스, 노브랜드, 스타필드 등 다양한 곳에서 전문점 및 섹션 별 서비스 실험을 진행할 예정이다.

이 콘텐츠에 대해 어떻게 생각하시나요?