바이두, 단 9분만에 음성을 모방하는 로봇 개발

조회수 2018. 4. 18. 09:15 수정
번역beta Translated by kaka i
번역중 Now in translation
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 다양한 분야의 재밌고 유익한 콘텐츠를 카카오 플랫폼 곳곳에서 발견하고, 공감하고, 공유해보세요.

중국 바이두의 딥보이스 기술을 결합한 'Baidu Xiaodu' 로봇 공개
사람의 음성을 똑같이 따라하는 '딥보이스' 기술이에요
출처: Baidu
중국 최대 검색엔진 바이두는 2017년 초에 '딥보이스(Deep Voice)'라고 불리는 인공지능 딥러닝 기술을 적용한 음성 모방 솔루션을 공개한 바 있습니다.

바이두는 작년 한 해 동안 지속적인 기술 개발로 최근 '딥보이스 3'를 발표하고 음성 모방 기술의 최종 단계를 스스로 완성했다고 선언한 바 있는데요.
출처: Baidu
딥보이스 단 30분 정도의 음성 데이터만 있으면 1만개 이상의 음성을 학습할 수 있으며, 이를 통해 해당 음성을 바탕으로 상대와 대화가 가능한 딥스피치(Deep Speech) 기술까지 선보였는데요.

바이두는 "딥보이스를 통해 다양한 목소리를 효율적으로 생성할 수 있게 되며, 오디오 북이나 비디오 게임 등 텍스트를 특정 음성으로 변환해 들을 수 있어 앞으로 콘텐츠의 혁신을 불어올 수 있다"고 강조했습니다.
출처: Baidu
단 9분만에 사람의 목소리를 똑 같이 따라할 수 있어요

이런 바이두가 최근 로봇 개발에도 열을 올리고 있는데요. 바로 바이두가 심혈을 기울여 개발한 인공지능 로봇 'Baidu Xiaodu'가 그 주인공입니다. 최근 Baidu Xiaodu는 몇몇 TV 프로그램에 출연해 사람과 지능을 겨뤄 승리하기도 했는데요.


최근 중국의 미디어 그룹 차이나닷컴은 바이두가 Xiaodu 로봇에 딥보이스 3를 결합해 실험을 진행하고 있다고 보도했습니다. 실제로 바이두는 음성 모방이 가능한 Xiaodu 로봇을 공개했는데요.

출처: Baidu
놀랍게도 Xiaodu 로봇은 실시간 음성 학습으로 사람의 목소리를 모방하는데 성공했습니다. 바이두는 "로봇은이 단 9분의 짧은 대화만으로도 사람의 목소리를 똑 같이 따라할 수 있다"고 밝혔습니다.

이 로봇은 외부 잡음을 걸러내고 사람 목소리만 구별해 실시간 녹음하는 방법으로 학습하는데요. 기존에 바이두가 발표한 딥보이스 3의 기술력을 한 차원 더 발전시켰다는 평가를 받고 있습니다.
출처: Baidu
현재 바이두는 구글의 모습을 그대로 닮아가는 것 같습니다. 사실 음성 모방 기술과 로봇도 구글이 이미 진행하고 있는 프로젝트이죠. 다만 이들의 기술이 양질의 콘텐츠를 만들어내고 앞으로 우리 인간의 삶을 더욱 풍요롭게 만들어주는 방향으로 사용될 수 있기를 바랄 뿐입니다.
이 콘텐츠에 대해 어떻게 생각하시나요?