통합 검색어 입력폼

AI로 고품질의 화상회의 서비스를 구현한 엔비디아

조회수 2020. 10. 21. 07:51 수정
번역beta Translated by kaka i
번역중 Now in translation
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 다양한 분야의 재밌고 유익한 콘텐츠를 카카오 플랫폼 곳곳에서 발견하고, 공감하고, 공유해보세요.

AI 알고리즘 기반의 화상회의 솔루션 'NVIDIA Maxine'
출처: NVIDIA Maxine

AI 알고리즘으로 실시간 영상의 품질을 높이다

최근 글로벌 기업 엔비디아(NVIDIA)가 인공지능(AI) 화상회의 솔루션 '맥신(Maxine)'을 공개했다. 놀라운 점은 맥신이 줌과 같은 일반 화상회의 솔루션과 달리 AI 알고리즘을 통해 다양한 기능을 제공하고 있다는 점이다.


맥신은 엔디비다 그래픽처리장치(GPU)로 구동할 수 있으며 AI 기술을 활용해 '시선교정', '페이스 리라이팅(Face rewriting)', '노이즈 캔슬링', '얼굴 얼라인먼트(Face alignment)' 등의 기능을 제공한다.

출처: NVIDIA Maxine

가장 두드러진 기능을 하나 꼽자면 '페이스 리라이팅' 기능으로 인터넷 환경이 좋지 않은 곳에서 발생하는 저화질의 얼굴 영상을 인공지능을 활용한 비디오 압축 기술을 이용해 실시간 선명한 얼굴로 바꾸어 스트리밍해주는 기능이다.


이는 얼굴을 스캔해 미세한 얼굴 움직임을 나타내는 포인트를 식별하고 정지된 얼굴 이미지를 결합하는 딥페이크(Deepfake) 기술의 일종으로 화자의 얼굴을 재생생하는 기술이다. 

출처: NVIDIA Maxine

AI 기술로 더욱 정확한 의사소통을 지원하다

더욱 놀라운 점은 '시선교정' 기능으로 마스크를 쓰고 있거나 안경을 착용해도 상관없으며, 얼굴의 각도를 바꿔서 마주 보는 것처럼 바꾸고 시선을 보정해주기도 한다. 

출처: NVIDIA Maxine

화상회의의 대면성을 강화하기 위해 얼굴을 맞대고 대화하는 듯한 느낌도 기술적으로 구현했다. 바로 페이스 얼라인먼트(Face alignment) 기능으로 통화 중에 서로 마주보는 것처럼 얼굴을 조정해준다.


또한 사용자가 실시간으로 음성과 감정 톤에 따라 자동으로 움직이는 애니메이션으로 자신만의 아바타를 선택할 수 있는 기능도 추가할 수 있도록 했다. 얼굴 보여주기가 어려운 상황에서 이용하기 좋은 기능이다. 

출처: NVIDIA Maxine

마지막으로 노이즈 캔슬링 기술은 말 그대로 주위의 듣기 싫은 소음을 깔끔하게 없애고 사용자의 목소리만을 캐치해 들려주는 기술을 적용해 상대와 더욱 원활한 소통을 가능하게 해준다.


커뮤니케이션에 있어 눈빛과 표정으로 감정을 전달할 수 있는 얼굴의 역할은 절대적이다. 인공지능을 이용한 실시간 그래픽 처리 기술로 다양한 인터넷 환경에서도 정확한 의사소통을 지원하는 맥신, 앞으로 줌, 구글 등의 화상회의 솔루션들과의 경쟁에서 살아남을 수 있을지 계속 지켜보기 바란다.


출처: NVIDIA Maxine
이 콘텐츠에 대해 어떻게 생각하시나요?