챗봇 '이루다', 데이터베이스는 폐기된다지만

조회수 2021. 1. 18. 14:00 수정
번역beta Translated by kaka i
번역중 Now in translation
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 다양한 분야의 재밌고 유익한 콘텐츠를 카카오 플랫폼 곳곳에서 발견하고, 공감하고, 공유해보세요.

인공지능(AI) 챗봇 ‘이루다’가 사라진다. 개발사가 이루다의 데이터베이스(DB)와 딥러닝 대화 모델 폐기를 결정하면서 이루다는 사실상 사망선고를 받게 됐다. 이루다로 인해 촉발된 AI 윤리 논의와 더불어 데이터 수집・활용 등 논란은 우리 사회가 풀어야 할 숙제로 남겨졌다. 아울러 이 회사가 충분한 고지 없이 이루다 개발에 사용해 문제가 됐던 ‘연애의 과학’ 등의 데이터는 삭제를 요청하는 경우에만 폐기할 방침이라고 밝혀 서비스 이용자들과의 갈등은 계속될 전망이다. 피해를 주장하는 이용자들은 스캐터랩을 상대로 집단소송 절차에 돌입했다.


15일 스캐터랩은 “이용자들의 불안감을 고려해 ‘이루다’ DB 전량 및 딥러닝 대화 모델을 폐기하기로 했다. 한국인터넷진흥원(KISA)·개인정보보호위원회의 조사가 종료되는 즉시 절차를 진행하겠다”고 밝혔다. 다만 “이루다 DB는 비식별화 절차를 거쳐 개별적이고 독립적인 문장 단위로 이루어져 있다. 딥러닝 대화 모델은 대화 패턴만을 학습하고, AI는 데이터를 벡터값으로 기억하기 때문에 개인정보가 유출될 위험이 전혀 없다”고 해명했다.


앞서 스캐터랩은 지난달 23일 AI 챗봇 이루다를 출시했다. 불과 2주 만에 약 80만명에 달하는 이용자를 모았지만 성소수자・장애인 등 사회적 약자를 향한 혐오발언을 쏟아낸다는 지적이 나오면서 도마에 올랐다. 이재웅 다음(Daum) 창업자는 “사회적 합의에 못 미치는 서비스다. 서비스를 중단하고 차별·혐오를 하지 않도록 시스템을 변경해야 한다”며 이루다를 공개 비판했다. AI 서비스를 공공에 공개할 때 사회적 책임과 윤리에 대해 고민하는 기회가 됐으면 한다는 취지의 발언과 더불어 이 같은 문제가 회사 지배구조의 다양성 부족이나 회사 구성원의 젠더 감수성, 인권 감수성 부족에서 온 것은 아닌지 점검하길 바란다는 말도 남겼다.

“(레즈비언이) 혐오스러워” “(버스에 장애인이 타느라 늦어지면) 밀어버리고 싶겠다” 등 이루다는 혐오발언으로 AI 윤리 논쟁을 촉발시켰다.

하지만 이루다가 사망 선고를 받게 된 결정적인 계기는 개발 과정에 있었다. 스캐터랩이 자사 서비스인 ‘연애의 과학’과 ‘텍스트앳’ 등에서 수집한 카카오톡 대화를 이루다 학습에 활용했다는 사실이 뒤늦게 알려진 것이다. 이용자와 이용자의 카카오톡 대화 상대방에게 개인정보 이용·활용 동의를 제대로 받지 않았다는 지적이 쏟아졌다. 또, 익명화 처리를 제대로 하지 않은 내부 데이터 샘플을 개발자들의 오픈소스 플랫폼 ‘깃허브’에 올려 실명 등 이용자들의 개인정보가 노출된 대화들이 공유된 것으로 알려졌다.


스캐터랩은 문제를 제기한 이용자들의 개인정보 데이터만 골라내 삭제할 수 없어 이루다 DB 전량을 폐기하기로 했다고 설명했다. 회사 관계자는 “기존 ‘연애의 과학’과 ‘텍스트앳’의 대화 정보는 전부 동의를 받고 수집했지만, 일부 이용자들이 동의했음에도 활용을 원치 않는다는 의견을 받아들여 삭제하려 한다”고 강조했다. 원치 않는 이용자들은 신청을 받아 개별적으로 데이터를 삭제할 예정이며, 추후 개발될 딥러닝 대화 모델에도 이용하지 않겠다고 전했다.


다만, 이용자들이 제공한 카카오톡 대화 상대방 등 제3자들은 이용 사실 자체를 인지할 수 없어 삭제 요청이 사실상 불가능할 것으로 보인다. 이에 대해 스캐터랩 관계자는 “이 사안에 관심 없는 이용자들도 있을 수 있는데 수집한 전체 데이터를 다 삭제하는 것도 문제가 있다”며 “제3자 등의 경우 이루다 DB 폐기 이후 순차적으로 대책을 마련해볼 것”이라고 말했다.


한편, 연애의 과학 이용자 300여명은 오픈채팅방을 통해 집단소송을 논의 중이다. 법무법인 태림은 15일 공동소송 플랫폼 화난사람들을 통해 ‘이루다 AI개인정보 유출 피해자 집단소송’ 참여 접수를 시작했다. 이들은 “이루다 DB가 아니라 카톡 데이터 전량을 파기해야 한다”고 요구하고 있다. 앞서 참여연대 등 시민단체들도 “개인정보보호법에 따르면 해당 대화 내용 데이터 수집과 이용에 문제가 있다. 개인정보 수집과 처리 과정이 불법적인 것으로 드러나면 정보 주체의 요청 없이도 해당 개인정보를 바탕으로 만들어진 챗봇 모델과 데이터를 폐기해야 한다”고 주장했다.


오병일 진보네트워크센터 대표는 “이루다 사건은 타인의 개인정보가 충분한 동의 없이 제공된 게 문제다. 대화를 나눈 다른 당사자의 동의는 얻지 않았다는 게 핵심으로, 이는 통신비밀에 해당할 수 있다”며 “실제 답변을 통해 나오는 정보로 개인을 식별할 수 없으면 개인정보가 아닐 수 있으나 이용자들이 느끼는 불안감은 이용 목적에 대한 명확한 고지 없이 내 개인정보를 수집했다는 것이다. 어떻게 작동하는지 모르는 상황에서 드러내지 않고 싶은 개인정보가 기대 외 목적으로 사용됐다는 게 문제”라고 말했다.


이 콘텐츠에 대해 어떻게 생각하시나요?