문과생, 스타벅스 1호 '데이터 사이언티스트'가 될 수 있었던 이유

조회수 2020. 6. 5. 09:17 수정
번역beta Translated by kaka i
번역중 Now in translation
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 다양한 분야의 재밌고 유익한 콘텐츠를 카카오 플랫폼 곳곳에서 발견하고, 공감하고, 공유해보세요.

'데이터를 분석하는 일 자체'를 고민하고 있다면 다음 과정들이 도움이 될 것
  • 데이터 사이언티스트 중에서는 조금 특이한 이력, 사회과학 대학에서 공부한 ‘문과생’
  • ‘데이터를 분석하는 일 자체’를 고민하고 있다면 다음 과정들이 도움이 될 것

◎ 정도가 아닌 길을 걷는 이들에게

현재 내 직업은 데이터 사이언티스트이지만 어릴 때부터 이 직업을 꿈꾼 것은 아니었다. 그도 그럴 것이 대학 입학 전에는 단어조차 들어보지 못한 일이었으니 말이다. 그저 좋아하는 일을 찾아서 조금씩 영역을 넓히다 보니 지금 이 자리에 오게 됐다.

주로 하는 일은 데이터 분석이다. 넘쳐나는 데이터를 여러 기술을 사용해 분석하고, 통계적으로 모델을 만들고, 인사이트를 찾아내고, 함께 일하는 사람들에게 전달한다. 요즘엔 이런 일들을 하는 사람을 데이터 사이언티스트라고 부른다.

출처: ⓒMaeng Minhwa
데이터 사이언티스트 차현나

나는 데이터 사이언티스트 중에서는 이력이 조금 특이하다는 얘기를 종종 듣는다. 소비자 심리학 박사학위가 있는, 사회과학 대학에서 공부한 ‘문과생’이라 더 생소하게 보는 것 같다.

이 글에서는 나처럼 정도가 아닌 길에서 데이터 사이언티스트가 되고자 하는 이들에게 도움이 될 만한 얘기를 해보려 한다.


◎ 외국어를 배우듯 코딩을 배워라

“코딩도 언어의 일종이기 때문에 영어를 배우는 것과 비슷한 과정이라고 생각하면 접근하기가 조금 쉬워진다.”

언어가 중요한 것이 아니다.

필요할 때 막상 영어를 쓰려고 하면 잘할 수 없듯 코딩도 무작정 이론을 배운다고 실전에서 사용할 수 있는 건 아니다. 그래서 ‘데이터의 목적’이 중요하다.

데이터로 무엇을 할지 명확한 목적이 있어야 한다.

코딩의 결과 즉, 무슨 결과물을 얻어야 할지가 분명하면 차근차근 코딩을 공부할 수 있다.


막연하게나마 코딩을 배우고 싶다는 마음이 있다면 예열은 충분히 한 셈이다. 

이제 코딩을 시작하기 전 알고 싶은 문제 하나를 정해보자.

스스로 분석해보고 싶은 주제가 있는가?

데이터로 뭔가 알아보고 싶은 게 있는가?


그럼 그 답을 찾는 데 필요한 데이터 분석 과정을 배워보자.  목적이 생겼으니 더 빠른 길을 찾기 위해 노력하게 될 것이다. 


◎ 통계 관련 수업은 최대한 많이 들어라

인문 계열의 ‘수포자’ 학생들은 통계 관련 수업들을 들을 때 지루할 수도 있다. 어려운 공식이 나올 때도 많고 시험이 완전히 수학 문제로 도배되기도 한다. 데이터 분석에 관심이 있다면 이런 시험에서 좋은 성적을 거두지 못해도 포기하지 않아야 한다. 여러 번 반복해서 하다 보면 졸업할 때쯤 돼서는 적응할 수 있을지도 모른다.

고등학교를 졸업한 뒤 학사 4년, 석사 2년, 박사 3년 동안 통계와 수학을 놓지 않고 있었더니 자연스럽게 몸에 밴 습관들이 있다. 일상에서 어떤 행동이나 현상을 봤을 때 어떻게 구조적으로 정리하거나 숫자로 증명할지 떠오르는 것이다.

예를 들어 “요즘 사람들이 이 요리 많이 먹더라!”라는 얘기를 했다고 해보자.


 ‘요즘’은 며칠, 몇 주, 몇 개월 혹은 몇 년일 수 있다. ‘사람들’은 어떤 그룹인지, 동네인지, 한국인지, 전 세계인지 그리고 ‘많이’는 얼마나 되는지, 다른 어떤 요리와 대비해 많이 먹는지, 아니면 그 요리가 특정 기간보다 훨씬 더 많이 팔리고 있는지, ‘이 요리’는 딱 이 가게에서 파는 것인지, 어떤 범주의 요리인지 등 고작 한 문장인데 정의해서 증명해야 할 것이 많다.

물론 대화를 할 때마다 이런 생각을 하지는 않지만 때로 회사에서 일상적으로 오가는 한 문장이 중요한 분석 주제가 되기도 한다. 한 학기, 전공 수업 하나를 듣는다고 길러질 수 있는 역량은 아닐지도 모른다.

싫어하는 전공을 계속 들으라는 것은 아니다.

다만 내가 하고 싶은 일에 필요한 역량이라면 꾸준히 지속할 필요가 있다는 뜻이다. 앞서 말했듯 내 전공이 아닌 다른 분야의 공부를 꾸준히 하다 보면 내 전공의 전문성에 그 분야가 더해져 나만의 강점이 생긴다.


◎ 프로젝트에 대한 가치판단을 전달하라

인공지능을 활용해 사람을 채용하는 일의 단계를 상상해보자.

일단 기계가 데이터를 학습해야 한다. 현재 인재라고 평가받고 있는 사람들의 데이터를 분석하고 앞으로 채용하게 될 사람들의 데이터와 대조해 기존의 인재와 부합하는 새로운 인재들을 영입하려는 계획이다.


그렇다면 기존에 성과가 좋았던 사람들의 기준은?

업무상 고과를 잘 받았다든지, 팀장이나 임원이 되었다든지 하는 기준을 정해야 한다. 업무상 고과라는 것도 기계가 아닌 사람이 평가한 것이니 이미 학습시키는 데이터 자체에도 사람의 가치판단이 들어간다.


표현의 편의를 위해 인재를 찾는 데 임원들을 기준으로 데이터를 학습시킨다고 가정하자.

데이터에서 임원으로 승진한 사람들의 공통점을 찾아야 한다. 공통점을 찾기 위해 학습시킬 데이터는 무엇인가? 일단 갖고 있는 정보는 통상적으로 이력서에 적는 인구통계적 정보, 학력과 학습 성취, 사는 지역 등일 것이다.

현재 임원들이 소위 명문대를 나온 비중이 높으면 그 데이터를 학습한 컴퓨터는 앞으로도 동일한 명문대 출신들이 인재가 될 확률이 높다고 판단할 것이다.

만약 공교롭게도 임원들이 비슷한 지역에 거주하고 있다면 이 데이터를 학습한 프로그램은 그 지역에 거주하는 사람들이 인재라고 말할 것이다. 이렇게 되면 특정 지역의 채용 확률이 높아진다.

데이터 사이언티스트는 이런 가치판단을 사람들에게 전달할 수 있어야 한다.

어떤 데이터에서 어떤 결과를 얻게 되는지 구체적으로 알고 있는 사람이기 때문이다.

“방대한 데이터를 학습시키면 공정한 결과가 나올 거야!”라고 기대하고 있는 사람들에게 찬물을 끼얹을 수도 있지만, 데이터의 특성에 따라 생길 수 있는 일들을 설명해줘야 한다.

‘난 그저 지시에 따라 채용을 위한 모델을 만들었다’고 한다면 그 일에서 파생될 수많은 문제들을 방조하는 셈이다. 이 데이터가 현실에 끼칠 영향을 해석하는 일이 왜 중요한지 잘 생각해봐야 한다.


◎ 스페셜리스트가 되려면 제너럴리스트가 되라

스페셜리스트는 매우 전문적인 일을 하지만 그 분야의 일이 아니면 역량을 발휘하기 힘들다는 점에서 덜 매력적으로 느껴졌던 것도 같다. 시대 변화에 잘 적응하고 쓰임새가 많은 사람이 되고 싶다는 마음에 스페셜리스트가 아닌 제너럴리스트가 되고 싶었다.

그런데 지금 생각해보니 먼저 제너럴리스트가 되어야 스페셜리스트가 될 수 있는 것 같다. 요즘에는 학문의 경계나 분야도 모호해지고 있다. 연결을 통해 빛나는 아이디어를 만들어낼 수 있는 시대다.

스페셜리스트가 될 수 있는 중심축을 하나 세운 다음 제너럴리스트로서 여러 분야를 두루 알고 차용할 수 있어야 한다. 이것이 진정한 전문가가 되는 길이다. 하나의 전문 분야를 가진 뒤 다른 분야를 만날 때 생각의 깊이가 달라진다.

데이터 사이언티스트는 특히 그렇다.

책의 곳곳에서 기술, 통계, 인문 영역에서의 역량을 여러 번 얘기했는데, 한 영역에만 머무를 때는 좋은 데이터 사이언티스트가 되기 어렵다. 자신의 영역에서 정점에 이르러야 원리가 보이고 다른 영역에 적용하기가 쉬워진다.

마케팅을 하면서 엑셀로 데이터를 잘 만지던 사람은 통계 원리를 파악하고 기술을 통해 어떤 결과물을 내야 하는지 좀 더 수월하게 깨달을 수 있다. 특히 마케팅 결과물을 어떻게 만들어야 시장이 반응하는지 머릿속으로 상상할 수 있기 때문에 어떤 데이터가 필요한지 아이디어도 낼 수 있다.

무엇이든 아는 것은 또 다른 영역에 도움이 된다. 쓸모없는 경험이란 없으며, 언젠가는 분석의 자양분이 된다


◎ 박쥐의 고통을 감수하라

스페셜리스트이자 제너럴리스트가 되기 위해서는 ‘박쥐’ 같은 시간을 보내야 한다. 내 경우 기술 회사가 아닌 일반 회사에서 데이터 사이언티스트로 일하다 보니, 보통의 인문계 출신 분석가보다는 기술을 좀 더 알고 데이터 엔지니어에 비해서는 인문학적 역량이 더 강했다.

어느 쪽에도 속하지 않는다는 점은 어떻게 보면 단점으로 보일 수도 있다. 하지만 박쥐의 고통도 얼마든지 장점으로 바꿀 수 있다.

박쥐처럼 어디에도 속하지 못하는 기분이 든다면 둘 다 섭렵하기 위해 노력하는 시간이 필요할지도 모른다. 너무 많이 노력하다가 지칠 필요는 없지만 박쥐가 둘 다 잘해낼 수 있게 되면 엄청난 가치를 지닌다는 점을 잊지 않았으면 좋겠다.

때로 어느 한 분야에 두 발을 다 담그지 못한다는 느낌이 들기도 한다. 옆 사람을 보면 자신만의 분야에서 확고한 위치를 차지한 것처럼 보일 때도 있다. 하지만 이건 다 남의 떡이 커 보이는 현상일 수도 있다.

한 웅덩이에만 두 발을 다 담글 필요는 없다. 이것과 저것을 연결할 수 있는 것은 훌륭한 역량이다. 두 나라의 언어에 능통한 통역가처럼 두 분야를 연결할 수 있도록 역량을 키우면 된다.


데이터 분석을 시작하려는
사람들을 위한 가장 쉬운 안내서
이 콘텐츠에 대해 어떻게 생각하시나요?