머신러닝이란 무엇인가 - 인공지능이 스스로 학습한다는 것은 오해다

조회수 2018. 11. 20. 14:36 수정
번역beta Translated by kaka i
번역중 Now in translation
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 다양한 분야의 재밌고 유익한 콘텐츠를 카카오 플랫폼 곳곳에서 발견하고, 공감하고, 공유해보세요.

인공지능 시대의 비즈니스 전략

머신러닝이 바꾼

컴퓨터 사용법

‘머신러닝은 컴퓨터가 데이터를 통해 스스로 학습하는 것처럼 하는 기술이다.’

여기서 주목해야 할 것은 ‘스스로’이다. 인간이 컴퓨터가 무슨 일을 하도록 일일이 알려주지 않아도 컴퓨터가 스스로 데이터로부터 학습하여 실행한다는 의미이다. 이것이 도대체 무슨 말인가?

컴퓨터의 발명 이래로 우리가 컴퓨터에게 일을 시킬 때는 컴퓨터가 어떻게 하도록 ‘지시’를 내린다. 이것을 먼저 하고, 그다음에는 저것을 하고, 이런 경우에는 이렇게, 저런 경우에는 저렇게 하라고 일일이 명시하여 알려준다. 컴퓨터에게 그렇게 지시하는 행위를 ‘프로그래밍한다’라고 한다. <그림 1>처럼 인간이 컴퓨터에게 방법을 알려주면 컴퓨터가 결과를 주는 것이다.

그런데 이 당연한 개념을 머신러닝이 바꾸어버렸다. 머신러닝에서는 컴퓨터에게 처리 방법을 주지 않는다. <그림 2>처럼 컴퓨터에 ‘원하는 결과’를 먼저 준다. 그러면 컴퓨터는 데이터를 원하는 결과로 바꾸는 처리 방법을 만든다. 그리고 그 방법대로 처리해 원하는 결과를 우리에게 준다.

컴퓨터가 데이터에서 스스로 방법을 찾기 때문에 인간은 일일이 지시할 필요가 없다. 컴퓨터 발명 이래 무수히 많은 기술적 진보가 있었지만, 컴퓨터 사용의 근본 개념을 바꾸었다는 측면에서 머신러닝은 대단히 큰 의미를 가진다.


스스로 학습한다는
의미에 대한 오해

컴퓨터가 스스로 학습을 하고 프로그래밍을 하다니, 아무래도 영화 속의 섬뜩한 인공지능이 생각날 수도 있겠다. 보통은 ‘데이터를 통해 기계가 스스로 학습하는 것’이라고 하지만 이 책에서는 일반적인 정의와 다르게 ‘학습하는 것처럼’이라고 했다.

머신러닝은 컴퓨터가 데이터를 통해 스스로 학습하는 것처럼 하는 기술이다.

작은 차이인데 바로 여기가 오해의 출발점인 듯하다. 인간의 학습과 기계의 학습이 거의 비슷한 것이라고 생각하기도 하고, 지금은 아니더라도 점점 발전하고 있으니 나중에는 인간과 기계의 학습을 구분할 수 없게 될 것이라고 생각하기도 한다. 사실은 그렇지 않다. 


그것은 ‘자동차의 바퀴가 인간의 다리와 같은 역할을 하기 때문에 자동차의 바퀴와 인간의 다리는 같은 것이다’라고 하는 것과 마찬가지다. 그래서 컴퓨터가 스스로 ‘학습하는 것’이라는 표현에 전적으로 동의하지는 않는다. 기계가 ‘학습하는 것처럼’ 또는 ‘학습하는 것처럼 보이도록’이라고 표현하는 것이 맞는 것 같다.

‘기계가 스스로 학습한다’라는 말은 설명하기 편리하다. 그렇게 말하면 듣는 사람들도 더 쉽게 이해하는 것 같다. 더 그럴듯하고 멋있어 보인다. 머신러닝 전문가 자신들도 그렇게 배웠다. 다른 나라의 전문가들도 모두 그렇게 ‘학습한다’라고 말한다. 그래서 별다른 고민 없이 그냥 ‘기계가 스스로 학습한다’고 하는데, 그러다 보니 의도치 않게 일반 대중은 오해를 하게 된다

그렇게 미묘하게 틀어진 인식의 차이로 인해 기계가 자의식이 있는 것처럼 생각하게도 되고 이 멋진 도구를 제대로 쓰는 것을 방해하기도 한다. 활용 관점에서 머신러닝 자체는 자의식과 직접적인 관계가 없다. 우리는 머신러닝을 제어할 수 있고 사실은 제어를 해야만 머신러닝이 작동한다. 그러니 머신러닝 전문가들이 ‘학습하는 것처럼’이라고 정의를 바꾸어주면 대중의 오해가 조금 더 줄지 않을까? 그것이 머신러닝을 실체와 더 가깝게 정의하는 것이 아닐까?

아무리 그래도 기계가 스스로 무언가를 한다니 신기하고 대단해 보인다. 그런데 실은 대단할 것도 별로 없다. 기계는 스스로 아무것도 하지 못한다. 내 컴퓨터에 있는 엑셀을 생각해보자. 그리고 내 컴퓨터에는 지난 3년간 우리 회사의 월별 매출 데이터도 있다. 그러면 무슨 일이 발생하는가? 당연히 아무 일도 발생하지 않는다.

내가 내 손으로 엑셀을 구동시켜서, 엑셀에 매출 데이터를 입력하고 뭘 더하거나 곱해야 원하는 결과가 나온다. 머신러닝도 마찬가지다. 내가 컴퓨터 안의 머신러닝 알고리즘에 데이터를 넣어주고 무언가 해야 한다.


즉, 내가 어떤 일을 하려는 의도를 가져야 한다는 얘기다. 엑셀이 혼자 살아 움직여서 데이터를 처리하지 못하듯이, 머신러닝도 혼자는 아무것도 할 수 없다. 앞으로 머신러닝은 지금과는 비교할 수 없는 수준으로 발전할 것이 확실하지만, 그럼에도 불구하고 머신러닝에서의 학습과 인간의 학습은 분명히 다른 것이다. 머신러닝의 학습은 인간의 여러 행위 중 학습이라는 행위를 흉내 내어 개발된 컴퓨터 및 데이터 활용 방법의 일종일 뿐이다.

머신러닝은 작동 방식에 따라 몇 가지 유형으로 나눌 수 있다.

먼저 정답지의 유무에 따라 지도 학습supervised learning과 비지도 학습unsupervised learning으로 구분할 수 있고, 그 외에 강화 학습reinforcement learning이 있다.


글쓴이: 정도희
대한민국 최초이자 최고의 Data Business-person

이 콘텐츠에 대해 어떻게 생각하시나요?