식물 유전체분석, 바이오 시장의 블루오션인 이유

조회수 2021. 1. 19. 15:00 수정
번역beta Translated by kaka i
번역중 Now in translation
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 다양한 분야의 재밌고 유익한 콘텐츠를 카카오 플랫폼 곳곳에서 발견하고, 공감하고, 공유해보세요.

인포보스 박종선 대표 인터뷰

Part 1. 모든 식물 데이터를 긁어모아 DB화를 한 생물학 박사

리승환(리): 자기 소개를 부탁 드립니다.


박종선(박): 인포보스 공동대표 박종선입니다. 인공지능을 기반으로 식물 유전체를 분석해 신약을 만드는 일을 합니다.

딱 봐도 이과 박사님 느낌…

리: 직원이 20명 정도인데, 이 규모로 신약 개발이 가능한가요?


박: 최종적인 신약 개발이 아닌, 그 전 단계를 수행합니다. 보통 신약 개발은 ‘당뇨 치료’ 같은 명확한 목표를 만듭니다. 신약의 후보들을 만들고, 전임상 단계 실험을 통해 후보를 점점 줄여나가지요. 반면 저희는, 다양한 대량의 데이터로부터 먼저 유용한 물질을 선별하고, 이 물질로 어떤 약을 만들면 좋을지 제안합니다. 그렇게 신약 개발 파이프라인에 태우는 것이지요.


리: 데이터는 어디서 가져오시는 건가요?


박: 데이터는 도처에 많습니다. 논문, 특허, 보고서… 또 각 기관마다 이를 정리하고 있습니다. 저희는 이들을 모아 UIBR이라는 DB를 만들었어요. 위에 말씀드린 논문을 비롯한 다양한 정보를 디지털화해서 관계형 DB를 만든 거죠. 여기서 필요할 때마다 원하는 정보를 추출합니다.


다양한 형태로 기록된 생물자원 관련 정보를 관계형 DB화

리: 이런 작업을 하는 회사가 기존에는 없었나요?


박: 약 10년 전부터 정부기관 등에서도 중요성을 알고 작업을 해 왔습니다. 하지만 결과는 좀 신통치 않았어요. 한의학연구원, 국립생물자원관, 국립수목원 같은 곳에서도 데이터를 정리했지만, 결국 자기들이 연구하는 분야로 주제가 한정됐습니다. 그리고 대부분의 데이터가 보고서 형태로 흩어져 있고, 공개조차 잘 되지 않죠. UIBR은 그런 흩어져 있는 로우 데이터를 다 가지고 와서 디지털화하고, 그걸 조율하여 1차적으로 관계형 DB로까지 만든 거죠.


리: 관계형 DB가 정확히 뭔가요?


박: 수집-정리한 기관과 연구자의 기준에 따라 DB가 조금씩 다릅니다. 예로 서술하는 용어들도 감기, 고뿔, cold, URI 등 다 달라요. 이에 따라 정의가 조금씩 다르기도 한데, 이런 걸 하나하나 정제하는 거죠. 방대한 데이터를 정제하기 쉽지 않지만, 한 번 관계형 DB를 만들면 훨씬 더 쉽고 정확하게, 연구할 가치가 있는 물질을 걸러낼 수 있게 됩니다.

데이터가 쌓이니 시각화가 좀 무서운 수준…

Part 2. 주요 식물의 유전체를 직접 분석하는 바이오 기업

리: 인포보스에서 만든 DB, UIBR의 데이터는 주로 식물인 건가요?


박: 맞습니다. 주로 국내 자생종들을 정리하고 있죠. 실제로 활용하고 있지만, 정형화되거나 검증은 되지 않은 데이터에 포커스를 맞추고 있어요.


리: 음, 그게 무슨 말이죠?


박: 예로 한의학에서는 엉겅퀴가 관절에 좋다고 합니다. 이는 경험적인 정보이지, 과학으로 검증된 건 아니에요. 그러면 우리 DB를 통해서 엉겅퀴에 어떤 성분이 있는지 분석합니다. 또 엉겅퀴와 가까운 식물들로부터 어떤 효능이 기대되는지, 이런 리스트를 뽑을 수도 있습니다. 


이런 식으로 신약 개발에 도움이 될 후보 식물 100종을 찾아내는 것이 UIBR의 1차 목표입니다. 그리고 이들을 채집해 유전체를 분석하는 거죠. 

엉겅퀴 관련하여 가까운 식물을 주욱 뽑아낸다

리: 유전체를 분석하려면 실제로 식물을 채집해야 하지 않나요?


박: 저희 식물다양성 팀에서 직접 몸으로 뛰며 자생식물들을 수집합니다. 이가 가능한 사설 기업이 국내에 거의 없는데, 식물 채집은 생각보다 전문적인 지식과 많은 경험을 필요로 하기 때문입니다. 종에 따라서는 국소적으로만 분포하기도 하고, 이미 서식지가 없어졌거나 하는 이유 등으로 채집하러 가도 절반 정도는 허탕입니다.


리: 외국산을 가져오면 되지 않나요?


박: 식물은 유전적 배경 및 환경에 따라 축적되는 물질이 다를 수도 있기 때문에, 채집환경이 굉장히 중요합니다. 또 나고야 의정서에 의거해, 자생식물이 아닌 타국의 식물을 활용해서 산업에 적용하게 되면, 해당국에 막대한 로열티를 지불해야 합니다. 


국내 화장품 회사 등이 해외식물자원을 활용해서 제품을 만드는데 지급하는 로열티가 연간 5천억이나 되는 규모라고도 합니다. 그렇기 때문에 국내에서 자생하는 식물을 연구하고 분석해서 활용 적용하는 것이 중요합니다.

인포보스에서는 직접 식물을 채집하기까지 한다

리: 뭣 때문에 그 생고생하면서 식물 채집하고 분석하는 거죠?


박: 그 100종의 유전체 분석부터가 본론입니다. 유전체를 분석하면, 식물이 생산하는 물질의 정보를 정확히 파헤칠 수 있습니다. 그리고 이는 이후 신약 개발 등 다양한 산업군에 적용할 수 있는 재료가 되겠죠.


Part 3. 식물 유전체 분석이 블루오션인 이유

리: 뭔가 유전체, 하면 글로벌 회사들과 경쟁해야 할 것 같은데요…


박: 인간 유전체는 투자도 많이 했고 연구도 많이 됐죠. 반면 식물 쪽은 여전히 연구가 많이 부족해요. 아직은 경제적 가치가 낮다고 생각해서인지 논문을 쓸 수 있을 정도의 결과가 나오는 경우는 많지 않습니다. 그렇기 때문에 저희는 이 부분이 엄청난 블루오션이라고 생각하고 있습니다.


리: 유전체분석이란 말하자면 원천사업 같은 거군요. 화장품 등 온갖 사업에서 이용할 수 있겠는데요?


박: 맞아요. 식물에서 기능성 물질을 찾는 거죠. 예로 감탕나무라는 나무가 있어요. 수액이 굉장히 끈적끈적한데, 이걸 공업용 접착제의 원료로 사용해요. 이런 식으로 여지껏 우리가 사용하지 않았는데, 유용한 효용을 발휘할 잠재력을 갖고 있는 식물을 유전체 해독을 통해 찾아내는 거죠.

엄청 끈끈한 나무다…

리: 이게 제약처럼 너무 복불복 같은데요. 성공할지 실패할지 미리 알 수도 없고요. 어떻게 하면 리스크를 줄일 수 있을까요?


박: 인간에 비해 쉽지 않을 뿐이지, 그럭저럭 유전자를 복원하는 건 어렵지 않습니다. 저희는 염기서열 해독 전문 기업의 기계를 활용하는데, 식물의 경우 유전자의 90% 정도는 복원이 가능합니다. 이 정도를 ‘미들 퀄리티’라고 하는데, 사실 돈과 시간이 많이 드는 건 여기서부터 95%, 99%로 올리는 과정입니다. 


하지만 학문을 위한 연구소가 아니라, 기술적으로 이렇게까지 파헤칠 필요는 없습니다. 저희는 적은 비용으로 더 많은 식물 유전체를 수집하는 걸 우선시합니다.


리: 그렇게 많은 데이터를 수집한 후 어떻게 활용하지요?


박: 저희가 처음에 식물의 여러 속성을 정리한 관계형 DB가 있다 했고, 또 식물 유전체 DB가 있다고 했잖아요. 이들을 AI 기반으로 매칭시킵니다. 식물의 드러난 ‘속성’과 ‘유전체’를 저희가 개발한 플랫폼에 넣어주면 자동으로 여러 결과값을 제안해 줍니다. 


예로 이 유전체를 보니, 아마 이 식물에서는 어떤 대사물질이 있을 것이다… 실제로는 더 복잡하지만, 대략적인 흐름은 이렇습니다.

코로나 이전, 지금은 20명이 넘어버렸다

Part 4. 유전체분석으로 신약 개발 리스크를 낮추다

리: 근데 아무리 AI가 좋다지만… 이런 예측이 잘 맞을까요?


박: 처음 이야기로 돌아가서, 기존 신약 개발 업계의 방식으로는 시간이 너무 걸립니다. 예로 A라는 기능성 물질이 있다고 해요. 이걸 만들어내는 데에 수십 단계가 필요합니다. 과정 하나하나에 효소가 작용하죠. 


대부분의 유기합성 반응은 상온에서 가능하지 않은데, 이걸 가능하게 하는 게 효소라고 하는 특수한 단백질이에요. 보통 기능성 물질에서 이 수십 단계에 어떻게 효소가 작용할지 역산해야 해요. 엄청난 일이죠.


리: 효소란 게 공식처럼 딱 떨어지지 않나 봐요?


박: 제가 커피 관련 일하며 분석을 했던 ‘사이토크롬 p450’라는 효소를 예로 들어보죠. 산소 원자를 떼고 붙여주는 단순한 역할을 하는데, 여기에 속하는 효소가 700개나 돼요. 


그런데 이 효소가 언제 어떨 때 반응하는지, 그 환경은 다 달라요. 여기에 조건을 3가지로 나누면 2천번이나 실험해야 해요. 그럴 거면, 어느 정도 AI가 이럴 것이다, 라고 추천하고 추려주는 게 맞다는 거죠.

박종선 대표가 직접 쓴 논문, 뭔진 몰라도 멋있어 보인다

리: 결국 중요한 건 정확성인데, 실제로 그 AI를 활용한 적도 있나요?


박: 일단 프루프 오브 컨셉트(Proof of concept; PoC)는 끝냈어요. 미선나무라는 국내 고유종, 고유속을 이용했죠. 미선나무의 유전체 분석을 통해 유전체 1기가 속 유전자 14만개 데이터를 추출했죠. 여기에 AI를 적용해 ‘액티오사이드’라고 하는 물질이 생성될 것이라고 예측을 했어요. 그리고 정말 맞는지를 검증을 해 봤는데, 엄청나게 많은 함량, 고순도로 나온 거예요.


리: 오, 신기하네요… 다른 실험들도 다 잘 맞아 떨어지던가요?


박: 아니오. 그럴 리가요.


리: ……


박: 당연히 예측이 맞지 않을 때도 있습니다. 원래 식물에서 기능성 물질을 뽑는다는 건 실패 확률이 훨씬 높아요. 하지만 핵심은 ‘정확하게 맞췄다’보다 중요한 건 ‘쓸데 없는 실험시간을 줄였다’는 거예요. 화학실험을 안 하고, 최대한 컴퓨터에서 일을 끝내는 거죠. 


또 AI 기반이라, 이런 데이터가 쌓이고 쌓일수록 필터링이 정확해집니다. 맨 처음 얘기했던 것처럼, 먼저 기능을 보고 유용물질을 찾아내서, 거기서 약을 거꾸로 선발하는 작업이 가능해지는 거죠. 그게 우리의 컨셉이에요.

데이터 양이 깡패라는 입장에서 접근

Part 5. 생물+컴퓨터 덕후, 식물 회사를 차리기까지

리: 뭔가 굉장히 신기한 일을 하시는데… 어쩌다 이 길에 들어서게 되셨나요.


박: 서울대에서 식물병리와 컴퓨터공학을 전공했습니다. 원래 식물과 컴퓨터에 관심이 많았고, 코딩도 10살부터 했어요. 자연히 둘을 연결할 수 있는 생물정보학 박사를 했습니다. 이후 게놈연구재단 박종화 박사님을 모시고 10개월 같이 있다가, 미국 가서 암 유전자 부문에 종사했어요.

무슨 일이 있었는지 살이 확 빠졌다?!

리: 암 유전자 연구는 결과가 있었나요?


박: 상업 분야라서 논문이 있는 건 아니지만, 큰 일은 많았죠. 한번은 한국 대기업 VIP에서 암 타입 구분을 해달라고 검체가 온 적도 있어요. 영하 80도로 페덱스로 바로 도착하더라고요. 유전자 분석을 하면 암 타입을 밝혀내고 어떤 약을 쓸지 결정할 수 있거든요.


리: 그래서 그 분은 살리셨습니까…


박: 그건 제 소관이 아니라 잘 모르겠습니다… 만, 사실 암 유전체 연구는 요즘 좀 난황에 빠져있긴 합니다. 암을 이겨낼 새로운 약을 개발할 수 있는 근거를 얻을 수 있길 바랬는데, 생각보다 랜덤이라 분석이 쉽지 않아요. 그래도 암 유전자 연구는 여전히 엄청나게 하고 있습니다. 결국 질병의 근원을 밝혀낼 길이니, 유전체 연구의 절반 이상이 인간으로 들어가는 것이지요.


리: 그러다 창업을 하시게 된 이유는 뭐죠?


박: 중간에 이것저것 했어요. 커피 관련 회사에서 커피의 유전체를 분석해서, 커피 맛의 근원을 밝히자… 이런 것도 했죠. 그런데 유전체 연구가 워낙 시간과 돈이 많이 들어가기 때문에 지속하기 힘들었고, 주로 유전체 분석 용역을 많이 해서 대학교, 연구기관, 국립생물자원관 등의 수요가 있었기에 그 기회에 회사를 차리게 되었습니다.

역시 뭔 소린진 모르겠지만 멋있다…

리: 음? 유전체 분석은 대학교 랩에서 하면 되지 않습니까?


박: 생각보다 할 줄 아는 인력이 좀 부족합니다. 제가 하는 유전체 분석은 생물정보학에 속하는데, 일반 생물학과 갈래가 좀 달라요. 일단 코딩이 무진장 많이 들어가면서도, 컴퓨터공학에 대한 이해도 배경에 깔아야 합니다. 차라리 컴퓨터공학을 전공한 사람이 접근하는게 더 빠르지 않을까 싶을 정도죠.


리: 학생들에게 권장할 만한 전공입니까?


박: 네. 전세계적으로 연구원 대우는 괜찮은 편에 속하긴 합니다. 대학원을 견뎌낼 자신만 있다면(…)


Part 6. 35만종 식물, 앞으로 무한한 가능성 열릴 것

리: 그나저나 바이오는 투자는 많이 받고 돈은 안 되는 걸로 아는데… 돈은 좀 벌고 계십니까.


박: 저와 함께 현재 고문으로 계시는 손장혁 공동대표께서 많은 돈을 각출했습니다. 벤처 1세대 출신으로 상장사 임원도 하시는 등, 다양한 사업의 경험과 지식이 있는 분이십니다. 한국식물원수목원협회 사무국장으로 계실 때 만나서 함께 하고 있지요.


공동대표님은 회사의 경영, 투자, 마케팅을 총괄하시고, 저는 주로 실험과 개발에 열중합니다. 지금까지 자본금으로 4억이 들어갔는데, 피봇 후 이름이 알려지고 용역이 많이 들어오며 BEP는 거의 맞추긴 했습니다. 용역이 데이터 쌓는데는 도움이 되니 나쁠 건 없지만, 주업인 플랫폼 개발에 집중하기 위해 프리 시리즈A 투자를 유치 중입니다.

손장혁 공동대표와 함께

리: 그러면 본업은 어떻습니까?


박: 이미 여러 대학과 업무협약을 맺어서, 다양한 적응증에 대한 프로젝트를 진행하고 있습니다. 그 중 동물 실험이 진행 중인 약도 있고요. 물론 갈 길은 여전히 멀지만, 패러다임을 뒤집었다는 점에서 의미는 있다고 봐요. 수많은 데이터를 모으고 그 관계를 분석하여, 임계점을 지나게 되니 새로운 정보들이 많이 나오게 되었습니다. 제약회사들이 하나의 적응증을 파고드는 동안, 역으로 우리는 빅데이터를 통해 도움이 될 식물들을 여럿 뽑아내고 있는 거죠.


리: 쌓인 데이터만으로도 가치가 꽤 되나요?


박: 물론입니다. 저희 회사에서 직접 운영하는 서버 용량만 1.3펩타바이트나 되고, 이 데이터가 관계망을 형성하고 있으니까요. 그래서 관련기관에서 종종 저희 데이터를 구매하려는 의뢰도 들어옵니다. 아직은 좀 더 고도화된 작업이 필요해서, 내실 있는 DB를 만드는 데 집중할 생각입니다.


리: 앞으로 회사의 미래는 어떻게 생각하시나요.


박: 우선 식물 유전체 분석이라는 시장 자체만으로도 매우 유망하다고 봅니다. 세계적으로 식물유래 신약은 40개 정도인데, 식물 종류가 35만 개나 된다는 걸 생각해보면 엄청난 기회가 기다리고 있는 것은 사실입니다. 


여기에 식물에서 추출된 물질은 기본적으로 혼합물이라, 어느정도 밸런스가 맞춰져 있는 상태입니다. 부작용이 생겨도 상대적으로 덜할 확률이 높죠. 물론 분석이 힘든 만큼 검증이 덜 되었다는 약점도 있지만, 이 부분을 잘 채워나가며 성장할 수 있다고 봅니다.

대표적인 식물유래 신약 시네츄라시럽

리: 감사합니다. 마지막으로 한 마디 부탁 드립니다.


박: 저희 회사의 미션은 ‘자연과의 상생’입니다. 자연 생태계의 선순환 속에서, 현대과학과 기술을 통해 생물자원을 올바르게 사용하고 싶습니다. 아직은 부족한 부분이 많지만, 저희의 꿈을 실현하는데 함께 하실 수 있는 유능한 인재들의 참여를 부탁드립니다. 감사합니다.


이 콘텐츠에 대해 어떻게 생각하시나요?