최대우 한국외국어대학교 통계학과 교수

[컴퓨터월드] 하루가 멀다 하고 새로운 기술이 쏟아지고 있고, ‘빅데이터’, ‘IoT(사물인터넷)’, ‘핀테크’ 등의 용어들은 이제 일상 속 대화에서도 낯설지 않게 다가오고 있다. IT분야의 비약적인 발전은 기존 패러다임을 붕괴시키며 사회 전반에 걸친 변혁을 가속화시키고 있지만, 정작 우리 스스로 이러한 흐름과 그 가치에 대해 얼마나 제대로 알고 있는지는 의문부호가 남는다.

우리나라는 현재 갈림길에 서있다. 지속가능한 성장을 위해 IT분야에서 새로운 먹거리를 찾아 나서고 있지만, 자칫 전 세계적인 변혁의 급류에 휩쓸려 방향성을 잃고 도태될 수도 있는 처지다. 이 가운데 최대우 한국외대 통계학과 교수는 “데이터 분석 역량은 곧 국가 경쟁력”이라고 강조한다. 정보의 흐름이 가치를 창출하는 시대, 데이터 분석가이자 교육자인 그의 목소리에 귀기울여본다.

▲ 최대우 한국외대 통계학과 교수

최대우 한국외국어대학교 통계학과 교수와 데이터의 만남은 그가 태어날 때부터 자연스럽게 이뤄졌다. 그의 조부는 한국에서 박사학위를 받은 최초의 수학자인 故 최윤식 교수이고, 그의 부친은 국내 조사방법론 연구에 기여한 故 최지훈 교수이기 때문이다. 최대우 교수까지 3대에 걸쳐 수학통계 분야를 전문적으로 다뤄오고 있으니 집안의 가업이라 할 만 하다.

“통계학 전공자라고 꼭 데이터를 다루는 일을 하게 되는 것은 아닌데, 데이터를 활용해 공공기관을 돕는 대외활동에 적극적이었던 선친으로부터 은연중 받았던 영향이 컸던 것 같다” 최대우 교수는 데이터 분석을 업으로 삼게 된 계기에 대해 이 같이 밝히면서, “1988년 러트거스뉴저지주립대 유학 중에 당시 국내에서는 생소했던 언어인 S를 배우게 된 것이 이후 S+를 거쳐 지금의 R까지 이어졌다”고 회고했다.

최대우 교수는 지난 2010년 안식년에 가족여행 중 구글을 방문한 이후로 ‘빅데이터’라는 새로운 흐름을 본격적으로 연구하기 시작했다. “이전까지 통계분석과 IT는 별개라고 여겨왔으나, 구글에서 강한 인상을 받고서 프로세스에 내재화된 분석 자동화의 필요성을 느꼈다”고 설명하는 한편, “2011년부터 오픈소스 진영의 약진과 분석의 보편화가 다가왔다고 이야기하고 다녔지만, 지금과 달리 당시 국내에서 이를 공감하는 사람은 드물었다”고 덧붙였다.

이어, “미국에서 2008년 금융위기 이후로 시작된 이러한 추세는 생존을 위한 변혁이라고 볼 수 있다”며, “우리나라도 경기가 침체돼 어려운 시기를 나고 있는데, 기존 방식에만 머무른다면 탈출구를 찾기 어려울 수도 있다”고 짚었다.

80여개의 데이터 분석 프로젝트를 수행한 전문가이자, 한국외대 데이터시각화연구센터(Advice) 센터장으로서 후진 양성에 힘쓰고 있는 최대우 교수로부터 들은 빅데이터와 데이터 사이언티스트에 대한 견해를 문답 형태로 정리했다.

 

빅데이터란 무엇인가.

빅데이터에 대한 시각은 각자 다를 수 있으므로, 딱 잘라서 무엇이라 정의하기는 어렵다. 다만 ‘데이터를 분석·활용해 큰 가치를 얻는 것’만큼은 공통된 주제라 할 수 있다. 데이터의 양이나 종류나 처리속도는 이를 위한 행위에 해당될 뿐, 궁극적인 목표는 데이터를 통한 가치창출이다.

과거에도 비정형 데이터의 가치를 사람들이 몰랐던 것은 아니다. 비용효율성 또는 전문성의 문제로 이를 다루기 쉽지 않았을 뿐, 공개SW의 발전에 따라 이러한 진입장벽이 점차 허물어지면서 비로소 본격적인 활용이 대두됐다. 또 기존에는 데이터를 규격화하는 경향으로 인해 데이터 간 연계성이 떨어져서 분석 시 중요한 인사이트를 놓치기도 했다. 그래서 현재 개인적으로는 관계망 분석을 중시, 많은 성과를 거두고 있고 앞으로도 큰 기대를 하고 있다.


통계학자이자 데이터 분석가로서 바라본 국내 현실은.

데이터는 활용하라고 있는 것인데, 언젠가는 분석할 것을 왜들 쌓아놓고만 있는지 답답하다. 이렇듯 데이터 활용이 저조한 원인으로는 잘못된 접근방법을 들 수 있다. 마치 도서 전집부터 일단 구매해 아이의 방에 채워주면서 ‘사놓으면 언제든 보겠지’라고 착각하는 부모와 같다. IT인프라를 화려하게 구축해봤자 데이터 분석의 실수요가 없으면 허사다.

실제로 데이터를 분석해 가치를 창출하는 것에 초점을 맞춰야 하는데, 정작 그 환경을 꾸미는 데만 열중한 셈이다. 요즘에는 컴퓨팅 성능이 좋아져, 필요 이상의 스펙에 욕심내지만 않는다면 데이터 분석에 그리 많은 비용이 들지 않는다. 그렇다고 솔루션 벤더들이 본질을 호도했다는 뜻은 아니다. 나름의 특장점을 바탕으로 상품 판매라는 목표에 충실했을 뿐, 구매 결정을 내린 것은 결국 구매자다.

그래서 가장 중요한 것은 실수요자, 즉 데이터를 분석할 사람이다. 소위 ‘갑’이라는 이들이 더 깨쳐야 한다. 빅데이터에 대해 제대로 공부해보지도 않은 채 상상의 나래를 펴고, 프레젠테이션만으로 솔루션 도입여부를 판단하는 일은 지양해야 한다. 특히, 소요비용을 맞춘다고 데이터 분석 인력에 대한 투자를 아끼는 것이야말로 가장 어리석은 행위다.

우리나라의 빅데이터 분야의 발전은 미국뿐 아니라 중국에 비해서도 이미 뒤처진 감이 있다. 박근혜 정부가 들어선 이래 이 분야에 강하게 드라이브를 걸고 있지만, 아직 뚜렷한 성과가 보이진 않는다. 이제 데이터 분석은 비즈니스 영역을 넘어 국가 경쟁력까지 좌우한다고 보는데, 그 가치를 경험해본 이들 중 한 사람으로서 국내 현실이 참으로 안타깝다. 빅데이터에 관심 있다면 조금씩 단계별로 시작해보길 권한다.


그간 80여개의 데이터 분석 프로젝트를 수행해왔던데.

국내에서 데이터 분석이 본격적으로 활용되기 시작한 것은 90년대 말 고객 분석부터다. 이때 금융권에서도 이와 관련해 적극적으로 도입에 나섰고, 그 근간은 최근 갑작스레 주목받기 시작한 핀테크와 크게 다르지 않았다. 그간 잘 모르던 사람들이 아직 잘 모르는 사람들에게 이러한 용어들을 마치 새로운 것인 양 발표하는 셈이다.

빅데이터 관련 프로젝트 또한 마찬가지다. 필요한 데이터를 충분히 확보할 수 있는지, 어떻게 수행해나갈 것인지, 개인정보보호 관련 문제를 일으키진 않을지 등에 대한 고민과 준비가 부족한 채 비현실적인 분석 주제를 내놓는 경우가 여전히 적지 않다. 학생들을 대상으로 한 공모전조차 평가가 제대로 이뤄지지 않아 가치 없는 이벤트로 그치기도 한다.

가치 평가가 제대로 이뤄지지 않는 것은 전문성의 결여와, 전문성을 인정하는 인식의 부족에서 비롯된다. 국내에서 벤처 투자가 활성화되지 못하고 있는 것과 같은 맥락이다. 심지어 기업에서 데이터 분석 담당자를 구할 때도 분석능력에 대한 본질적인 판단이 결여돼, 별 중요치 않은 학벌이나 경력 위주로 채용하는 실정이다.

예를 들어 R 중급 개발자를 요즘 여기저기서 찾던데, 어느 정도 실력을 의미하는 것인지 고개를 갸웃거리게 된다. 2011년만 해도 R이 중요하다고 이야기하면 국내에서는 대부분 웃고 넘기던 분위기였는데, 그들이 뒤늦게 깨닫고 R을 배워서 써왔다고 해봤자 2년 남짓이라 본다. 이 정도면 초급자에 더 가깝지 않을까. 기존의 다른 분석도구를 사용한 것과 유사한 수준의 결과쯤은 낼 수 있을 터, 이에 대한 판단능력이 부족한 기업에서 실력을 구분하기란 쉽지 않을 것이다.


기억에 남는 데이터 분석 프로젝트가 있다면.

지난 2012년에 모 기업 미주법인의 부정 빌링 관련 프로젝트를 연구실 출신 제자와 둘이 수행, 데이터 시각화를 통해 8일 만에 해결한 일이 가장 기억에 남는다. 금방 해내니 고객사에서 깜짝 놀라던데, 비결은 다름 아니라 경험을 바탕으로 한 ‘감’이었다. 데이터 분석에도 역지사지(易地思之)를 우선 고려해야 한다. 데이터 분석 과정은 이를 기반으로 가설과 수단을 통해 확인하는 진행절차인 셈이다. 제자와 함께했다는 것만으로도 좋은 추억으로 남아있다.

다른 의미로 기억에 남는 것은 예측모형을 제시하면서 겪어온 일들이다. 일반적인 시계열모형이나 회귀모형은 시시각각 변화하는 다량의 데이터를 적용하기에는 부족하므로 새로 만들 필요가 있다. 요즘은 예측기간도 짧아졌지만 모형도 보다 쉽게 만들 수 있어 정확도가 높아졌다. 그런데 이 방법이 얼마나 좋은지 프로젝트 담당자에게 보여주면 오히려 화를 내기도 하더라. 자신의 일을 기계적인 방법에게 뺏긴다고 여기는 것 같은데, 어차피 최종결정은 사람의 몫이다.

우스갯소리로 우리나라 교육을 축지법 교육이라고들 하는데, 데이터 분석 분야는 10년을 해도 숙련됐다고 이야기하기 어려운 분야다. 이 10년은 반성의 기간이라고도 할 수 있다. 개인적으로도 초반 10년에는 자기만의 세계에 있었던 것 같다. 그때는 앞선 방법을 받아들이지 못하는 사람들을 이해할 수 없었지만, 이제는 그 사람들이 이해할 수 있는 방법으로 해결해야 진짜 실력자라고 여기게 됐다.


빅데이터의 핵심, 데이터 사이언티스트는 어떤 사람인가.

데이터를 통해 큰 가치를 창출해줄 수 있는 사람이라고 생각하며, 교육자로서 이런 인재의 육성을 돕고 싶다. 여러 곳에서 제시하는 데이터 사이언티스트의 다양한 조건에 거의 모두 동의한다. 그만큼 되기 어렵고, 그렇기 때문에 소중한 인재다.

이를 위해 가장 중요한 것은 역시 열정이라고 생각한다. 데이터에 대한 호기심도 많아야 하고, 분석의 길에 뜻이 있어야 한다. 많은 이들이 기술적인 방법부터 배우려 하는데, 이건 버튼 누르면 다 돌아가게 돼있다. 분석용 데이터를 스스로 만들고, 그 속에 어떤 의미가 담겼으며 이를 어떻게 활용할지 등의 본질적인 부분을 볼 수 있어야 한다. 개인적으로는 데이터를 한 줄씩 읽어보기도 하는데, 그만큼 방법론에 치우치지 않고 데이터 자체에 집중하기 위함이다.

여러 기업 경영진들로부터 빅데이터를 위한 데이터 사이언티스트 영입에 대해 질문을 받곤 하는데, 그때마다 어렵게 구할 필요 없이 내부의 데이터 분석 담당자들에게 재교육 기회를 제공하는 것을 추천하고 있다. 업무에 치이다보니 빠르게 변화하는 세태를 놓쳤을 뿐, 그들 역시 좋은 분석 인재였고 데이터 사이언티스트로 거듭날 수 있는 자질 또한 보유하고 있을 것이다. 데이터 사이언스는 내재화시키는 것이지, 외부에서 사오는 것이 아니다.


어드바이스에서 최근 데이터 사이언티스트 양성과정을 개설했던데.

한국외대 어드바이스(데이터시각화연구센터, Analytic Data Visualization Research Center)는 팁코소프트웨어 등의 권유로 지난해 3월 설립했다. 어드바이스의 데이터 시각화는 분석 기반 전달을 목표로, 상호작용성에 중점을 두고 있다. 분석의 시사점을 발견하는 UI 개념으로, 단순히 차트 그리기를 넘어 스토리텔링으로써 의사결정을 돕는 프로덕트도 개발하고 있다. 지난해 ‘팁코 나우’ 컨퍼런스에 이 같은 작품들을 전시했을 때 꽤 호평받기도 했다.

최근에는 피보탈코리아와 제휴해 데이터 사이언티스트 양성과정을 개설했다. 기업형 교육, 온디맨드·온사이트 교육을 하고 싶었는데 마침 피보탈과 방향성이 일치했다. 그간의 데이터 분석 전문가 육성이 IT개발 프로젝트처럼 진행되는 점을 이상하게 여겨왔기에, 애자일 방법론을 적용해 지나치게 긴 기간이 요구되지 않으면서도 보다 원활한 피드백이 이뤄질 수 있게 했다. 분석은 언제든지 수정·보완할 수 있어야 하고 필요시 방향까지 틀을 수 있어야 한다.

어드바이스는 번거롭고 복잡한 데이터 분석 분야에 편안함을 제공, 이 가운데 가치를 발굴해 사람들을 행복하게 만드는 것을 바라보고 있다. 올해는 데이터 분석도 애자일적인 접근이 가능하다는 점의 입증과, 이를 통한 인재 양성에 주력하려 한다. 모든지 처음은 모험적인 부분을 감수할 수밖에 없겠지만, 이를 극복하고 좋은 사례를 남겨 데이터 분석의 가치를 보다 널리 알리고자 한다.

 

인터뷰를 마치면서 최대우 한국외대 통계학과 교수는 향후 후진 양성에 더욱 힘을 쏟을 뜻을 밝혔다. “데이터 사이언티스트를 향한 꿈을 공유하는 제자들과 함께하는 것을 가장 의미 있는 일로 여긴다”면서, “엄하게 대하는 편인데도 찾아주고 따라줘서 고맙고, 또 어드바이스 학생들이 어느새 소속에 대한 자부심도 갖는 것 같아 뿌듯하다”고 웃음을 지었다.

그러나 그 와중에도 “국내 경기가 침체 일로를 걷고 있고, 취업시장에서는 우수한 인재들의 가치조차 제대로 평가되지 않는 것 같다”고 우려를 표하며, “요즘은 학생들에게 해외 진출을 염두에 두라고 종종 이야기한다. 좁은 곳을 벗어나 큰물로 나가는 일을 자연스럽게 받아들여 준비할 것을 권하고 있다”고 털어놨다.

한편, 최대우 교수는 “‘팁코 나우’ 등에 참여하면서 어드바이스가 충분한 경쟁력을 갖췄다고 느꼈다. 피보탈, 팁코 등 글로벌 기업들과 협력해 그간 개발한 결과물들을 글로벌 시장에 차차 선보일 예정”이라고 귀띔했다. “지금껏 그래왔듯, 희한한 것에 손 좀 대봤다”고 유쾌하게 밝히는 그가 새롭게 향하는 곳을 주목해본다.

▲ 최대우 한국외대 어드바이스 센터장은 데이터 분석 역량이 곧 국가경쟁력이라고 강조,
빅데이터를 조금씩 단계별로 시작해보길 권했다.

관련기사

저작권자 © 컴퓨터월드 무단전재 및 재배포 금지