데이터 계의 유니콘, 데이터사이언티스트들이 이야기하는 현실과 미래 (4)

[컴퓨터월드] ‘빅데이터’ 바람이 날로 거세지는 오늘날, 데이터 분석을 위한 도구와 방법 및 활용방안에 대한 논의는 곳곳에서 앞 다퉈 이뤄지고 있다. 그러나 정작 이를 수행할 주체인 ‘데이터 사이언티스트’에 대해서는 널리 인식되지 못하고 있는 것이 작금의 현실이다. 주어가 없는 문장이 그 의미의 해석에 모호함을 불러오듯, 데이터 사이언티스트가 없는 빅데이터는 그 방향성을 잃고 표류할 우려가 상존하기 마련이다.

이 가운데 지난 8일 본지와 빅데이터전문가협의회가 공동 주최한 ‘데이터 사이언티스트의 현실과 미래’ 컨퍼런스에서는 데이터 사이언티스트에 대해 함께 생각을 나누고, 세계적인 흐름을 파악하며, 국내의 현 주소 및 향후 전망을 짚어보는 자리가 마련됐다. 데이터 분석이 새로운 성장동력으로 부상하는 시대에 요구되는 인재상은 무엇이며, 데이터 사이언티스트라 불리는 그 인재의 현실과 미래는 각각 어떤지, 이에 대해 다양한 분야의 데이터 사이언티스트들에게 직접 들어본다.

 

 

총 9개의 세션 발표가 모두 종료된 후에는 ‘대한민국의 데이터 사이언티스트, 어디에 서있으며 어디로 가야하는가’를 화두로 패널 토의가 열렸다. 앞서 발표자로서 강연했던 이정현 한국DB진흥원 창의인재개발실장과 김정선 SKT 빅데이터TF 부장과 함께, 김동한 펜타시스템테크놀로지 고등기술연구소장이 새롭게 패널로 참여했으며, 전용준 리비젼컨설팅 대표의 사회로 진행됐다.

토의 주제는 ▲조직에 기여할 수 있는 데이터 사이언티스트는 어떤 특성을 가진 사람인가 ▲얼마나 많은 수의, 어떤 유형의 데이터 사이언티스트가 필요한가 ▲데이터 사이언티스트가 되기 위한 가장 좋은 방법 ▲데이터 사이언티스트 양성을 위해 정부/공공, 학계, 민간에서 무엇을 해야 하는가 등 네 가지가 선정됐다.


어떤 특성을 가져야 조직에 기여할 수 있나

이정현 한국DB진흥원 실장은 “데이터 사이언티스트를 양성하기 위해서는 생태계 조성이 중요하다”고 전제했다. 이어 “현재 기업의 IT 담당자들은 기업의 투자 부족으로 전문화돼있지 않아, 관련된 모든 일을 떠안고 있는 경우가 많다”며, “전문화, 특화가 이뤄지지 않으면 빅데이터를 다루는 데이터 사이언티스트가 향후에는 3D 업종이 될 수 있다”고 경고했다.

김정선 SKT 부장은 “조직 내 업무를 수행하고 성과를 내려면 해당 업계의 전문용어나 프로세스 등을 흡수할 수 있어야 한다”고 밝히는 한편, “데이터 사이언티스트가 기여하려면 먼저 데이터로써 의사결정이 이뤄지는 데이터 드리븐(Data-Driven)적인 기업문화와, 데이터를 활용하는 프로세스의 정례화가 바탕이 돼야 한다”고 주장했다. 또 “기업에서는 데이터 사이언티스트에게 업무 효율화도 바라지만, 무엇보다 새로운 성장동력을 찾아내는 걸 바란다”고 덧붙였다.


어떤 유형이 얼마나 많이 필요한가

김동한 펜타시스템 소장은 “인과관계를 분석해 아웃풋을 제공한다는 측면에서, 공학도로서 데이터 사이언스보다는 데이터 엔지니어링이라는 표현이 어울린다고 본다”고 사견을 밝히면서, “기존의 순수한 분석가 및 기업 내 데이터 분석팀을 제외한, 앞으로의 국내 수요는 400명 미만일 것”으로 예상했다.

김정선 SKT 부장은 “데이터 사이언티스트라는 용어의 정의가 아직 애매한 부분이 있어, 그 규모에 대해서도 생각하는 부분이 다를 수 있다”며, “데이터 엔지니어링으로 접근하는 영역과 데이터 사이언티픽 리서치로 접근하는 영역을 달리 본다면, 이 두 가지 영역을 모두 가져가는 경우도 있겠지만 어느 한쪽에 집중하는 경우도 있을 것”이라고 설명했다.

이정현 한국DB진흥원 실장은 “빅데이터 산업 발전 전략에서는 2017년도까지 데이터 사이언티스트 5,000명 양성을 목표로 잡고 있다”며, “데이터가 넘쳐나는 현재, 데이터로 뭔가를 시도할 수 있는 데이터 드리븐 마인드를 지닌 사람이 많이 늘어나야 새로운 산업과 부가가치가 창출될 수 있고, 이러한 활성화를 통해 데이터 사이언티스트의 수요도 따라서 증가할 것”으로 내다봤다.


어떻게 해야 될 수 있나

김정선 SKT 부장은 “DB진흥원 또는 학교에서 열리는 정규화된 양성과정에 참여하는 게 지름길”이라며, “이를 통해 엔지니어링 영역과 사이언티픽 리서치 영역을 연결하는 역량을 가질 수도 있다”고 말했다.

김동한 펜타시스템 소장은 “석·박사 학위까지는 필수적이지 않고, 관심 있는 분야에 대한 교육은 받을 필요가 있다”고 밝혔다. 또한 “대부분의 대학교 졸업생들이 자기 전공에 대한 전문 소양이 부족해 기업에서 3년 이상 재교육에 투자하는 상황”이라며, “기업들끼리 이러한 전문화 교육을 공용화해서 효율적인 프로그램을 마련했으면 좋겠다”고 덧붙였다.

아울러 김동한 소장은 데이터 사이언티스트를 채용한다면 어떤 조건을 보겠느냐는 질문에 “파이썬과 하둡 경험자 등을 찾겠지만, 하둡 자체가 분산 환경에서 돌기 때문에 적용 환경이 다 다르므로, 간단히 설치해보고 조금 돌려본 정도로는 역량이 있다고 보지 않는다”며, “최근 미국에서도 몇 개 노드 이상에서 하둡을 돌려본 엔지니어가 부족해 여기저기서 구한다”고 말했다. “결국 자체 육성한다는 생각으로, 소통하고 배우려는 태도를 중시할 것”이라며, “보수적인 분석을 넘어 데이터를 헤집어서 가져오는 자세를 갖춰야 자리 잡을 수 있다”는 게 김 소장의 설명이다.

이에 대해 대학원에서 데이터마이닝을 공부중이라는 한 청중의 질문도 이어졌다. ‘학생 입장에서는 대학원에서도 다양한 데이터를 접할 기회가 부족한데, 데이터를 다루는 경험을 쌓기 위해서는 어떻게 해야 하는가’라는 질문에 대해 김동한 소장은 “기업에 입사한다고 해서 많은 데이터를 다룰 수 있는 건 아니고, 기업의 성격에 따라 다르다”며, “실무적으로 접근하려면 공공데이터 개방이 좋은 사례라고 본다”고 답변했다.

이와 함께 김동한 소장은 “정부에서 빅데이터 프로젝트를 내세우나 일단 예산이 적고, 실상을 보면 빅데이터로 다루고 싶은 것도 적다”고 지적했다. “국내 성공사례로 서울시 심야버스가 꼽히는데, 다른 공공기관과의 차이점은 전담부서가 있었다는 것”이라며, “내·외부에 모두 전문가가 있어야 빅데이터 산업이 발전할 수 있다”고 역설했다.

한편, SK텔레콤 소속 데이터 사이언티스트의 최고 연봉을 묻는 청중의 질문에 김정선 부장은 “수억을 받는 사람도 있다”며, “조직 관리 측면에서 후배들이 따를 만한 스타 직원의 존재가 필요하기 때문”으로 풀이했다.


양성하기 위해 무엇을 해야 하는가

김동한 펜타시스템 소장은 “IT 산업 전체에 해당되는 이야기로, SW에 대한 처우가 좋지 않은 점을 개선하면 자연히 해결될 것”이라며, “SW 개발단가 기준으로 데이터 분석팀의 인력 프로파일을 넣으면 학력이나 연령이 너무 높다고 하면서 데이터 사이언티스트의 능력을 요구한다는 건 앞뒤가 맞지 않는 것”이라고 꼬집었다. 이어 “정부에서, 담당자의 정당한 면책권 보장을 전제로, 빅데이터나 데이터 사이언티스트 관련 공공 프로젝트의 실패사례를 공유해주면 밑거름이 될 것”이라고 제안했다.

김정선 SKT 부장은 “어느 정도 이상의 데이터가 아니라면 기존 RDBMS에서도 잘 돌아가는데, 괜히 하둡이나 오픈소스를 적용했을 때 오히려 문제가 발생할 수도 있다”며, “정말로 큰 볼륨의 데이터를 다룰 수 있는 기업체는 국내에 몇 군데 되지 않는다”고 언급했다. 더불어 “여러 공공기관에서 대기업들이 갖고 있는 노하우를 공유할 수 있는 장이 마련됐으면 한다”고 희망했다.

이정현 한국DB진흥원 실장은 “빅데이터라는 용어가 관련 사업이나 프로젝트에서 예산을 따거나 장식하기 위한 접두어로 남용되는 게 사실”이라며, “이 가운데 실질적으로는 빅데이터가 아닌 대용량 DB 사례도 많아서 실패사례를 공유하기 쉽지 않은 면도 있다”고 털어놨다. “이러한 부분은 사전 검증작업과, 전문가들의 가치를 인정해주는 풍토가 요구된다”고 짚었다.

아울러 이정현 실장은 “정부는 인력 양성에서 촉매 역할로, 궁극적으로는 생태계를 조성해주는 역할을 맡아 산업을 활성화시켜 인력 양성도 이뤄지는 선순환을 만들 필요가 있다”며, “그러기 위해서는 정보 개방 및 데이터 품질 자정의 노력이 필요하다”고 밝혔다. 또 “요즘 O2O 서비스가 많이 나오는데, ‘우버택시’처럼 실정법에 위배돼서 국내 서비스를 제대로 못하는 경우를 접하다보면 규제 개혁의 필요성도 느낀다”고 덧붙였다.

전용준 리비젼컨설팅 대표는 “정부 공공 쪽에 프로젝트 개수를 줄이고 단가를 높이자고 부탁하고 싶다”며, “하다만 프로젝트 100개보다 결과를 낸 프로젝트 5개가 데이터 사이언티스트 육성에 도움이 된다”고 강조했다.

마지막으로 한 청중은 “미국에서 컨퍼런스에 가보니 미국정부 차원에서 산·학·연을 접목시키는 게 보였다”고 언급했다. “정부와 기업들이 공유할 수 있는 데이터를 공유하면, 이를 통해 전문가와 학생들이 얼마든지 배우고 활용할 수 있다”며, “이러한 공유센터 등의 장이 마련되면 서로 연결되고 협업하는 과정을 통해 더 많은 데이터 사이언티스트가 양성될 수 있다”고 의견을 피력했다.

 

저작권자 © 컴퓨터월드 무단전재 및 재배포 금지