비즈니스 관점에서 데이터 풀어내는 융합형 고급 인재

 

 

[컴퓨터월드] 산업화 시대 ‘철’과 ‘석탄’이, 정보화시대 ‘인터넷’이 핵심자원이었다면, 스마트시대에는 ‘빅데이터’가 핵심자원으로 떠오르고 있다. 스마트폰·SNS·사물인터넷(IoT) 확산 등에 따른 데이터 폭증으로 만들어진 빅데이터는 의료·행정·소매·제조·개인정보에 적용할 경우 생산성을 추가적으로 높일 수 있다. 또한 IBM이 실패했던 영-불 자동번역시스템을 구글이 수억 건 데이터로 50여개 언어로 자동번역에 성공했던 사례처럼 과거에는 불가능했던 많은 일들이 빅데이터를 통해 현실화되고 있다.
빅데이터는 ‘자체’로도 가치가 있지만 ‘활용’을 했을 때 진정한 가치를 발휘한다. 이는 마치 원석을 가공해 보석이 되는 과정과도 같다. 원석도 보석세공사가 누구냐에 따라 가치가 달라지듯 빅데이터 역시 이를 활용할 수 있는 데이터사이언티스트에 따라 가치가 달라진다.
빅데이터를 활용해 가치를 찾는 ‘데이터사이언티스트’는 누구이며, 데이터사이언티스트는 어떻게 육성되어야 하며 현안은 무엇인지 조명해 본다.


중세 유럽 연금술 연구는 비금속(卑金屬)을 가열하거나 혼합해 금을 생성하는 것으로부터 시작됐다. 이를 연구하는 자는 자연계 물질에는 각각 본질이 깃든 정령들이 존재하며, 흙, 물, 공기, 불 등 4대 원소의 비율을 변화시키면 다른 물질을 만들 수 있다고 믿었다. 이들이 바로 연금술사다.

연금술사는 초자연적인 힘이나 존재에 대한 믿음을 바탕으로 다양한 연구와 실험에 앞장섰으나 이들이 원하는 것을 얻을 수는 없었다. 그 대신 연금술사들은 비금속을 황산염·백반·염화나트륨 등과 반응시켜 뜻하지 않게 황산·염산·질산 등을 발견하는 쾌거를 이뤘다. 이 과정에서 새로운 실험 기구 등을 만들어내는 것을 포함해 근대 화학 발달에 연금술사는 많은 기여를 했다.

현재 비즈니스 데이터에서 가치를 찾으려는 ‘데이터사이언티스트(Data Scientist)’는 비금속에서 금을 찾으려고 했던 연금술사와 많이 닮아 있다.

‘데이터’를 연구하는 ‘데이터사이언티스트’

21세기 연금술사라 할 수 있는 데이터사이언티스트는 IT 시장의 최대 화두인 ‘빅데이터(Bigdata)와 궤를 같이하고 있다.

빅데이터 역시 21세기 원유라고 불리는 것처럼 빅데이터는 과거부터 존재했지만, 최근 스마트폰, 태블릿 등 모바일 장치의 폭발적인 증가와 함께 SNS(Social Network Service) 증가로 기존에 다루지 않았던 데이터를 수집해 가치를 얻기 위한 행위가 관심을 받으면서 주목 받고 있다.

▲ 페르시아의 연금술사인 라지는 9세기 원유를 증류하여 얻은 케로신을 이용해 등불을 밝혔다 (출처 : 위키백과)
더 나아가 기업들은 과거 제품을 생산하거나 서비스할 때 원가를 낮춰 경쟁력을 갖추려고 했다면 이제는 지금껏 쌓아두기만 했던 데이터를 잘만 활용하면 기업 경쟁력을 획기적으로 높일 수 있다는 분위기가 한 몫 하고 있다. 즉, 이제는 데이터가 기업의 경쟁력이자 자본으로 가치를 인정받고 있는 것이다.

가치를 인정받은 데이터라고 하더라도 원유인 만큼 이대로 활용하기는 힘들다. 원유를 경유, 휘발유, LPG 등 정제된 석유 제품으로 가공하는 것처럼 데이터의 본질을 판단해 통찰력 제시는 물론 의사결정을 지원하는 ‘데이터사이언티스트’가 필수 요소로 관심을 받고 있다.

물론 기존에 데이터를 다루는 직종으로 데이터 관리자, 데이터 분석가 등이 있었지만 데이터사이언티스트는 그들과 동일 선상이라고 보기는 힘들다. 데이터 관리자, 데이터 분석가가 IT 기술을 바탕으로 과거 데이터를 분석하고 확률을 통해 예측한다면, 데이터사이언티스트는 데이터 속에서 종합적인 분석과 통찰력을 가지고 예측하는 것은 물론 비즈니스와 기획이 가미되어 취합 및 조율 과정을 거쳐 기업의 새로운 가치도 부여해야한다는 점에서 좀 더 상위 개념이라고 할 수 있다.

이에 데이터 관리자, 데이터 분석가가 데이터 처리 및 데이터 분석 전문 기술을 요구한다면, 데이터사이언티스트는 데이터 분석 전문 기술은 물론 수학, 통계학, 사회학 등 다양하고 넓은 전문 지식을 바탕으로 빅데이터 속에서 숨겨진 가치를 발견하여 비즈니스 통찰력을 제시해 주고 의사 결정을 지원한다.

데이터에 기반을 둔 객관적 의사결정의 조력자

가트너는 데이터사이언티스트에 대해 컴퓨터 공학과 수학적 기반의 의미를 부여하고, 디지털 시스템에 지식을 결합하는 전문가로 데이터의 저장, 이동, 분산처리를 활용해 정보를 요청하는 고객에게 최선의 기대 서비스를 제공하는 사람이라고 정의하고 있으며, 한국정보화진흥원(NIA)는 빅데이터에 대한 이론적 지식과 분석 기술에 대한 숙련을 바탕으로 통찰력, 전달력, 협동능력을 발휘할 수 있는 전문 인력이라고 정의하고 있다.

기업 입장에서 데이터사이언티스트의 등장은 의사결정 방식을 송두리째 바꾸는 계기가 됐다는 점에서 의미가 크다. 지금까지 기업의 의사결정은 의사결정권자의 감이나 직관으로 이뤄졌다. 물론 실무급에서 데이터를 활용한 보고서를 제출하지만 이는 그저 ‘덤’일 뿐 의사결정에서 중요한 요소가 되지 못했다. 의사결정권자의 주관적인 판단력에 한 기업의 흥망성쇠를 거는 게 일반적인 방식이었다.

이제는 철저한 데이터 분석 결과를 토대로 객관적이며 합리적인 의사 결정을 내릴 수 있는 기반이 데이터사이언티스트에 의해 마련됐으며, 이 영역이 비단 IT에 국한되지 않고 기업의 비즈니스 전반에 걸쳐 전문성을 겸비하고 있어 기업들은 데이터사이언티스트를 활용해 실시간 데이터 흐름을 읽고 비즈니스를 최적화해 통찰력을 제공받을 수 있는 시대를 맞이하게 됐다.

 
이런 데이터사이언티스트의 역량을 쉽게 엿볼 수 있는 것이 2011년 개봉한 영화 ‘머니볼’이다. 머니볼은 메이저리그의 역사를 다시 쓰며 세계적인 유명인사로 떠오른 오클랜드 애슬레틱스 빌리 빈(Billy Beane) 단장의 성공 실화를 영화화한 작품으로 자본의 한계를 데이터 분석으로 뛰어넘은 일화를 다루고 있다.

1997년 오클랜드 애슬레틱스 팀 단장으로 취임한 빌리 빈 단장은 만년 최하위 실력에 그나마 실력 있는 선수들은 다른 구단에 뺏기기 일쑤인 오합지졸 구단을 재정비하기로 마음먹는다. 그가 내세운 첫 번째 카드는 ‘유명선수들을 경기에 내보내지 않는 것’이었다. 심지어 유명선수를 다른 팀으로 이직시키는 일도 서슴지 않았다. 그 대신 사생활 문란 선수, 잦은 부상에 시달리는 선수, 최고령 선수 등 다른 구단에서 외면 받거나 몸값이 싼 선수들을 팀에 합류시키고 경기에 출전시켰다. 이를 두고 빌리 빈 단장은 야구계는 물론 언론까지 “직감과 경험을 무시하고 컴퓨터 데이터로 야구를 하려 한다”는 비아냥거림을 들어야 했다.

▲ 출루율 높다는 이유로 오클랜드 애슬레틱스로 영입된 스캇 해티버그는 빌리빈 단장의 조언에 따라 포수에서 1루수로 전향했다. 이후 그는 선수 생활에서 기록에 남을 오클랜드 애슬레틱스 20연승 끝내기 홈런의 주인공이 됐다.
빌리 빈 단장은 소위 유명선수라고 칭하는 홈런과 안타를 잘 치는 타자 대신 ‘얼마나 잘 출루하는가’에 대한 지표인 출루율이 가장 높은 선수들만 골라 팀을 꾸린 것이다. 그 대표적인 사례가 팔꿈치 부상으로 선수 생명에 위기를 맞고 있던 스캇 해티버그(Scott Hatteberg)를 영입한 건이다. 스캇 해티버그는 유명선수도 아니었으며, 홈런은 물론 장타율, 타율 어느 것 하나 뛰어난 점이 없었다. 그러나 그에게 유일한 장점은 스트라이크존을 명확하게 파악하는 선구안 능력을 백분활용해 대부분 출루에 성공한다는 점이다.

최하위 팀을 리그 승리로 이끈 데이터 분석의 힘

빌리 빈 단장은 과거 야구계에서 선수를 직접 만나 타격감을 보고 재목을 고르는 직관에 의존했던 스카우트 방식에서 탈피, 오로지 메이저리그의 모든 경기를 통해 축적된 선수의 데이터를 기반으로 선수들의 재능을 평가해 적은 비용으로 높은 효과를 거두는 선수를 고용해 자신의 라인업을 설계했다. 이 같은 노력은 만년 하위인 오클랜드 애슬레틱스 팀을 5번이나 포스트시즌에 진출시키는 것은 물론 140년 메이저리그 역사상 최초로 20연승이라는 최대 이변이자 혁신을 만들어내는 결과물로 끌어냈다.

이후 야구계는 빌리 빈 단장의 펼쳤던 경기 데이터를 철저하게 분석해 오직 데이터를 기반으로 적재적소에 선수들을 배치해 승률을 높이는 게임 이론인 ‘머니볼 이론’을 도입기에 이르렀다.

▲ 피터 브랜드는 직감과 경험에 의해 선수를 영입했던 기존 야구계의 틀을 깨고 오로지 기록만으로 선수를 판단해야 한다는 주장을 펼쳤다
이처럼 빌리 빈 단장이 메이저리그 역사를 새로 쓸 수 있던 것은 데이터에 기반을 두고 선수 분석한 하버드대 경제학을 전공한 ‘폴 데포데스터(Paul DePodesta)’라는 실존 인물을 기반을 둔 피터 브랜드를 적극 활용한 점이다.

예일대 출신 데이터 분석가 피터 브랜드는 머니볼 이론을 주장했으며, 궁핍한 구단 재정 상태 때문에 유명선수보다는 값싸고 실속 있는 선수를 영입해야한다는 빌리 빈의 생각과 일치한 인물로 피터 브랜드를 부단장으로 영입했다. 피터는 야구에 데이터를 접목해 데이터 분석을 통한 선수 개인의 능력을 가격대비효율이라는 점수로 산출했다. 이 데이터를 기반으로 빌리 빈 단장은 야구 선수 출신으로 ‘야구는 1-2-3루를 돌아 홈으로 들어와야 득점하는 경기’라는 본질을 알고 있었으며, 득점으로 연결되는 가장 확실한 지표는 타율이 아니라 출루율이라는 사실에 근거해 모두가 타율 높고 발 빠른 타자를 영입할 때 타율보다는 출루율, 기동력보다는 장타력이 우수한 선수들로 영입해 팀을 짰다.

이렇듯 빌리 빈 단장의 야구에 대한 전문성과 피터 브랜드의 데이터 분석이 결합돼 ‘야구는 통계 스포츠’라는 공식을 증명해낸 것이다.

IT가 아닌 비즈니스 시각에서 접근하다

영화 머니볼 사례에서 보듯 오클랜드 애슬레틱스 팀은 선수 기록의 통계 데이터를 분석해 선수 가치를 수치화했다. 이 과정에서 야구 지식이 수반되지 않았다면 그저 선수가 보유한 기록 갱신용 데이터에 불과했을 것이다.

데이터사이언티스트 역시 IT 지식은 물론, 경영, 통계와 분석을 두루 갖춘 전문성이 요구되지만 그보다 중요한 것은 기업 입장에서 비즈니스에 대한 전문성을 갖춰야한다는 것이다.

제 아무리 IT, 경영, 통계 등 전문성을 갖췄다고 한 듯 다루는 데이터에 대한 이해 없이는 통찰력을 발휘할 수도 없을 뿐더러 가치 찾기는 더더욱 힘들기 때문이다.

실제 데이터사이언티스가 기존에 데이터를 다뤄왔던 데이터 관리자 및 데이터 분석가처럼 IT 중심의 시각에서 데이터를 접근하는 것이 아닌 비즈니스 시각에서 데이터를 접근하고 있다는 점에서 데이터 관리자와 데이터 분석가와 차별을 둔다.

▲ 데이터사이언티스는 오케스트라 지휘자처럼 악기 전문가는 아니지만 각 악기의 특성을 이해하고 전체를 조화롭게 만들 수 있는 능력을 가진 역할이다.
이를 두고 SAS코리아 김윤건 부장은 데이터사이언티스트를 ‘오케스트라 지휘자’로 비유한다.

김윤건 부장은 “IT를 활용해 빅데이터로부터 통찰력을 얻어내는 일인 만큼 통계학, 수학, 경제학, 심리학 등 다양한 분야의 지식은 물론, IT기술과 엔지니어링 각 해당 분야의 전문 지식까지 갖춰야 한다. 더불어 데이터 분석의 가치를 제대로 전달하고 설득할 수 있는 소통 능력까지 발휘할 수 있어야 한다.”고 데이터사이언티스를 조건에 대해 설명했다.

이어 김 부장은 “데이터사이언티스트는 오케스트라 지휘자 같은 역할”이라며, “지휘자는 모든 악기를 능숙하게 다룰 수 있는 전문가는 아니지만 각 악기의 특성을 잘 파악하고 오케스트라 음악 전체가 조화를 이룰 수 있도록 진두지휘한다. 데이터사이언티스트 역시 어느 한 분야의 전문가는 아니지만, 분석의 힘을 이해하고 각 분야의 특성을 잘 알고 있기 때문에 기업에 조화로운 가치를 제공할 수 있다.”고 의견을 밝혔다.

한국과학기술정보연구원(KISTI)에서 발간한 ‘국내 빅데이터 산업의 현황과 전망(′12.12)’ 보고서에 따르면 2015년 글로벌 빅데이터 시장은 18조 2천억 원 규모로 약 39%의 성장률을 보일 것으로 전망하고 있으며, 국내 시장은 약 300억 원 규모로 내다보고 있다.

민·관, 데이터사이언티스트 양성 초석 다지기 나서

이에 따라 빅데이터 전문가 수요는 미국이 490,000명, 영국이 58,000명, 한국이 10,000만 규모로 급증할 것(한국DB진흥원, DB산업 인력현황 조사 및 맥킨지 자료 분석)이라고 내다봤다

빅데이터 전문가 수요에 대한 SAS의 조사에 따르면, 2017년까지 이 수요가 2배 이상 늘어나 6만 9,000명에 달할 것으로 예상됐다. 이 보고서에 따르면 영국 대기업 5개 중 3개사가 빅데이터 전문 기술을 가진 사람을 채용하고자 분투하고 있다고 전했다.

또한 2011년 5월 맥킨지 조사에 따르면 대용량 데이터를 분석하는 유통업체는 최대 60%의 운영 수익을 기대할 수 있으며, 의료산업의 경우 연간 8% 또는 2천억 달러를 절감할 수 있다고 한다.

강력한 분석 능력을 소유한 세계적 기업들이 성과를 올리면서 ‘데이터사이언티스트’의 중요성은 입증되고 있는 것이다. 업계에서는 이미 데이터사이언티스트가 빅데이터 전쟁의 패권을 좌우할 핵심인재로 여기고 인재 확보 치열한 경쟁을 벌이고 있다.

우리나라 역시 정부는 물론 민간에서도 데이터사이언티스트 양성을 위해 팔을 걷어붙이고 있다. 그러나 스탠포드대학교, 하버드대학교 등 미국 30개 대학교에서 빅데이터 교육과정을 개설, SAS, 클라우데라 등에서 빅데이터 전문 자격을 개발·보급하는 등 미국 사례처럼 선진국들이 빅데이터 인력양성 등에 집중 투자하는 반면 국내 빅데이터 인력양성체계는 초보 수준으로 평가되고 있다.

그나마 최근 국내에서도 ‘신직업 발굴·육성 추진방안(국무회의 대통령 보고자료, ′13.7.23)’을 발표해 빅데이터 전문가를 신직업으로 정의, 신규 일자리와 고부가가치 창출을 도모하는 한편 미래부와 관계부처 합동으로 데이터 전문인력 양성과 일자리 연계를 골자로 한 ‘창조경제 및 정부3.0 지원을 위한 빅데이터 산업 발전전략’을 지난해 12월 발표하는 등 데이터사이언티스트 양성을 위한 초석 다지기에 나섰다.

정부는 2017년까지 국내 최고 수준의 데이터과학자 1천명 등 수준별 전문인력 5천명을 양성하겠다는 목표 아래 최정예 전문가 및 재직자와 잠재인재 등을 양성하겠다는 계획을 세우고 있다. 우선 최정예 전문 인력은 연구망(KOREN, 기가급)을 통해 국내 주요대학과 빅데이터분석활용센터를 연결한 랩(LAB) 운영으로 데이터과학급 1천명을 양성하겠다는 것이다. DB 직무 종사자 대상 집중 전문교육으로 빅데이터 업무에 활용할 수 있는 능력을 갖춘 실무 전문가 3천명도 양성하는 한편, 융합프로그램 신설 및 관련 대학원 대학IT연구센터(ITRC, Information Technology Research Center), 교용계약형 석사과정 등에 관련 교과목 지원으로 데이터 융합·분석 잠재인력 1천명을 양성하겠다는 전략이다.

최정예 전문 인력 양성을 담당하는 한국정보화진흥원(NIA)은 진흥원 내 빅데이터분석활용센터를 적극 활용하고 있다.

빅데이터분석활용센터 빅데이터기획부 신신애 부장은 “빅데이터 관련 대학들과 연계해 실무형 교과과정을 만들고 이를 대학에 전파하는 한편 대학에서 인재 양성에서 어려운 점을 파악해 도움을 주는 방향으로 인재 양성 전략을 펼치고 있다”고 밝힌 것처럼 NIA는 장기적인 인재양성을 목적으로 전략을 펼치고 있다.

대학 연계 장기적 인재 육성은 물론 재직자 대상 실무전문가 양성 나서

실제 빅데이터분석활용센터는 빅데이터 분석 인프라를 보유하기 어려운 중소기업, 1인 창조기업, 대학, 연구소 등이 대용량 데이터 분석 및 기술개발·검증에 사용할 수 있는 테스트베드를 제공하는 것은 물론 데이터 과학자 및 빅데이터 기술인력 양성을 위해 실무중심 교육 교과과정에 맞는 실습 환경을 제공한다. 원격으로 교육지원 인프라에 접속하여 시스템 구축 및 데이터 분석, 프로그램 개발 등 다양한 실습을 수행할 수 있도록 실습서버 30대, 실습지원서버 1대로 구성돼, 가상화 기술을 적용하여 동시에 180대의 실습용 가상머신을 제공한다. 또한 가상머신은 △리눅스 △하둡(Hadoop) △하둡-에이치베이스(HBase) △하둡-하이브(Hive) △하둡-에코(ECO) 등으로 구성되어 있으며, 하둡(Hadoop)을 비롯해 △하이브(Hive) △피그(Pig) △머하웃(Mahout) △알(R) △플룸(Flume) △스쿱(Sqoop) △우지(Oozie) 등 오픈소스 SW들이 사용되고 있다.

또한 장기적인 전문인력 양성을 위해 NIA는 △강원대 △덕성여대 △숙명여대 △울산과기대 △충북대 등 5개 대학을 중심으로 대학 협의체를 구성해 정보공유는 물론 교과과정과 분석에 관련된 모델예제 등을 개발해 제공하는 등 교수 및 대학들과 소통을 만들어나가고 있다.

뿐만 아니라 현장 실무에 즉시 활용 가능한 실무 중심의 비즈니스 분석 전문 인력 양성을 목적으로 대학 재학생 및 취업 예정자 40명을 대상으로 전문 교육 프로그램을 지난해 하반기동안 운영해 수료생 중 SKT, 다음, CJ올리브영, 네이버, TNS 코리아 등에 7명을 취업시키기도 했다.

빅데이터를 업무에 활용할 수 있는 능력을 갖춘 실무전문가를 양성하기 위해 한국데이터베이스진흥원은 빅데이터 아카데미를 지난해 6월 개설해 △빅데이터 기술 전문가 △빅데이터 분석 전문가 등 2개의 운영 과정과 과정별 교과과정을 개발, 최소 3년 이상 경력자를 대상으로 직무기준, 선수조건 등을 확정해 운영하고 있다.

실제 시행 첫 해인 지난해 200여명의 교육생을 배출한 바 있는 빅데이터 아카데미는 빅데이터 프로젝트에 참여한 최소 3년 이상의 데이터 기술‧분석 경력자를 대상으로 연수생을 선발, 3.7:1의 경쟁률을 기록했다. 수료생의 평균 나이는 37.9세, 평균 경력은 10.1년으로 나타나 현업 전문가들의 참여가 두드러진 것도 특징이다.

특히 빅데이터 아카데미 교육과정에서 △기업재무정보 및 공시정보를 활용해 상장 폐지될 기업을 예측하는 ‘상장폐지기업 예측’ △개봉 영화 선호 패턴 분석으로 마케팅 대상 분류 및 향후 흥행 수입을 예측하는 ‘최신 영화 분석’ 등 실무 위주의 주요 프로젝트를 진행하기도 했다.
 

 
특히 올해는 빅데이터 직무분석을 결과를 반영해 △기획 △처리 △분석 △시각화 △운영관리 등 5개 핵심 능력과 21개 능력 단위 및 67개의 능력 단위 요소기술로 구성해 교과과정에 반영하는 한편 온·오프라인교육, 프로젝트, 현장연수, 워크숍 등을 통해 올해에도 총 200명의 빅데이터 기술 전문가와 빅데이터 분석 전문가를 양성할 예정이다.

뿐만 아니라, 현장 적용 만족도를 높이기 위해 실습서버를 지원하고, 전문 멘토단을 구성해 프로젝트 운영 시 필요한 핵심 정보 등을 제공할 계획이다.

민간에서 IT 컨설팅 업체인 투이컨설팅이 지난 4월 국내에서 처음으로 데이터사이언티스트 단기 교육 과정을 개설하여 비즈니스·데이터·분석 기법에 대한 지식을 갖추고 데이터 분석을 경영 활동에 내재화하는 프로세스 혁신 및 전략 기획 능력을 보유한 데이터사이언티스트를 양성하기 시작했다.

SAS코리아 역시 ‘SAS 데이터사이언티스트’ 교육과정을 지난해 개설했다. 약 10일간 진행되는 과정으로 기업의 빅데이터 활용을 전문적으로 담당할 인력 양성에 초점을 둔 비즈니스 실무 교육과정으로 SAS 솔루션 실습을 통한 분석 기술의 이해, 데이터 인사이트 도출, 비즈니스 전략 수립 등 실무 중심의 교과과정으로 구성되어 있다.

SAS의 전문 컨설턴트나 교육 팀 강사진뿐만 아니라 외부의 분석 전문가나 교수들이 함께 참여해 다양한 인사이트를 전달해주고 있다. 실제 빅데이터 및 분석에 대한 단순 개념 정리부터 SAS 비주얼 애널리틱스(Visual Analytics)와 같은 솔루션을 사용한 실습까지 다양한 정보를 제공한다.

한국EMC는 EMC가 세계 45개국 300여 교육 기관을 대상으로 진행하고 있는 EMC 산학협력 프로그램인 ‘EAA(EMC Academic Alliance)’에 따라 숭실대학교를 비롯해 카이스트, 충남대, 금오공대 등 주요 대학들과 산학협력 양해각서(MOU)를 체결하고 빅데이터 전문 인력 양성을 위한 협력을 강화해 나가고 있다.

대기업도 빅데이터 전담 조직 꾸려…내부 전문가 영입 및 양성 나서

카이스트와 딜로이트가 ‘비즈니스 애널리틱스 아카데미’를 개설했는가 하면 각 대학교들도 기존 데이터마이닝학과와 정보통계처리학과의 교육 영역을 확장해 빅데이터를 다루고 있다.

특히 서울대학교는 지난해 12월 ‘데이터과학과 지식창출 연구센터’를 설립하고 통계학과 교수 5인, 산업공학 교수 3인, 컴퓨터과학 교수 2인, 의학 교수 3인 등 다양한 학문 분야의 교수진들이 협력해 공학, 의학 등 타 분야에의 접목과 응용 방안을 연구하고 있으며, 충북대학교는 국내에서 처음으로 ‘비즈니스데이터융합학과’ 대학원을 개설하고 총 11명의 학생이 입학해 비즈니스 데이터 분석, 빅데이터 분석, 통계분석, 3차원 이미지 분야를 공부하면서 데이터 사이언트로서의 꿈을 키워나가고 있다. 전사적자원관리(ERP), 데이터마이닝, 인공지능, 통계분석, 정보검색, 자연어 처리, SNS 분석, 이미지그래픽스를 전공한 9명의 교수들이 비즈니스와 IT 기술을 겸비한 융합형 전문가 양성을 목표로 교육하고 있다.

LG디스플레이, 코스콤, 현대중공업, 대신증권, SC제일은행 등 국내 대기업들도 전사적으로 빅데이터를 사내에 적용하기 위해 전담 조직 신설에 나서고 있다. 이들 기업은 공통적으로 빅데이터를 기반으로 경영환경을 구축하는 것이 목표다. 전담 조직에서 체계적으로 빅데이터 관련 과제를 발굴, 기술 검토, 전사 업무 적용 계획을 수립할 계획이다.

LG디스플레이는 70%를 통계학 전공 박사급 인력들로 구성한 빅데이터 전담 조직인 ‘분석 CoE(Center of excellence)’를 구성, 운영하고 있다. 이 전담조직 운영으로 LG디스플레이는 생산 공정과 관련된 대규모 데이터를 분석해 품질을 높이고 수익을 극대화하는 것을 목표로 하고 있다.

코스콤은 연구소 내 별도의 R&D팀에서 빅데이터 프로젝트를 전담하고 있다. 총 9명의 전문가들이 데이터 수집·분석·시각화·시스템 운용 등을 담당하고 있다.

현대중공업, 대신증권, 교보증권 등도 향후 전담 조직 구성을 계획하고 있는 기업들이다. 특히 현대중공업은 현재 빅데이터 기술과 적용에 대한 타당성을 분석하는 단계로, 전사 추진 로드맵이 확정되면 전담조직을 구성할 계획이다. 지금은 기존 운영, 개발 조직 간 협업 형태로 파일럿 프로젝트가 진행되고 있다.

▲ 건강보험심사평가원과 SAS코리아는 빅데이터 사이언티스트 양성을 위한 MOU를 체결했다.
한편, 건강보험심사평가원은 SAS코리아와 함께 보건의료 빅데이터에 대한 이해와 사용능력에 대한 인증을 위해 ‘보건의료 데이터사이언티스트 인증 프로그램’, 심사평가원의 내부 빅데이터 전문가 양성을 위한 ‘심사평가원 업무에 맞춘 SAS 교육 프로그램’등을 협력 개발하고, 새로운 인재 발굴을 위한 ‘보건의료 데이터 마이닝경진대회’도 매년 공동 개최할 예정이다.

SAS코리아 김윤건 부장은 “SAS는 국내 빅데이터 전문가 양성에 대한 '책임감'을 느끼고, 데이터사이언티스트를 배출하기 위한 교과과정을 마련했다.”며, “SAS는 국내 다양한 기업 및 공공기관에 도입돼 활발히 사용되고 있으며, 그만큼 빅데이터 분석 솔루션 시장 형성 및 성장에 대한 책임감을 느끼고 있다. 제품을 판매하는 만큼, 그 제품을 제대로 활용할 줄 아는 전문가가 필요하다. SAS의 데이터사이언티스트 양성 프로그램은 국내의 빅데이터 시장의 올바른 기반을 다지기 위한 초석이며, 국내 고객에 대한 보답 차원이라고 볼 수 있다.”고 밝혔다.

ADA(Advanced Data Analytics) 자격 시험

▲ 한국데이터베이스진흥원에서 발간한‘데이터 분석 전문가 가이드’표지
한국데이터베이스진흥원은 2014년 데이터 분석(Advanced Data Anlytics) 자격을 개발·운영한다. 일명 빅데이터 분석 자격증으로 △데이터 분석 전문가 △데이터 분석 준전문가로 나눠서 자격시험을 치르게 된다.

데이터 분석 전문가(ADP : Advanced Data Analytics Professional)는 데이터 이해 및 처리 기술에 대한 기본지식을 바탕으로 데이터 분석 기획, 데이터 분석, 데이터 시각화 업무를 수행하고 이를 통해 프로세스 혁신 및 마케팅 전략 결정 등을 과학적 의사결정을 짛원하는 직무를 수행하는 전문가이며, 데이터 분석 준전문가(ADsP : Advanced Data Analytics Semi-Professional)는 데이터 이해에 대한 기본지식을 바탕으로 데이터 분석 기획 및 데이터 분석 등의 직무를 수행하는 실무자다.

데이터 분석 전문가는 △박사학위를 취득한 자 △석사학위를 취득하고 해당 분야 실무 경력 1년 이상인 자 △학사학위를 취득하고 해당 분야 실무경력 3년 이상인 자 △전문대학 졸업 후 해당 분야 실무경력 6년 이상인 자 △고등학교 졸업 후 해당 분야 실무경력 9년 이상인 자 및 △데이터 분석 준전문가 자격을 취득한 자 등 기준 중 하나 이상 만족 시 응시 가능하며 필기와 실기 시험에서 필기 및 실기 75점 이상이면 합격이다.

데이터 분석 준전문가는 응시 제한이 없으며 필기시험만 치루며 60점 이상을 합격으로 한다.

제1회 데이터분석전문가/준전문가 필기시험은 지난 1월 9일부터 접수를 받기 시작했으며, 오는 4월 26일 첫 시험을 치른다.

한편, 한국데이터베이스진흥원은 데이터 분석전문가 및 준전문가 공식수험서로 ‘데이터 분석 전문가 가이드’를 발간했다. 이 책에는 △데이터 이해, 데이터 처리 기술 이해, 데이터 분석 기획, 데이터 분석, 데이터 시각화에 대한 내용이 담겨 있다.

 데이터사이언티스트 양성, 넘어야 할 두 개의 산과 건너야 할 강
 

데이터사이언티스트 양성을 위해 넘어야 할 두 개의 산과 건너야 할 강이 있다.

우선 데이터사이언티스트는 고급 인력임에도 불구하고 국내에서 제대로 가치를 인정받고 있지 못하다는 점이 넘어야 할 첫 번째 산이다.

 데이타솔루션 정성원 이사는 “오라클 같은 DBMS를 배우는 것과 고급분석을 배우는 것은 차원이 다른 이야기다. 그러나 분석가들은 개발자와 똑같은 인력으로 취급당해 초급, 중급, 고급 등 노임단가를 받고 있는 게 현재 상황이다. 이런 상황에서 데이터사이언티스 양성은 꿈과 같은 이야기다”라고 지적한 것처럼 고급 직종에 속하는 분석가들은 제 가치를 인정받지 못하고 있다는 점이 해결해야할 과제다.
 

또한 두 번째로 융합형 인재를 양성하기 힘든 교육제도도 넘어야 할 큰 산이라는 지적이다.

한국전자통신연구원 안창원 박사는 “데이터사이언티스트는 이과도 아닌 문과도 아닌 융합형 인재다. 유럽의 경우 소셜시뮬레이션학과가 있다. 우리나라의 경우 90% 이상이 IT를 전공한 사람이겠지만, 유럽의 경우 대부분이 사회과학을 전공한 사람이다. 데이터를 갖고 있는 집단과 가공해야할 집단은 서로 시각이 다르기 때문에 이를 중매해 줄 역할이 필요하다. 이 역할을 데이터사이인티스트가 해야되며 이 같은 인재를 양성하기 위해서는 문과 이과의 벽을 허물고 통합하는 방향으로 나가야 한다.”고 주장했다.

조성준 서울대 산업공학과 교수는 “과거 계산통학과가 데이터 과학자에 가깝게 양성할 수 있는 과목이었지만 사라졌다. 지금 상황에서 산업공학과 컴퓨터공학, 통계공학이 결합되어야 진정한 데이터사이언티스트를 양성할 수 있는 기반이 마련될 수 있다.”며, “갑자기 모든 분야를 다룰 수 있는 인재를 양성하긴 어렵다. 각 분야별 전문가 중 다른 분야까지 섭렵하게 해야 함에도 불구하고 국내 대학, 특히 서울권 대학의 경우 학과 개설을 마음대로 할 수 없다는 점이 장애물로 남아 있다.”고 지적했다.

마지막으로 넘어야 할 강은 데이터사이언티스를 그저 한 부서, 전담조직으로만 평가절하시키는 기업문화다.

데이타 솔루션 정성원 이사 “국내 기업에서 분석 업무만 해서 인사고과에서 높은 점수를 받기는 힘들다. 이는 분석을 아무리 잘해도 그 공을 잘 인정받지 못한다는 뜻도 된다. 빅데이터 시대라고 하지만 회사 내 올라갈 수 있는 한계가 있는데 과연 누가 분석을 하려고 하겠는가. 별동대로 분리된 국내 기업의 조직 개선되지 않는 이상 힘들다.”고 지적했다.

SAS코리아 김윤건 부장도 “기업들은 전지전능한 데이터사이언티스트 채용에 관점을 두는 것이 아니라, 분석이라는 것을 기업 내의 한 문화로 받아들이는 것에 노력해야 한다. 예를 들면 분석 업무를 총체적으로 지휘하는 ‘비즈니스 분석 역량 센터(Business AnalyticsCompetency Centre)’를 두는 것이다. 비즈니스 분석 역량 센터를 통해 주요 이해 관계자들의 역할과 책임을 명확히 규정하고, IT 부서와 비즈니스 담당 부서간의 의견차를 좁히고, 나아가 이 역량센터를 통해 기업이 ‘전사적인 분석 문화’를 정착시켰을 때 비로소 보다 큰 경쟁력을 확보할 수 있다.”고 조언했다.


빅데이터가 ICT 분야의 새로운 패러다임이자 신성장동략으로 급부상하고 있다는 것은 그 누구도 부정하지 못할 사실이다. 빅데이터는 ‘자체’로 뿐만 아니라 ‘활용’을 통해 경제사회 발전의 원동력이 될 수 있다. 이는 마치 다이아몬드 원석은 자체로도 가치가 있지만 이를 어떻게 가공하냐에 따라 더 높은 가치를 받을 수 있는 것과 같다.

이런 빅데이터를 활용하기 위해서는 데이터사이언티스트가 중요한 역할을 담당하고 있으며, 필수요소로 급부상하고 있다. 이들이 없이는 빅데이터 분석을 통해 가치를 얻는다는 것은 불가능한 일이다.

그러나 국내에서 데이터사이언티스트를 대부분의 기업들이 언급하는 데이터사이언티스트는 고급 기술 스킬과 비즈니스 통찰력을 동시에 보유한 ‘이상적인’ 인재다. 한 마디로 데이터사이언티스트만 채용을 하면 요즘 얘기하는 빅데이터 분석이 쉽게 이루어 질 것이라는 생각으로 데이터사이언티스를 찾고 있다.

기업들이 이러한 환상을 버리지 않는 한 데이터사이언티스트 채용이나 존립 자체가 더더욱 어려워 질 것이다. 또한 가지고 있는 기대와 반대로 데이터사이언티스트에 대한 가치를 인정하지 않는 현실 풍토 역시 데이터사이언티스트 양성을 가로막는 장애물이다.

그나마 대학들은 실무형 빅데이터 전문 인재를 양성하기 위해 교과과정을 새롭게 갖춰 전문학과를 개설하고 있으며, 정부 역시 국가차원에서 빅데이터 ‘활용’을 촉진하고 빅데이터 ‘산업’을 육성하기 위한 전략적 지원을 전폭적으로 지원하고 있는 등 긍정적인 방향으로 흘러가고 있다.

선진국에 비해 뒤쳐지긴 했지만 데이터사이언티스트 양성을 위한 태동기에 들어선 지금, 중세유럽 시대 연금술사들처럼 21세기 데이터 연금술사인 ‘데이터사이언티스트’의 활약상을 기대해본다.

 
 
 

저작권자 © 컴퓨터월드 무단전재 및 재배포 금지