04.24
주요뉴스
뉴스홈 > 인터뷰
[데이터사이언티스트를 찾아서] “빅데이터 시대, 기업의 분석역량 내재화 이뤄져야”강호석 LG디스플레이 전문위원

[컴퓨터월드] 빅데이터가 대두된 이후로 제조 분야는 빅데이터 관련업계로부터 꾸준히 주목받아왔다. 제조 공정의 다양한 기계들이 내놓는 대용량의 머신 데이터는 소셜 데이터와 달리 거짓말을 찾아보기 힘들다. IoT(사물인터넷)의 확산은 이러한 데이터의 폭증을 불러오고 있고, 점차 보급되고 있는 스마트팩토리에서의 데이터 분석 및 활용은 단순 모니터링을 넘어 예측의 영역으로 향하고 있다. 제조 산업의 핵심으로 빅데이터가 자리하기 시작한 것이다.

국내 장치산업 분야를 대표하는 기업 중 하나인 LG디스플레이 역시 일찍이 빅데이터에 주목, 데이터 분석 전문 조직 ‘분석CoE’를 운영하며 공정과 경영의 혁신을 꾀하고 있다. 이를 이끌고 있는 강호석 LG디스플레이 전문위원은 분석역량의 내재화야말로 국내 기업들이 풀어야 할 숙제라고 강조한다. 20여년 동안 데이터 분석의 길을 걸어온 그의 이야기를 들어본다.

   
▲ 강호석 LG디스플레이 전문위원

 주요 약력
 - 서울대학교 계산통계학 학사 (1984-1988)
 - 서울대학교 계산통계학 석사 (1988-1990)
 - 서울대학교 계산통계학 박사 (1993-2000)
 - 카이스트 글로벌 매니지먼트 프로그램 수료 (2013)
 - SAS코리아 컨설턴트 (1994-1995)
 - 유니컨설팅(유니보스) 이사(컨설턴트) (1995-1998)
 - 숙명여대 수학통계학부 통계학전공 겸임교수 (2000-2001)
 - 시스템비지니스 대표이사(컨설턴트) (2000-2004)
 - 로고스시스템 상무(Biz.사업부장) (2005-2006)
 - 디메트릭스시스템 이사(컨설턴트) (2007-2008)
 - A&P파이낸셜 심사기획실장 (2008-2009)
 - LG디스플레이 전문위원(품질PI팀장) (2009- )


강호석 LG디스플레이 전문위원은 통계학 박사과정을 7년에 걸쳐 밟은 특이한 이력을 지녔다. 응용수학이 좋아 계산통계학의 길을 택했던 그가 이렇듯 통계학 박사학위를 취득하는데 오래 걸렸던 이유는 바로 데이터 분석 소프트웨어(SW)와의 만남 때문이었다. 박사과정 중이던 1993년 SAS코리아에서 시작한 일반사용자 대상 강의를 접하면서 비즈니스 문제해결을 위한 데이터 분석과 활용에 관심을 갖게 됐고, 이를 계기로 이듬해 SAS코리아에 입사하면서 제조분야 데이터 분석 전문가로서 일과 학업을 병행하는 삶이 시작됐다.

“당시 통계에 대한 기업들의 인식 변화와 더불어 분석SW 활용이 점차 보급됐고, 이에 데이터 분석 전문가에 대한 니즈도 조금씩 발생하기 시작하던 시기였다” 강호석 전문위원은 이 같이 밝히며 “이후 박사과정 수료 시점에 ‘통계 기반 데이터 분석 컨설팅 및 시스템 구축 서비스’를 목표로 박사과정 동료들과 의기투합해 시작했던 벤처는 당시로선 상당한 도전이었던 것으로 사료되고, 다양한 프로젝트 수행과 자체 솔루션 연구개발 과정에서 얻었던 경험은 여전히 가장 큰 자산으로 남아있다”고 회상했다.

미뤄왔던 박사학위 취득을 2000년 마무리하면서 강 전문위원은 인터넷 비즈니스 활성화에 맞춰 ‘CRM 및 데이터마이닝 분야 컨설팅 및 솔루션 서비스’ 분야에서 다시 일을 시작했다. 제조, 통신, 금융 등 다양한 영역에서 프로젝트를 수행해왔고, 산학연계를 통한 데이터마이닝 엔진 개발과 인터넷기업과의 캠페인 솔루션 공동개발도 추진한 바 있다. 이러한 경험을 바탕으로 대학에서 겸임교수로도 활동하기도 했다.

현재 강 전문위원은 LG디스플레이에서 대용량DB 구축·운영, 품질영역 분석 및 관련 시스템 구축·운영 업무와 더불어 분석전문가그룹인 분석CoE(Center of Excellence)의 리더를 맡아 활동하고 있다. 디스플레이 생산 환경에 최적화된 분석방법론을 연구·개발해 통계적 품질관리, 제조공정 운영 최적화, 연구개발 효율성 최적화 등 다양한 분야에 기여한 공로를 인정받아 지난해 한국통계학회 추계학술대회에서 통계학응용상 수상자로 선정되기도 했다.

다양한 분야에서 오랫동안 데이터 분석을 수행하면서 풍부한 경험을 쌓아온 강호석 LG디스플레이 전문위원으로부터 들은 빅데이터와 데이터 사이언티스트에 대한 견해를 문답 형태로 정리했다.

 

비즈니스 영역에서 데이터 분석이란.

문제에 대한 명확하고 근본적인 이해를 바탕으로 필요한 데이터를 정의하고, 적합한 방법론의 적용과 검증을 통해 이론에 국한되지 않고 실질적인 해석과 활용 가능한 결과를 도출하는 과정이라 볼 수 있다. 다양한 비즈니스 문제를 해결하기 위해서는 지식과 기술만으로는 충분하지 못한 것이 현실이다. 문제에 대한 이해와 실제 활용 가능한 결과의 도출은 반드시 비즈니스 및 관련 프로세스에 대한 사전지식이 있어야 가능하다.

비즈니스 분야별로 다양한 문제가 존재하므로 이러한 도메인지식(domain knowledge)을 한꺼번에 확보하기란 불가능하다. 결국 프로젝트 수행 등을 통해 경험이 축적돼야 하고 어느 정도 시간도 주어질 필요가 있다. 또한 본인은 물론 팀원과 주변에서 수행한 프로젝트의 결과에 대한 주기적인 리뷰를 통해 간접 경험도 부가적으로 축적해야 하고, 필요한 분야에 대한 사전 리서치 및 스터디도 꾸준하게 병행해야 한다.

개인적으로는 다양한 분야의 비즈니스 문제를 접할 수 있는 기회가 있어 많은 직·간접 경험을 축적할 수 있었다. 또 경영 전반에 대한 기본지식 확보를 위해 단기적이지만 MBA 프로그램을 수료했고, 필요한 분야에 대한 리서치 및 벤치마킹 등을 통해 지식 확보를 지속적으로 꾀하고 있다. 최근에는 통계·데이터마이닝을 벗어나 경영과학·최적화 분야에 관심을 두고 있다.


빅데이터에 대해 어떻게 바라보고 있나.

IT기술의 발전에 따라 새롭게 등장한 용어로 여길 수도 있겠지만, 개인적으로는 이미 우리들 마음속에 존재했었으나 그동안 부각되지 못하다가 최근에 수면 위로 올라온 것이라 본다. 기존에는 기술적·비용적 한계로 인해 많은 기업들이 일정 규모의 운영 데이터는 실시간으로 활용 가능하게끔 데이터베이스(DB)에 저장하고, 그 이전의 데이터는 필요시 복원해 활용할 수 있도록 테이프와 같은 저비용 장치에 장기간 보관하고 있었다. 그렇다면 이를 빅데이터가 아니라고 볼 수 있을까.

즉, 빅데이터는 새로운 용어라기보다는 새로운 관점이 나온 것이라 볼 수 있다. 기존에는 양(Volume) 및 가치(Value) 중심으로 바라봤다면, IT기술 발전 및 비즈니스 환경 고도화로 인해 텍스트나 이미지 등 그동안 활용되지 못하던 다양한 데이터소스 증가로 인한 다양성(Variety), 그리고 고객과의 인터랙션 증가 및 공정관리 수준 고도화 등으로 인한 데이터 증가·변화의 속도(Velocity) 관점이 추가된 것이라 할 수 있다. 물론 현재 데이터를 통해 가치를 창출하는 수준은 예전과 상당한 차이가 있지만, 이 또한 IT기술과 비즈니스 환경의 변화에 의한 것일 뿐이다.

우리는 새로운 관점의 빅데이터 시대에 살고 있다. 기존의 데이터 관리 및 활용 방식으로는 더 이상 기업의 경쟁력을 유지하기 힘들며, 환경과 기술 변화를 적극 수용해 혁신해야 한다. 그럼에도 불구하고 아직 많은 기업들이 혼란스러워 하는 것으로 보인다. 하둡(Hadoop) 기술로 인해 빅데이터의 저장·처리는 저비용·고효율로 가능해진 상황이다. IT기술의 검토·도입에 앞서 데이터를 어떤 목적으로 어떻게 분석해 어디에 활용할 것인가부터 먼저 정리해야 하며, 이에 대한 고민과 비즈니스 니즈 확인과정 없이는 데이터 보관 장소의 변경에 불과한 결과를 초래할 것이다.


국내 기업들의 데이터 분석 환경에 대해 문제점을 지적한다면.

최근 들어 데이터 분석에 대한 관심과 함께 데이터 분석 전문가에 대한 수요도 급증하고 있으나, 일부 선도기업 중심으로만 분석에 필요한 환경이 제공되고 있는 편이다. 아직 많은 기업들이 데이터의 보관 및 시스템 운영에 국한돼 잘 활용하고 있지 못한 것이 현실이다. 또한 선도기업들도 데이터 분석 전문가들을 소규모로 또는 계약직으로 채용, 부족한 부분은 기존 IT인력으로 메꾸다보니 데이터로부터 얻는 가치가 미흡하고 분석조직 구성도 수월하지 않은 상황이다.

기업에서 데이터 분석 환경을 구축하기 위해서는 비즈니스·분석·IT 등 업무영역별 전문인력, 전사적으로 연계된 분석정보 및 거버넌스 체계를 유지할 수 있는 조직, 분석서비스 제공에 필요한 분석플랫폼의 유기적인 구성이 기본적으로 요구된다. 또한 IT 내·외부 실무부서 등 관련조직들의 이해관계로 인한 통합·협업의 어려움, 데이터 분석에 대한 실질적인 리더십 부재, 현업 및 IT조직의 R&R(Role and Responsibilities) 정립, 경영진의 장기적인 관점에서의 지원 확보, 가시적인 성과 창출·유지 등의 문제들을 해결해나가야 한다.

아직 추가적으로 보완이 필요한 부분도 있지만, LG디스플레이의 경우 이 같은 장벽들을 극복해나가면서 데이터 분석 전문가 조직 구성 및 전사적 활동에 있어 성공적인 사례로 인식되고 있다. 자사 분석CoE 조직 운영에 대해 여러 타사에서 벤치마킹(Benchmarking)도 이뤄지고 있지만, 여전히 많은 기업들이 조직이 아닌 몇 명의 개인에 의존하는 방식 또는 외부 인력으로만 데이터 분석 업무를 추진하고 있는 형편이다.


‘분석역량 내재화’의 실패는 국내 기업에 꾸준히 지적돼온 문제인데.

첫째, 분석조직과 IT조직의 R&R을 명확하게 설정하지 못한 경우가 많다. 둘째, 분석조직에 대한 경영진의 지속적인 관심과 지원이 부족하며, 단기적인 성과 위주의 기업문화로 인해 번번이 외부에 의존하게 된다. 셋째, 분석결과의 실제 프로세스·시스템 적용과 유지관리 및 새로운 문제 발굴 등 일련의 분석 사이클이 형성돼있지 않다. 넷째, 경쟁력 있는 전문인력의 확보가 쉽지 않고 육성에는 상당한 기간이 필요하다는 점을 간과한다. 이 네 가지 문제가 해결돼 원만한 조화를 이룰 때 비로소 분석역량이 자리 잡지 않을까. 대부분의 기업들이 준비되지 않은 채 내재화만 꿈꾸고 있는 것은 아닌지 의문이다.

LG디스플레이 역시 지난 4~5년 동안 분석역량을 갖춘 내부인력의 지속적인 확보 및 오픈 이노베이션(Open Innovation)의 적절한 활용과 함께, 생산, 영업·마케팅, 연구개발, 경영일반 등 다양한 분야의 비즈니스 요구에 대응할 수 있도록 경험을 축적하면서 분석역량의 내재화를 추진해왔다. 분석CoE가 전사적으로 IT를 담당하는 업무혁신그룹 산하에 구성돼있어, 언제든지 필요한 데이터에 접근할 수 있고 최상의 인프라를 제공받고 있다. 특히 CFO를 중심으로 경영진의 지속적인 지원 덕에 조직이 자리 잡고 성장할 수 있었다.

나아가 분석 전문조직이 활약하기 위해서는 현업의 신뢰를 얻는 것이 중요하다. LG디스플레이의 경우 내부적으로 6시그마 활동을 통해 양성된 MBB, BB 상당수가 현업에서 활동하고 있으며, 이들은 데이터 분석 역량도 어느 정도 갖추고 있다. 이들의 수준을 뛰어 넘지 못하거나 새로운 인사이트를 제공하지 못한다면 과연 이들이 실무적으로 수용할 수 있을까. 의미 있는 성과 없이는 분석 전문 조직이 지속되기 어려울 것이다. 또 분석 결과는 항상 현업 담당자와의 검토를 통해 상호 보완 및 검증 단계를 거쳐 프로세스·시스템 고도화에 반영하면서 지속적으로 내재화해야 한다.


데이터 사이언티스트란 어떤 사람이라고 생각하나.

빅테이터 자체만으로는 아무런 의미가 없고, 데이터 사이언티스트가 이를 분석하고 해석해 활용할 때 비로소 그 가치를 발하게 된다. 일반적인 데이터 분석 수준을 넘어 비즈니스 인사이트를 도출해 성과 창출까지 연계하기를 바라는 사회적 요구가 데이터 사이언티스트라는 용어를 탄생시킨 배경이라 볼 수 있다. 이렇듯 빅데이터와 데이터 사이언티스트는 불가분의 관계로, 개인적으로는 빅데이터 시대를 맞아 기존의 분석 전문가에게 IT지식·기술적 요구사항을 추가한 것이 데이터 사이언티스트라고 여긴다.

이에 데이터 사이언티스트는 통계, 최적화 등 분석에 대한 고급지식과 IT에 대한 전반적인 지식을 갖추고, SQL과 같은 데이터 관리 도구, SAS 또는 R 등 분석 도구, 하둡(Hadoop)을 포함한 빅데이터 기술 등을 활용해 데이터 분석 과정을 독자적으로 수행할 수 있어야 한다. 이러한 일련의 과정을 수행하기 위한 다양한 지식과 기술을 모두 보유하기란 결코 쉽지 않을 것이다. 분야별 전문가는 많지만 세 가지 영역의 지식과 기술을 두루 갖춘 데이터 사이언티스트는 많지 않고 앞으로도 그럴 것으로 예상된다.

따라서 통상적으로는 업무전문가의 도메인지식, IT전문가의 DB 등 IT관련지식, 분석전문가의 분석방법론 등이 데이터 분석 조직에서 한데 모여 유기적인 협업을 통해 비즈니스 성과를 창출하게 된다. 데이터 사이언티스트에 대한 사회적인 니즈에도 불구하고 훈련된 인력의 수급이 쉽지 않는 상황이라, 보다 체계적인 교육과정 개발에도 상호 협력이 필요한 상황이다. 이와 관련해 현재 국내 개설된 교육과정에 자사 구성원들을 보내본 적도 있지만 별 도움이 되지는 않았다. 이 역시 국내 산업 전반의 리더 부족 문제와 무관하지 않아 보인다.

한편, 빅데이터 시대에 들어 기업의 경쟁력과 직결되는 존재로 부각됐음에도, 국내에서 아직은 데이터 사이언티스트가 그만큼의 가치를 인정받지 못하고 있는 것 같다. 물론 상당한 대우를 받는 이들도 있지만 일부에 지나지 않으며, 그 또한 전문계약직의 형태로 고용된 경우가 적지 않다. 다만, 현재 수급상황에 따른 전문인력 확보 및 유지를 위해 처우 개선이 조금씩 이뤄지기 시작, 앞으로는 점차 좋아질 것으로 기대된다.


데이터 사이언티스트가 되기 위해서는 어떤 역량을 갖춰야 하나.

첫째, 데이터 분석 역량은 기본이다. 분석 목적별 대상 데이터를 정의하고 데이터의 성격과 목적에 맞는 분석방법을 적용할 수 있어야 한다. 둘째, DB, BI, 분석도구 등의 활용능력 및 IT에 대한 이해가 필요하다. 필요한 데이터의 구성, 현황파악을 위한 OLAP 및 시각화SW 활용, 분석SW 활용, IT기초지식 등을 통한 결과 도출이 가능해야 한다. 셋째, 비즈니스 도메인 지식을 익혀야 한다. 주어진 문제에 필요한 업무 지식은 문제 해결 및 원활한 커뮤니케이션을 위해 최소한 확보돼야 한다. 제조업의 경우 제품·공정·기술·장비에 대한 포괄적인 지식이 요구된다.

넷째, 호기심과 열정 그리고 세밀함을 갖춰야 한다. 주어진 문제에 대한 호기심은 질문을 낳고, 그 질문이 더 좋을 결과를 가져 올 수 있다. 포기하지 않고 다양한 관점으로 접근해 인사이트를 도출하는 열정을 가져야 하며, 분석 전 과정에 걸쳐 실수가 없도록 꼼꼼하게 단계별 결과를 확인하는 것이 습관이 돼야 한다. 다섯째, 문제 해결 능력이 있어야 한다. 분석 결과는 현실과 괴리가 있는 경우가 허다하다. 이때 이론적인 결과에 그치지 않고 실질적으로 적용되는 대안을 찾을 수 있어야 하며, 필요 시 협상도 할 줄 알아야 한다.

여섯째, 도큐멘테이션, 커뮤니케이션, 프레젠테이션 역량이다. 분석 결과를 전문가들만 해석할 수 있도록 정리한다면 현업의 수용·설득은 불가능하다. 현업과의 결과 리뷰에서의 의사소통은 더욱 중요한 부분이다. 전문가로서 겸손을 바탕으로 신뢰 받을 수 있는 커뮤니케이션과 프레젠테이션이 가능해야 한다. 또 적극적으로 커뮤니케이션하되, 데이터분석 결과에 대한 스스로의 믿음이 있어야 한다. 주변의 질문이나 지적, 반대에 스스로 결과를 의심한다면 신뢰를 쌓기 힘들다. 오류는 보완하면 되는 것이지, 포기할 필요는 없다.

특히 이를 위해서는 분석데이터의 품질이 분석방법(행위)의 품질보다 우선해야 한다는 점을 염두에 둬야 한다. 즉, 비즈니스 문제를 정확하게 이해하고 이를 바탕으로 분석데이터를 정의·구성하는 것은 데이터 사이언티스트 활동의 출발점이므로, 화려한 고급분석보다 훨씬 중요한 부분이다. 기초가 무너지면 모든 것이 무너지기 마련이다.


장치산업 분야의 데이터 분석 및 활용 관련 특징이 있다면.

공통적인 비즈니스 영역에서는 유사한 주제도 많고, 통상적으로 사용하는 데이터 분석 기법에는 거의 차이가 없다고 볼 수 있다. 그러나 전문적인 영역에서 디스플레이, 반도체와 같은 장치산업은 같은 제조분야인 조립산업과도 차이를 보이는데, 기계로 대부분의 생산이 이뤄지는 만큼 시스템도 고도화됐고 정밀도가 더욱 중시된다. 초 단위 미만의 데이터 수집 및 실시간 관리, 동일 장비임에도 불구하고 공장·호기별 특성 반영, 품질(수율) 리스크로 인한 분석결과의 정확성 및 공정·장비 메커니즘과의 부합성 확보 등을 특징으로 꼽을 수 있다.

아울러 생산 현장의 즉각적인 실행을 위해 데이터 제공·관리 주기가 타 분야에 비해 짧은 편이고, 지속적인 신제품·공정·장비·기술의 개발로 인해 기존의 분석 결과나 지식의 활용성이 떨어질 가능성이 높아 주기적인 유지관리가 불가피하다. 또 분석결과의 적용에 있어 품질이슈 발생 등의 리스크가 고려돼야 해서 재현성을 검증하는데 많은 시간과 노력이 요구되며, 분석결과와 기술적인 메커니즘 간에 괴리가 있는 경우 이를 실무에 반영하기 위해서는 추가적인 과정을 필요로 한다.


LG디스플레이의 분석CoE를 소개해 달라.

지난 2011년 파일럿 운영을 시작해 5년째 운영되고 있다. 통계·데이터마이닝 및 경영과학·최적화 전공 석박사로 구성돼있으며, 오픈 이노베이션을 활용한 외부인원까지 총 20여명이 활동하고 있다. 최초 조직 구성 시 대학 선배인 최대우 한국외대 통계학과 교수가 운영방안에 대해 컨설팅, 전체적인 방향 설정 및 내재화가 이뤄질 수 있는 체계를 갖추는데 도움을 줬다. 초기에는 품질분석, 공정관리 등 생산영역 중심으로 활동을 전개했고, 현재는 영업·마케팅, 경영일반, 연구개발 등 전 비즈니스 영역으로 그 범위가 확대됐다.

분석CoE는 현재 비즈니스 문제 해결을 위한 의사결정 및 오퍼레이션 엑설런스(Operation Excellence: 운영 고도화)를 지원하고 있으며, 가치사슬(Value Chain)상 시장·소비자 분석, 기술동향 분석, 생산계획(Planning)·일정계획(Scheduling) 최적화, 가상계측 및 측정 최적화, 공정·장비 이상 조기감지 등 변동관리, 품질분석 등을 수행하고 있다. 내부적으로 활동이 알려지기 시작하고 다양한 비즈니스 문제 해결 참여가 많아지면서 매년 박사급 경력사원을 채용하고 있다.

또한 통계·데이터마이닝 전문가 중심에서 경영과학·최적화, 텍스트마이닝, 기계학습(머신러닝) 등의 전문가도 추가적으로 확보, 비즈니스 문제 해결을 다양한 관점에서 접근하고 시너지 효과를 창출할 수 있도록 조직을 구성해나가고 있다. 나아가 IoT(사물인터넷) 등 비즈니스 환경과 기술의 변화에 따른 향후 필요할 것으로 예상되는 분석방법론에 대한 사전 연구 활동도 강화, 선도적이고 차별화된 데이터 분석 CoE로 발전을 거듭하고자 한다.

 

인터뷰를 마치면서 강호석 LG디스플레이 전문위원은 분석CoE 조직의 내실화에 박차를 가할 계획이라고 밝혔다. “빅데이터 기술 및 고급 분석 활용 영역을 확대해 예측 관리, 스마트 팩토리 등 회사 전반의 오퍼레이션 엑설런스를 위한 데이터 분석 활동을 전개해나갈 방침이다. 더불어 운영과 분석 프로세스의 자동연계를 위한 분석방법론 개발에 대한 연구를 강화, 분석CoE 조직의 성장과 분석역량 내재화를 더욱 가속화시킬 것”이라는 설명이다.

아울러 강호석 전문위원은 “데이터의 홍수가 밀려오고 있다. 어떻게 대처할지 남보다 앞서 깊이 고민해 각자에 맞는 방안을 강구할 필요가 있다. 벤치마킹하되 카피하지는 말라”고 권하며, “데이터와 분석에 많은 기회가 있다. 제대로 된 데이터 사이언티스트가 될 수 있도록 경험을 축적하고 학습할 것”을 주문했다. 스스로 데이터 분석 전문가로서 가치를 높일 수 있도록, 분석CoE 소속 직원들에게도 끊임없이 공부할 것을 강조하고 있다고 한다. 강 전문위원이 이끄는 분석CoE 조직이 개척해나갈 LG디스플레이의 미래를 기대해본다.
   
▲ 강호석 LG디스플레이 품질PI팀장은 기업에 내재화된 분석역량이
 곧 빅데이터 시대의 기업경쟁력임을 강조했다.

여백
컴퓨터월드 추천기업 솔루션
인기기사 순위
IT Daily 추천기업 솔루션
153-023) 서울시 금천구 가산동 327-32 대륭테크노타운 12차 13층 1314호 (주)ITMG
TEL:02-2029-7200  FAX:02-2029-7220  사업자등록번호:106-86-40304
개인정보/청소년보호책임자:윤현기  등록번호:서울 아 00418  등록일자:2006.10  발행인:김용석  편집인:김선오