천승태 데이터스트림즈 연구소장

[컴퓨터월드] 그동안 국내 시장에서 데이터품질관리의 중요성은 데이터수집에 비해 상대적으로 덜 주목받아왔다. 하지만 빅데이터는 시장이 빠르게 성장하며 데이터품질 또한 주목받고 있다. 많은 사용자들이 모아온 빅데이터를 활용한 분석을 시도했지만, 분석이 가능할 정도의 품질을 확보하지 못한 경우가 많았다. 따라서 데이터를 모으는 것 못지않게 품질관리가 중요하다는 공감대가 형성되고 있는 시점이다.

데이터스트림즈는 빅데이터시장이 성숙함에 따라 데이터스트림즈가 가진 품질관리와 데이터플랫폼을 하나로 통합하려고 준비중이다. 빅데이터시장이 성숙하면서 제품군의 통합이 더욱 중요해질 것이라는 판단에서다. 이를 위해 데이터스트림즈는 올해 초 천승태 전 데이터통합개발팀장을 연구소장으로 발탁했다. 천승태 데이터스트림즈 연구소장을 만나 데이터스트림즈 연구소의 목표와 방향에 대해 들어봤다.
 

▲ 천승태 데이터스트림즈 연구소장

<주요 약력>
현 데이터스트림즈 연구소장 (2016 ~ )
전 데이터스트림즈 데이터통합개발팀장 (2013 ~ 2016)
전 데이터스트림즈 ETL파트 파트장 (2009 ~ 2013)
전 데이터스트림즈 원천기술파트 연구원 (2008 ~ 2009)
전 데이터스트림즈 ETL파트 연구원 (2006 ~ 2008)

 
데이터스트림즈와의 인연은 어떻게 시작됐는가

데이터스트림즈가 첫 직장이다. 대학을 졸업한 후 남들처럼 대기업에 갈 생각은 없었다. 기술력을 가지고 있는 기술회사에 입사하고 싶었다. 그 이후 데이터스트림즈(당시 IDS)를 알게 됐고, 자원해 입사했다.

파트장을 맡을 당시 회사가 성장일로에 있었다. 현재의 데이터스트림즈로 사명을 변경하고 개발팀 규모도 크게 확대됐다. 개발팀 규모가 커지다보니, 인력과 기술, 범위를 점차 넓혀가게 됐고, 할일이 많았다. 그 와중에 팀원들이 잘 따라주면서 대표님의 인정도 받게 됐다. 특별히 연구소장을 해보겠다는 목표는 없었지만, 주어진 일과 미션을 달성하고자 하는 노력으로 이 자리까지 왔다.

입사 후 주로 맡은 일은 ETL솔루션인 테라스트림 개발이었다. 테라스트림 범위 커지며 빅데이터플랫폼으로까지 확장됐다. 빅데이터플랫폼 제품의 기획·출시에 기여했고 성과도 좋았다. 그 이후 연구소장이 되기 전까지 테라스트림 바스의 실시간 빅데이터 처리와 관리를 연구해왔다.


데이터스트림즈 연구소의 역할은 무엇인가

연구소의 역할은 크게 두가지다. 하나는 데이터스트림즈의 데이터통합, 품질관리 핵심 기술을 제품화하고 발전시키는 것이고, 다른 하나는 국내 소프트웨어 생태계에 기여하는 것이다.

국내 소프트웨어 생태계 발전을 위해 데이터스트림즈 연구소는 대학 연구소와 함께 협업을 진행하고 있으며, ETRI, KETI 등 국책연구기관의 국가과제를 수행하기도 한다. 현재 ETRI와 함께 CoT(Cloud of Things)관련 과제를 수행하고 있고, 서울대와 함께 LOD(Linked Open Data)관련 과제를 준비하고 있기도 하다.

그러나 가장 중요한 역할은 제품 개발이다. 데이터스트림즈 연구소는 데이터스트림즈가 가지고 있는 핵심기술들을 제품화하고 발전시켜나가고 있다. 데이터스트림즈의 제품은 크게 두 가지로 분류할 수 있다. 첫째는 데이터통합, 빅데이터플랫폼 등 데이터를 다루는 플랫폼 기술 제품군이고, 다른 하나는 데이터표준, 데이터흐름 등 품질관리 제품군이다.

하지만 지금까지 이 두가지 제품군이 큰 시너지를 이루지 못했다. 비즈니스 측면에서도 별개로 진행해왔다. 컨버전을 통해 통합된 제품을 만들고자 하는 시도는 꾸준히 해왔지만 시장의 요구 자체가 분리돼있었다. 이런 이유으로 제품 개발과 기술개발 등이 별개로 진행된 경향이 있다.

근래들어 서서히 품질과 관리를 하나로 보는 경향이 나타나고 있다. 그런 측면에서 미리 준비하고 도전하려고 한다. 데이터품질과 데이터의 관리·처리를 한 번에 진행할 수 있는 솔루션을 만들어 나갈 계획이다. 이 둘이 시너지를 이루게 되면 큰 파급효과가 일어날 것으로 예상하고 있다.

연구소 운영에 가장 염두에 두고 있는 가치는

가장 중요한 것은 구성원의 행복과 즐거움이다. 회사라는 것도 결국 사람이 모여있는 조직이다. 구성원의 행복이 비즈니스 활력과 연결된다. 구성원의 행복은 개발문화와 관련이 깊다. 즐겁게 일하는 분위기, 즐거운 문화를 만들기 위해 노력하고 있다.

프로그래머의 타입은 여러가지 있지만, 혼자 집중할 시간이 필요하다고 생각하는 프로그래머도 많다. 하지만 그것은 한계가 있다. 새로운 아이디어는 혼자 고민한다고 해서 절대 나오지 않는다. 팀원들과의 팀워크, 커뮤니케이션이 중요하다.

따라서 데이터스트림즈 연구소는 대화 중심, 의사소통 중심 개발문화를 중요시하고 있다. 원활한 커뮤니케이션을 통해 구성원의 행복을 키워나가려고 한다.

개발방법론에 대해서도 마찬가지다. 어떤 개발방법론을 선택하느냐가 중요하다는 주장도 있지만, 데이터스트림즈 연구소는 개발방법론을 크게 중요시하지 않고 있다. 그 이유는 제품중심으로 개발을 진행하기 때문이다. 제품개발 시 제품이 일률적·연속적으로 성장한다고 보지 않는다. 제품 개발 자체가 계단형태라고 보면 될 것이다.

6개월 단위의 프로젝트가 연속 진행되는 방식으로 개발을 진행하고 있다. 개발 방법론도 프로젝트리더가 판단해서 채택한다. 프로젝트마다 개발방법론이 다르다. 프로젝트리더의 권한과 책임, 자율성을 중시하고 있다. 주로 많은 방식은 워터폴이지만, 비즈니스에 밀접한 경우 애자일 방식으로 진행하기도 한다. 비즈니스를 연속적으로 진행해야 한다면 똑같은 개발방법론을 사용하겠지만, 데이터스트림즈 연구소에서는 프로젝트 단위의 개발을 훨씬 중요시하고 있다.

데이터스트림즈의 비즈니스를 어떤 식으로 서포트하고 있는가

교육부서에서 고객들을 상대로 고객교육을 진행할 때 연구소에서 장소를 제공하고 있다. 교육의 기본적인 방향에 대해 안내한다. 고객의 제품 이해도를 높이고 제품의 컨셉이 무엇인지, 어떤 식으로 사용하는지 교육하고 있다.

해외 시장 공략을 위해서 해외 파트너사에게 기술 노하우를 전수해주고 있기도 하다. 해외 비즈니스는 지사를 설립하거나, 현지의 기술파트너가 필요하다. 하지만 이 두 가지가 크게 다르지 않다. 지사를 설립하더라도 파트너는 별도로 필요하다. 실제 비즈니스는 파트너를 통해 진행되는 경우가 많다. 미국시장의 경우 기술수준이 높아 기술이전이 불필요하지만, 동남아, 중국, 일본의 경우 사업을 원활하게 진행하기 위해서 우리가 가진 기술지식을 이전할 필요가 있다.

현지 파트너들이 고객을 대상으로 기술을 설명하다보면, 고객들로부터 요구사항을 듣게 되고, 전달받은 요구사항을 해결하고 있다. 앞으로는 해외의 요구사항을 쉽고 빠르게 해결할 수 있는 기술지원사이트를 만들려고 계획중이다.


해외사업 전망은 어떤가

가장 큰 메인타깃은 일본시장이다. 작년 일본 내 소프트웨어 유통 회사와 판매계약을 체결했다. 중국의 경우 지난해 실제 판매가 일부 있었지만, 본격적인 비즈니스는 어려웠다. 하지만 올해는 상황이 훨씬 좋을 것으로 예측하고 있다. 기존까지 투자해왔던 부분이 올해 가시화될 것으로 보인다.

중국의 경우 소스코드 유출을 우려하는 경우도 있지만, 아직 걱정 없다는 입장이다. 우선적으로는 소스코드가 유출되지 않도록 관리하고 있기 때문이다. 하지만 그보다 더 근본적인 이유은 데이터관리라는 분야의 어려움 때문이다. 데이터 기술의 트렌드는 워낙 빠르게 바뀌기 때문에, 새로 뛰어든 개발기업들이 빠르게 따라오기 힘든 분야이다.

또한 데이터스트림즈는 데이터관리 비즈니스를 십년 이상 진행해왔다. 그러면서 쌓인 노하우는 소스코드에만 있는 것이 아니다. 설령 소스코드가 유출되는 극한 상황에 놓이게 되더라도 기술 전체가 넘어가지 않는다.

동남아도 꾸준히 공략하고 있지만 아직 큰 성과를 기대하기엔 이르다고 판단한다. 동남아의 경우 주 사업은 은행·병원 사업이 많이 진행되고 있다. 현재 베트남 호치민시의 병원 프로젝트 진행과 관련해 많은 얘기가 오고가고 있다.


향후 기술개발 방향은

빅데이터 시장이 국내에서 빠르게 확산되고 있지 못하는 이유중 하나는 사람의 부족이라고 생각한다. 빅데이터분석을 시도하는 이유는 분석을 통해 기존에 보지 못했던 것을 보고, ‘인사이트’를 얻기 위함이다. 하지만 이렇게 하기 위해서는 데이터사이언티스트가 필요하다. 현재 고객사들이 봉착한 문제도 이것이다. 쉽게 해결되지 않을 문제고 시간 또한 걸릴 것이다.

데이터스트림즈 연구소는 거기에 착안해 데이터사이언티스트없이 분석할 수 있는 방법에 대해 고민하고 있다. 분석 자체를 소프트웨어에서 할 수 있도록 머신러닝 분야 기술을 도입할 계획이다. 미래예측, 예측모델 기반 고객분석 요구예측 등의 예측 분야는 머신러닝을 통해 해결할 수 있다고 생각한다.

머신러닝은 CEP(복합이벤트처리)엔진과 상호 보완하는 방식이다. 속도는 CEP가 빠르지만 정해진 룰이 잘못돼도 나아지지 않고, 룰 이외의 것을 구분하지 못한다. 머신러닝은 이를 보완할 수 있다.

따라서 머신러닝 앞으로 필수적으로 될 것이다. 물론 머신러닝을 통해 사람처럼 생각하기는 어렵다. 사람이 분석하는 분야는 계속 남아있을 것이다. 목표는 그 영역을 줄여나가자는 것이다. 소프트웨어 분석할 수 있는 부분은 분석하고, 복잡한 일부 분석은 데이터사이언티스트가 진행할 수 있도록 하는 것이 목표다. 기본 분석엔진으로 머신러닝 탑재할 것이다.


IoT 시장에서의 활용도가 높아 보인다. 주 활용처는 어디인가.

테라스트림 바스는 IoT기반 빅데이터 실시간 분석 시스템이다. 하지만 현재 데이터 소스에 직접 접근해 조작하는 것까지 지원하지는 못한다. 머신러닝을 도입하면 방 온도 등을 실시간으로 측정해 적정치로 조절하는 방법 등이 가능해진다.

스마트팩토리 등에서는 생산라인에서 발생한 데이터를 보고 고장을 예측한 소프트웨어가 직접 라인을 정지하는 등 액션을 취하는 게 가능해진다. 즉시 데이터를 보는 것이 지금까지의 개발 방향이었다면 앞으로는 그걸 넘어서 알아서 행동을 취하는 것을 목표로 하고 있다.

테라스트림 바스는 기획단계에서 스마트팩토리를 염두에 두고 개발됐다. 데이터가 많지 않으면 테라스트림 바스는 활용도가 떨어진다. 데이터가 많이, 빠르게 발생하는 곳, 동시에 실시간 분석 니즈가 있는 곳이 테라스트림 바스를 사용하기 적합하다. 데이터스트림즈 연구소에서는 그러한 분야가 스마트팩토리라고 판단했다.

대표적인 예가 반도체 라인이다. 현재 반도체 라인이 빠르게 바뀌고 있는 단계다. 다른 분야로는 재난예측 및 재난관리, 빌딩관리, 스마트시티까지도 새로운 시장이 될 수 있을 거라 생각한다.

머신러닝 기술을 도입한다고 했을 때 가장 중요한 것 중 하나는 학습시간이다. 머신러닝이라는 것에는 반드시 학습시간이 필요하다. 학습하는데 일주일 걸린다면 문제가 없지만, 일년 혹은 이년 걸리면 판매하기 쉽지 않다. 학습기간을 얼마나 줄이는지가 핵심 포인트다. 그걸 얼마나 줄이는가가 현재 개발하는 프로젝트의 핵심이다. 연구가 좀 더 필요한 숙제이다.


신기술 트렌드에 민감한 것으로 보인다. 그 이유와 가장 주목하는 분야는.

데이터관리솔루션의 숙명이다. 새로운 기술이나 트렌드가 나온 후 시장에 영향 줄 때까지의 단계가 있다. 처음에는 데이터 구조와 관리구조에 영향을 준다. 두 번째로 분석과 분석이론에 영향을 주고, 세번째로는 분석된 것을 바탕으로 비즈니스에 영향을 준 후, 마지막으로 사람에까지 영향을 준다.

제일 첫 단계가 데이터의 변화다. 따라서 데이터를 관리하는 솔루션을 갖춘 회사들은 새로운 트렌드에 민감할 수밖에 없다. 제품의 흐름이 트렌드에 따라 바뀌기 때문이다. 나아가 그걸 주도하기도 한다. 앞으로 데이터스트림즈도 학술적 활동 등을 통해 트렌드에 일조하는 방향으로 나아갈 계획이다.

주목하고 있는 분야는 IoT와 클라우드다. 머신러닝기반 분석엔진 성공을 위해서 IoT트렌드를 민감하게 살펴보고 있다. 빅데이터는 이미 일반화 돼, 트렌드라기보다는 기반기술에 가깝다. 클라우드에 대해서는 우선적으로 퍼블릭 클라우드가 타깃이긴 하지만 다른 콘셉트를 가지고 있다. 클라우드상에서 제품을 제공한다는 계획은 이미 판매 준비가 된 상태다.

자사의 클라우드 핵심 목표는 클라우드간의 데이터표준화 통합이다. 퍼블릭에서 퍼블릭으로, 프라이빗에서 퍼블릭으로 데이터를 전송하는 클라우드-투-클라우드나 기존 레거시 시스템에서 어떻게 보안을 유지하면서 데이터를 통합할 것인가에 대한 연구가 진행중이다.

레거시 시스템과 퍼블릭, 혹은 프라이빗 클라우드와 퍼블릭 클라우드 사이에는 인터넷 망이 있다. 데이터 유실과 보안을 해결하는 것이 기술력의 핵심이다.

연구소장으로서 목표가 있다면

직장생활의 처음부터 데이터스트림즈에 몸담았다. 데이터스트림즈를 계속 성장시키고 글로벌한 회사로 키워내고 싶다. 두번째로는 소프트웨어 업계에 기여해, 기업과 산업들의 수준을 높이는 것이 목표다.

연구소장으로서의 첫 해를 맞는 올해의 목표는 연구소 전체의 컨버전스를 이루는 것이다. 그동안 각 팀별로, 제품군별로 컨버전이 완벽하게 이뤄지지 않았다. 이들을 하나로 묶어 큰 시너지를 창출하는 한 해로 이끌겠다.

저작권자 © 컴퓨터월드 무단전재 및 재배포 금지