이영상 데이터스트림즈 대표

[컴퓨터월드] 데이터스트림즈가 창립 20주년을 맞았다. 데이터스트림즈는 데이터 관련 산업이 백안시되던 시기에도 데이터 통합 솔루션 ‘테라스트림’을 출시하고 선제적으로 시장을 개척해온 선구자로 꼽힌다. 데이터의 중요성이 더없이 높아진 오늘날, 데이터스트림즈는 뛰어난 기술력과 제품 라인업으로 국내 시장의 강자로 자리매김하고 있다. 여기에 연내 코스닥 상장을 달성해 공신력을 갖추고, 내년부터는 글로벌 시장 공략에 박차를 가해 100배 이상 성장하는 기업을 달성하겠다는 포부다.

이영상 데이터스트림즈 대표를 만나봤다.

이영상 데이터스트림즈 대표
이영상 데이터스트림즈 대표

척박한 데이터 환경에 선구자 자처

약 20년 전, 많은 기업들이 PC의 확산과 디지털 기술의 보급이라는 추세에 발맞춰 새로운 전산 시스템 도입에 힘을 쏟았다. 당시 대다수 기업들의 관심은 CRM이나 ERP, KPI 등 기존에 사람의 손으로 하던 업무들을 보다 편리하게 할 수 있는 솔루션 도입에 집중돼 있었다. 이로써 컴퓨터를 활용해 업무 생산성을 비약적으로 높일 수 있었다. 오늘날 디지털 혁신의 중심에는 데이터가 자리잡고 있지만, 20년 전만 해도 데이터에 대한 기업들의 관심은 매우 낮은 수준에 머물러있었다.

하지만 데이터의 가치가 저평가되던 시절에도 데이터의 중요성을 빠르게 인식하고 관련 사업에 매진해온 기업이 있다. 바로 데이터 비즈니스 전문기업 데이터스트림즈다. 데이터스트림즈는 2001년 이노베이티브데이터솔루션즈(IDS)라는 이름으로 시작해 올해로 창립 20주년을 맞았다. 그동안 ‘테라스트림(TeraStream)’, ‘델타스트림(DeltaStream)’, ‘메타스트림(MetaStream)’ 등 다양한 데이터 관리‧통합 제품들을 내놓으며 뛰어난 역량을 갖춘 국내 대표 데이터 기업으로 성장했다.

초창기 데이터 관련 시장은 오라클을 위시한 DBMS 기업들이 선점했다. 다양한 업무 시스템들이 도입되는 만큼 그곳에서 생산되는 데이터들을 빠르고 정확하게 DB에 저장하고 불러오는 기술들이 각광받았다. 하지만 시간이 갈수록 업무 시스템의 종류와 양은 늘어나기만 하고, 여기에서 생산되는 데이터도 기하급수적으로 증가했다. 기업 규모가 커지면서 관리해야 하는 DB가 수만 개에 달하자, 단순히 데이터들을 DB에 저장하고 불러오는 기능만으로는 데이터를 활용할 수가 없게 됐다.

그렇다면 셀 수 없을 만큼 많은 DB에서 어떻게 원하는 데이터를 찾고 이들을 결합해 원하는 정보를 얻을 것인가? 약 20년 전, 데이터스트림즈가 설립 이후 가장 먼저 출시한 제품은 데이터 통합 솔루션 ‘테라스트림’이다. ‘테라스트림’을 통해 데이터스트림즈는 기존의 DB 중심주의를 깨트리는 탈DBMS를 주장했다. 데이터의 양과 종류가 폭발적으로 증가해 언젠가 DB만으로는 감당할 수 없게 될 것을 예상한 것이다. 이를 해결하기 위해서는 수많은 DB들을 연결해 데이터를 통합할 수 있는 단일한 플랫폼이 필요하다.

‘테라스트림’을 시작으로, 데이터스트림즈는 20여 년 간 데이터 통합을 위한 솔루션들을 순차적으로 출시해왔다. 특히 지난 2016년에는 ‘테라스트림’, ‘델타스트림’, ‘메타스트림’ 등 자사의 핵심 제품들을 결합해 데이터 관리를 위한 전 과정을 지원하는 ‘테라원(TeraONE)’을 출시하기도 했다. ‘테라원’은 하둡 에코시스템을 포함한 다양한 오픈소스 기술들과 데이터스트림즈의 14개 데이터 솔루션들을 선택적으로 조합해, 고객이 최적화된 빅데이터 수집‧분석 플랫폼을 구축할 수 있도록 돕는다.

데이터스트림즈 이영상 대표를 만나 데이터스트림즈가 지난 20년 간 걸어온 길과 앞으로 그려갈 20년 후의 미래에 대해 들어봤다.


데이터 중심 시대에 급성장 기회 맞아

Q. 데이터스트림즈의 차별화된 경쟁력은?

당시에는 CRM을 중심으로 업무용 시스템들이 기업들의 IT 수요 대부분을 차지했다. 2000년부터 유닉스 서버가 저렴하게 공급되면서 기존 업무에 컴퓨터를 도입해 효율화하는 것에 관심이 많았다. 데이터 쪽은 DBMS나 ETL 정도로 구색을 갖추는 수준이었다. 가령 오라클은 원스톱 전략이라고 해서, 데이터를 오라클DB에 다 집어넣기만 하면 해결된다는 식으로 시장을 공략했다. 사실 데이터에 대한 수요가 많지 않았던 시기에는 이러한 전략이 유효했다.

하지만 우리 데이터스트림즈는 창립 당시부터 데이터 시장이 크게 바뀔 것이라는 확신을 가지고 출발했다. 기존의 DB 중심 전략은 금방 한계를 맞이하고, 데이터 통합을 통한 탈DBMS, 메타데이터 관리를 통한 데이터 거버넌스 수립, 하나의 플랫폼에서 모든 데이터를 아우르는 데이터 패브릭 구축 등이 시장을 선도할 것으로 판단한 것이다. 그리고 2021년 현재, 이러한 선택은 틀리지 않았다는 것이 증명됐다.

4차 산업혁명 시대, 혹은 디지털 전환(Digital Transformation) 시대를 맞아 기업들의 데이터 전략은 크게 변화했다. 이제는 대다수 기업들의 IT 수요가 애플리케이션 중심이 아니라 데이터 중심으로 옮겨갔다. 여러 곳에 있는 데이터를 하둡(Hadoop)에 모아 방대한 데이터 레이크를 만들고, 뛰어난 HW 스펙을 바탕으로 대량의 데이터를 동시에 분석해 보다 정확한 정보를 얻고자 한다. 이에 그동안 데이터스트림즈가 갈고 닦아온 데이터 통합과 관리 기술력이 빛을 보고 있다.


Q. 현재 데이터스트림즈의 핵심 제품은?

‘테라스트림’과 ‘메타스트림’이 대표적인 제품이다. 먼저 창립 이후 가장 먼저 출시된 ‘테라스트림’은 DW 구축에 필수적인 데이터 통합 솔루션으로, 다양한 형태의 데이터를 대량으로 빠르게 추출‧변환‧적재(ETL)할 수 있다. 데이터 통합 시장이 만들어지기도 전부터 선제적으로 출시해 지속적으로 공략해온 결과 국내에서는 시장 점유율 1위를 공고히 하고 있다. 현재 데이터 통합 시장에서는 국내 전 산업계에 걸쳐 약 70%, 금융권에서는 보다 높은 80% 정도의 시장 점유율을 확보하고 있는 것으로 파악된다.

‘메타스트림’은 메타데이터 표준화와 관리, 데이터 사전(Data Dictionary) 혹은 데이터 카탈로그(Data Catalog) 구축 등을 수행하는 제품이다. 메타데이터 관리는 다양한 데이터를 통합하고 분석하기 위한 기본이며, 제대로 갖춰지지 않으면 데이터에 대한 소통이 불가능하고 활용성이 크게 떨어진다. 데이터 카탈로그가 없으면 데이터가 어디에 어떻게 저장돼있는지를 알 수 없어 원하는 데이터를 찾을 수가 없기 때문에 매우 중요하다. 현재 국내 메타데이터 관리 시장에서 ‘메타스트림’ 역시 점유율이 상당하며, 최근에 괄목할만한 성장세를 보이고 있다.


Q. ‘테라원’으로 모든 기술을 집약했다고 하는데?

‘테라원’은 현재 공공시장에서 돌풍을 일으키고 있는 빅데이터 플랫폼 솔루션이다. 공공시장에 한해서는 상대를 찾기 어려울 정도로 독주하고 있다. 금융이나 제조, 유통 등 일반 산업계에서는 아직 인지도가 낮지만, 이는 빅데이터 분야의 글로벌 기업들보다 시장 진입이 늦었기에 발생한 결과다. 그래도 글로벌 기업 제품들을 사용하고 있던 국내 대기업들을 차근차근 ‘테라원’으로 윈백에 성공하면서 꾸준히 성장하고 있다.

‘테라원’의 핵심 기술 중 하나는 데이터 거버넌스 관리다. 데이터 거버넌스는 메타데이터 관리 도구를 중심으로 모든 데이터들의 정보를 담고 있으며, 이들을 표준화하고 지속적으로 이상이 생기지 않도록 관리한다. 이는 앞서 설명한 ‘메타스트림’이 갖춘 기능이다. 여기에 데이터들의 품질과 메타데이터 관리 준수 여부 등을 검증하는 ‘퀄리티스트림(QualityStream)’, 데이터의 생성부터 폐기에 이르는 전 과정을 추적해 분석할 수 있는 ‘Q-트랙(Q-Track)’ 등이 탑재됐다. 또한 데이터 통합, 표준화, 품질관리, 흐름관리를 통합한 데이터 거버넌스 플랫폼 ‘이루다(IRUDA)’도 사용 가능하다.

다른 하나의 핵심 기술은 데이터 가상화다. 데이터 가상화는 현재 데이터스트림즈가 강력하게 추진하고 있는 기술 요소로, 분산된 데이터 소스에서 단 한 번의 쿼리를 던져 원하는 데이터를 찾아내는 것이 목표다. 이를 활용하면 이기종의 다양한 데이터들을 물리적으로 이동시키지 않고 가상화 레이어 상에서 통합해 분석할 수 있다. 해당 기술은 ‘테라원 슈퍼쿼리(Super Query)’로 구현돼있으며, 이미 많은 공공기관과 금융사에서 도입해 활용하고 있다.

이처럼 ‘테라원’에는 데이터스트림즈가 보유한 14종의 핵심 제품들이 탑재돼있다. 지난 20년 간 제품들을 순차적으로 개발하면서 확보한 세계 최고 수준의 기술력이 적용됐으며, 글로벌 기업들의 제품들과도 경쟁해 지속적인 윈백에 성공하고 있다. 특히 최근에는 한 대기업의 빅데이터 플랫폼을 윈백했는데, 해당 부분은 제품 규모만 따져도 약 100만 달러 이상에 달해 전 세계적으로도 찾기 힘든 사례를 만들었다.

“데이터스트림즈는 ‘테라스트림’과 ‘메타스트림’ 등 탄탄한 제품 라인업을 갖추고 있으며, 이러한 제품 기술력을 집약한 ‘테라원’으로 공공시장에서 돌풍을 일으키고 있다.”
“데이터스트림즈는 ‘테라스트림’과 ‘메타스트림’ 등 탄탄한 제품 라인업을 갖추고 있으며, 이러한 제품 기술력을 집약한 ‘테라원’으로 공공시장에서 돌풍을 일으키고 있다.”

코스닥 상장을 시작으로 글로벌 시장 공략까지 노린다

Q. 데이터스트림즈의 향후 20년 전략은?

디지털 전환이라는 새로운 시대의 흐름이 급물살을 타고 있다. 특히 메타버스가 각광받으면서 이목을 집중시키고 있다. 몇 년 전까지는 AI나 머신러닝이 관심의 한가운데에 있었는데, 최근에는 메타버스처럼 누구나 실감할 수 있는 형태로 다가오면서 관심이 높아진 것 같다. 쉽게 설명하자면, 과거 디지털 전환의 상징은 CD였다. LP판으로 음악을 듣던 아날로그 시대에, 훨씬 작은 크기에 많은 음악을 집어넣고 편집이나 전송도 누구든지 가능한 CD라는 매체가 나오면서 디지털 기술을 체감할 수 있게 됐다.

LP와 CD의 관계를 우리가 지금 살고 있는 세계에 적용하면 어떻게 될까? 메타버스가 도래하면서 모든 활동이 디지털 세계에서 일어난다면 실로 어마어마한 데이터들이 생성될 것이다. 이러한 데이터들을 고전적인 방식대로 DB에 하나하나 집어넣을 수는 없다. CD처럼 더 빠르고 강력하며, 수정 가능하면서 찾기도 쉬운 방법이 필요하다. 이것을 우리는 빅데이터 플랫폼과 메타데이터라는 개념으로 접근해왔다. 생성되는 데이터의 속성이나 형식을 사전에 메타데이터로 지정해 놓은 다음에 그에 맞게 자동으로 정리하면 된다.

메타버스 세계에서 생성되는 데이터는 DB시절에 비해 차원이 다르게 다양하고 방대하므로, 이를 구분하는 메타데이터 역시 훨씬 상세해야 할 것이다. 현재 데이터스트림즈는 ‘초 상세화’라는 개념을 만들어서 기술을 강화하고 있다. 데이터에 대한 분류 체계가 제대로 잡혀 있기만 하면 이를 저장하고 불러올 수 있는 기술들은 ‘테라원’이나 ‘슈퍼쿼리’ 등으로 충분히 갖춰져 있기 때문이다.


Q. 단기적으로 가장 먼저 달성할 목표가 있다면?

기술력을 통한 코스닥 상장을 내년 1Q 중에 마무리하는 것이다. 현재 TCB 업체가 선정돼 순차적으로 진행 중이다. 기술력 기반의 상장은 해외 시장 진출을 위한 기반이 되기 때문이다. 국내 시장에서 1위를 해도 해외 시장에 나가보면 인정해주지 않는다. 공신력이 없기 때문이다. 시장 공략을 위해서는 투자가 필요한데, 해외에 진출해서 매출이 많이 발생하면 적극적인 투자도 가능하겠지만 인지도를 쌓는 중에는 대규모 투자에도 한계가 있다. 그러니 코스닥 상장을 통해 자금을 확보하는 동시에, 글로벌 기업들이 원하는 표준화된 스펙을 갖춰 매력적인 투자대상으로 인정받고자 한다.

특히 상장이 되면 시기적으로도 글로벌 시장 공략에 청신호가 켜진다. 최근 가트너에서는 ‘2021년 매직 쿼드런트: 데이터 통합 도구(2021 Magic Quadrant for Data Integration Tools)’ 보고서에서 데이터스트림즈를 ‘아너러블 벤더(Honorable Vendor)’로 선정했다. 글로벌 시장에서 충분히 경쟁해볼 만한 기술력을 갖추고 있다고 인정해준 것이다. 여기에 상장을 통해 공신력까지 확보한다면 데이터스트림즈의 가치는 크게 오를 것이다.

그동안 데이터스트림즈는 뛰어난 제품만 믿고 무작정 글로벌 시장에 뛰어들었지만, 앞으로는 자본이 오고가는 시장을 파악하고 그들이 인정하는 요건들을 클리어해가며 공략할 계획이다. 제품 판매를 주력으로 하는 비즈니스 모델에서 벗어나, 빅데이터 플랫폼을 4차 산업의 주요 사업모델과 접목하는 데이터 기반 비즈니스를 확대함으로써 100배 이상 성장하는 기업을 만들겠다.

저작권자 © 컴퓨터월드 무단전재 및 재배포 금지