약 100억 원 규모, 공공과 금융 기관 중심으로 시장 확산

최근 정보시스템으로 처리해야 할 업무가 보다 복잡해지고 다양해지면서 시스템간의 통합과 연계의 중요성이 강조되고 있다. 이런 시스템 통합과 연계는 또한 전산 담당자들이'데이터에 대한 품질 문제'를 고민하게 만들고 있다. 정보시스템이 아무리 잘 운영된다 해도 데이터 품질에 문제가 있으면 잘못된 정책이 수립될 수밖에 없고 이는 기업의 경쟁력 저하로 이어지기 때문이다. 그 동안 정보시스템의 원활한 운영에 노력해온 시스템 담당자들이 데이터 품질에 관심을 보이는 이유이다. 데이터 품질 관리가 왜 중요하고, 어떻게 구축해야만 하는지 집중 살펴본다.



공공기관과 금융권을 비롯한 각 산업 분야 기업들이 경쟁력확보를 위해 데이터에 대한 체계적인 품질관리에 나서고 있다. 데이터 품질관리를 통해 빠르게 변화하는 시장에서 경쟁우위를 확보하기 위해서이다.
초창기 정보의 통합에 집중되어온 데이터 품질 관리 시장은 최근들어 관리의 중요성이 상대적으로 강조되고 있다. 특히 조직화된 회사의 경우 데이터 품질의 중요성을 강조하고 있다. 이들 회사들은 이미 정보시스템의 운영은 일정 수준에 이르렀다는 판단에 따라 이제 데이터의 품질 향상에 주력하고 있다. 정확한 데이터를 기반으로 올바른 정책을 수립하겠다는 것이다. 이들 기업들이 데이터 관리의 초점을 데이터 품질에 맞추고 있는 이유이다.

그러나 아직도 데이터 품질보다는 원활한 시스템 운영에 초점을 맞추고 있는 기업이 많아 데이터 품질과 관련한 시장은 잠재성은 크지만 아직 기대에 미치지 못하고 있다.

데이터 품질, 공공과 금융 중심으로 시장 확산
현재 국내에서 데이터 통합과 데이터 품질 관리 툴을 제공하는 벤더는 데이터스트림즈, 인포매티카, 지티원, IBM 등을 들 수 있다. 이들 업체는 주로 데이터 통합 솔루션에 품질 관리 툴을 포함해 프로젝트를 진행하고 있다.

국내 데이터 통합 시장은 공공, 금융, 통신, 제조 등 전 산업분야에 널리 확산돼있다. 반면 데이터 품질과 관련된 프로젝트는 현재 공공 분야와 금융 분야에서 일부 진행되고 있을 뿐 아직 활성화되지는 못하고 있다.

금융기관에서 차세대 프로젝트 등을 잇달아 진행함에 따라 데이터 통합 시장이 크게 성장했으며, 금융권의 IT컴플라이언스 이슈는 데이터 통합시장의 성장을 더욱 가속화시켰다.

그러나 데이터 품질이 확보되지 않는 한 데이터 통합 프로젝트는 성공할 수 없다. 이러한 이유로 향후 데이터 품질 관리 시장 역시 크게 성장할 것이 확실시 된다. 데이터 통합 시장의 확대는 필연적으로 데이터 품질 관리 시장의 확대로 이어질 것이라는 얘기이다.

업체의 한 관계자는 최근 데이터 통합 부문의 가장 큰 변화로 거버넌스 이슈의 부상, 온 디맨드 컴퓨팅의 확산, 세계경영의 확대 등을 들었다. 그는 특히 온 디맨드 컴퓨팅 등으로 대표되는 아웃소싱은 가장 중요한 흐름 가운데 하나인데 이는 데이터가 기업 내·외부를 넘나들며 분산돼 존재하기 때문에 필연적으로 데이터 통합의 중요성이 강조될 수밖에 없다고 주장한다. 데이터 품질이 중요한 이유는 데이터 품질 관리를 통해 기업의 모든 데이터에 대한 싱글 뷰(Single View)를 가질 수 있기 때문이다.

업계의 한 관계자는"현재 국내 데이터 품질 시장은 컨설팅과 라이선스, 서비스 등을 포함해 약 100억 원 규모가 된다"며 "예전에는 컨설팅 차원의 데이터 품질만 하는 경우가 많았지만 지난해부터 금융기관들이 차세대 프로젝트를 진행하면서 메타데이터관리 솔루션 시장이 괄목할만한 성장을 하면서 이 시장이 주목 받고 있다"고 밝혔다. 메타데이터시장이 데이터 품질 시장으로 발전해 가고 있다는 게 그의 설명이다.

메타데이터관리 솔루션은 대용량 데이터 중 원하는 정보를 효율적으로 찾아 낼 수 있도록 다른 데이터를 설명해 주는 데이터를 말한다. 콘텐츠의 위치, 내용, 작성자, 이용조건 등을 기록함으로써 데이터의 효율적인 운용을 가능하게 해준다.

국내의 경우 금융권이 차세대 시스템을 도입하면서 시장이 본격적으로 열리기 시작했으며 최근 공공기관을 중심으로 확산되고 있다. 초창기에는 외산 업체들이 시장을 장악했으나 국산 솔루션 기업들이 제품을 개발하는 등 이 시장에 뛰어들면서 현재는 국산 제품이 시장을 주도하고 있다. 국산 제품이 단기간에 시장을 주도할 수 있었던 이유는 기업의 프로세스를 적극 반영할 수 있는 특성 때문이었다. 데이터를 어떻게 관리하고 활용하는지 각 기업마다 차이가 있는데 국산 업체들이 이를 솔루션 내에 반영한 것이다.

데이터 품질시장, 국내 업체 주도
이렇듯 데이터 품질 시장은 국내 공공기관 및 금융권을 중심으로 확산되고 있다.

그러나 내용면에서는 아직 미흡한 실정이다. 현재의 국내 데이터 품질 관리는 여전히 컨설팅 차원에 그치는 경우가 많다. 다시 말해 데이터 값의 직접적인 정제가 아닌 데이터의 구조, 흐름, 프로세스, 시스템 등의 프로파일링 및 분석을 통해 보유데이터의 문제점을 파악하고 보고하는 수준에 머무르는 경우가 많다는 것이다. 업계의 한 관계자는"미국은 이미 80년대부터 연방정부가 데이터의 신뢰성을 위해 각종 제도를 만들어 적용하고 있음에도 불구하고 여전히 데이터 품질 저하로 인한 손실이 매년 수천만 달러씩 발생하고 있다"고 전제," 반면 국내는 아직 잘못된 데이터로 인한 피해액조차 제대로 나와 있지 않은 상황이다"고 말했다.

하지만 데이터 품질을 관리한다는 것이 곧 비즈니스 프로세스를 관리하는 것으로 기업 경쟁력과 직결되며, 데이터 오류로 인한 피해가 크다는 사실을 국내 고객들도 점차 인식하고 있어 앞으로의 성장 가능성은 높을 것으로 예상된다.

외산 데이터 품질 업체들은 이제는 데이터를 단순한 시스템의 부산물로 보아서는 안 된다고 주장한다. 데이터에 상품적 가치를 부여하고 데이터 값이 사용자의 요구 수준을 만족시킬 수 있는 즉, 콘텐츠 중심의 새로운 접근이 필요하다는 것이다. 데이터품질 관리는 결국 데이터 값을 계량화하고 이를 지속적으로 관리해 사용자의 요구 사항을 최대한 충족시킬 수 있는 고품질의 정보를 제공할 수 있도록 하는 것이다.

국산 데이터 품질 업체들은 외산 업체들의 품질 관리 툴이 국내 실정에 맞지 않는다고 주장한다. 외산 업체들이 주장하는 데이터 품질 활동은 데이터 값을 계량화하고 이를 지속적으로 관리해 사용자의 요구사항을 충족시킬 수 있는 고품질의 정보를 제공할 수 있도록 지원하는 것인데 국내에서는 아직 이런 단계에 미치지 못하고 있다는 것이다.

국내 기업들은 고객의 특성을 반영해 그들의 요구사항과 필요로 하는 것을 제때 제공함으로써 고객들을 끌어들이고 있다. 최근 컴플라이언스, 리얼타임, MDM(마스터데이터 관리)에 대한 고객의 요구가 증가하고 있는 것도 고객의 이러한 요구사항을 즉각 반영하기 때문이다.

외산 기업들은 주로 데이터 통합 솔루션에 품질관리 툴을 포함시켜 시장 진입을 가속화하고 있다. 특히 데이터 품질관리에 대한 인기가 높아지면서 대기업들이 전문기업들을 인수함으로써 툴을 포함시키는 경우도 많아졌다. 반면 국내 업체는 대부분 품질관리만을 위한 툴을 통해 시장을 확보해나가는 경우가 많다.

현재 국내에서 데이터 통합 및 데이터 품질 관리 툴을 제공하는 데이터스트림즈, 인포매티카, 지티원, IBM 등이다. 이들의제품과 영업 전략 등을 살펴보면 다음과 같다.

공급업체 현황

데이터스트림즈
다양한 고객 확보로 올 160억 원 매출 예상

데이터스트림즈는 2001년 설립, 국내 데이터 통합 관리 시장에서 토종 기술을 기반으로 컨설팅, 패키지솔루션 제공 및 구축 서비스에 이르는 토털 IT 서비스를 제공하고 있다.

데이터스트림즈의 제품군은 크게 데이터 통합 제품군과 데이터 품질 제품군 두 가지로 구분할 수 있다. 데이터 통합 제품군에는 TeraStream, CoSORT, FACT, DeltaStream 등이 있다. 데이터 품질 제품군에는 MetaStream, QualityStream, ImpactStream 등이 있다.

데이터스트림즈는 지난해 131억 원의 매출을 달성했다. 올해목표는 160억 원이다. 이 회사는 ETL 분야, 특히 금융권에서 80% 이상의 매출을 거두고 있다. 그 동안 데이터 추출(ETL) 솔루션과 메타데이터 관리 솔루션 중심 사업을 해 온 이 회사는 데이터 품질과 데이터웨어하우스(DW) 관련 사업으로도 영역을 확대했다. 또한 고객도 금융권 중심에서 공공기관으로 확대했다.

데이터스트림즈 사업개발팀장인 박시영 이사는"현재 데이터추출 솔루션 툴의 핵심 요구 사항은 대용량 데이터 처리 성능의 보장이다. 이를 위해서는 빠른 가공 성능, 편의성, 고속 추출 성능도 보장되어야 한다. 또한 실시간 데이터 처리 기능 및 배치처리 기능까지도 요구 되고 있다. 현재 이러한 고객의 요구 사항에 맞는 툴은 TeraStream이 유일하다"고 자사 제품의 우수성을 강조했다. 국내 실정에 맞는 솔루션을 공급한 것이 성장의 원동력이 됐다는 것이 그의 설명.

박 이사는 외산 솔루션을 쓰다가 불편을 느껴 그에 대한 해법으로 데이터스트림즈의 솔루션을 찾는 경우가 늘어나고 있다고 덧붙였다.

TeraStream은 유닉스, 리눅스 환경에서 파일 및 DB 형태의 대용량 데이터를 빠르고 편리하게 추출, 정제, 변환, 검증, 관리, 적재함으로써 신시스템 구축을 위한 ETCL, 대량 데이터의 배치 업무처리, 데이터 실시간 연계 등에 효율적으로 적용할 수 있는 도구이다.

TeraStream, 대용량 데이터 안정적으로 처리
TeraStream은 또 Flat File 및 RDBMS 데이터 가공 기능을 제공하므로 가공 작업 내에 필요한 모든 메타 데이터를 생성하고 Flat Fil로 업로드 시 동시에 메타데이터가 생성된다. 또한 모든 배치 작업의 메타데이터화를 지원한다.

박시영 이사는"기업이 보유하는 데이터의 규모는 기하급수적으로 증가하고 있고 이러한 대량의 데이터를 취합하고 분석 자료를 생성해 전략적으로 적시에 활용하기 위해서는 대용량의데이터를 빠른 시간 안에 안정적으로 처리해야 하는 과제에 직면하게 된다"며"또한 변경 데이터의 증가와 절대 데이터의 증가로 시간이 지날수록 데이터베이스에 많은 부하를 주고 처리속도를 늦추게 된다"고 말했다. 박 이사는 덧붙여"고성능의 데이터 정렬과 추출 엔진을 내부 모듈로 채용하고 있는 TeraStream은 이러한 문제를 해결하는 대안이 될 수 있다"고 강조했다.

TeraStream은 기간계, 정보계의 각종 배치 작업뿐만 아니라 DW/CRM, 채권관리, 자산부채관리, 카드 정산 작업, 그리고 방대한 분량의 데이터 가공을 위해 방법 등에 활용될 수 있다.

박 이사가 말하는 TeraStream 적용 시 기업이 얻을 수 있는 기대 효과는 ▲정형화된 작업 관리 체계 구축으로 인해 최적의 작업 환경 구축 ▲사전 예방에 중점을 둔 관리 환경 구축으로 인한 작업의 흐름 및 분석, 예측 가능 ▲GUI를 통한 업무의 편리성 ▲스케줄링을 통한 작업의 진행 상황과 작업의 선후 관계의 편리성 증대 등이다.

TeraStream은 외한은행의 차세대 시스템 및 신 정보계에 표준 ETL, sort, Unload Tool로 선정되어 메인프레임을 다운사이징해 재구축했다. 또한 국세청 DW 프로젝트에도 도입되었다.

국세청 DW 구축 프로젝트에서 TeraStream은 대용량 데이터의 ETT를 전문으로 수행하도록 설계되었다. IBM Host에서 추출된 EBCDIC 데이터를 FTP를 이용해 Batch 서버로 전달하며 TeraStream을 이용해 데이터 변환 및 가공 작업을 진행한 후 DB2에 적재하는 방식으로 이루어져 있다.

메타데이타와 테이타 품질을 묶어 관리
데이터스트림즈는 데이터 품질 시장도 적극 공략하고 있다. 데이터 품질 제품군에는 MetaStream, QualityStream, ImpactStream 등이 있다.

박시영 이사는"데이터스트림즈는 메타데이타, 테이타 품질부분을 상시 품질 관리로 묶어서 제공하는 것이 강점이다"고 강조했다.

데이터스트림즈의 데이터 표준화 및 메타데이터 관리는 사용자 측면과 시스템 운영 측면의 요구사항을 바탕으로 메타데이터관리 대상 항목을 식별해 주요 과제를 도출하며 연관된 데이터의 변화와 흐름을 분석하고 데이터의 변화와 흐름을 분석하고 데이터의 일관된 관리 및 지속적 품질관리를 목표로 한다. 메타데이터 관리 시스템은 이를 시스템의 기능으로 지원한다. 메타데이타 관리의 목표는 ▲데이터 표준화 ▲코드 통합 ▲데이터 품질 관리▲영향도 분석 ▲변경이력관리 ▲메타통합 관리 등이다.

박 이사는"빠른 비즈니스 변화와 IT 환경의 변화는 급속한 데이터 및 애플리케이션의 변화를 초래하기 때문에 품질 저하를 가져오고 또한 시스템 장애에 대한 위험 요소를 항상 내포하고 있다"며"이러한 문제를 해결하기 위해 효율적이고 체계적 시스템 관리를 위한 메타데이타 관리시스템 구축이 필요하다"고 강조했다. MetaStream은 메타데이터 구축을 통해 전사 데이터표준화 관리 기반을 마련함으로써 전사적 관점에서의 의사소통을 원활하게 해주고 업무 효율을 향상시키고 운영 및 유지 보수의 용이성을 확보하고 확장 시에도 유연하게 대처할 수 있다.

MetaStream은 업무계 시스템, 데이터 마트 등을 대상으로 데이터 구조 및 값을 수집해 전사적으로 일관적으로 적용할 표준화 항목을 정의하고 공유하는 환경을 제공한다.

금융권에서 강세
또한 데이터모델링 및 데이터 이행을 위한 기준 데이터를 제공하는 역할을 수행한다. 메타데이터 리파지토리를 통해 버전관리, 협업, 손쉬운 변경관리, 메타 리파지토리와의 직접 연계 등이 가능해져 기업의 데이터관리 및 DA 구축 효율 향상, 메타데이터 리파지토리에 축적되어 있는 각종 데이터 관련 정보를 메타시스템을 통해 즉각적으로 확인이 가능하다.

특히 MetaStream을 기반으로 한 데이터 품질 관리 시스템은 모델링 툴에서 승인되어 저장된 모델 정보를 기반으로 검증 대상을 선별하며 데이터 표준화 정보를 이용해 일짜, 여부, 코드(통합 및 개별) 등의 검증 항목을 자동으로 셋팅한다. 또한 이 항목들은 검증 룰 셋을 자동 생성한다. 품질 점검이 수행되어진 후 수행 결과를 통계정보와 함께 제공한다.

MetaStream의 대표적인 구축 사례는 동양생명과 대한생명, SKT, 외환은행 등이다. 대한생명은 EDW 메타데이타관리 시스템 구축을 통해 ▲표준화 지원 가능 ▲ETL, 프로세스 정보 관리▲OLAP ▲데이터 품질 관리 ▲작업 자동화 도구 연동 ▲사용자 관리 등의 효과를 얻었다.

또한 ImpactStream을 기반으로 한 데이터 품질 관리 시스템을 도입하면 ▲QA 능력의 향상 ▲정의된 표준화 적용의 용이성▲프로젝트의 위험 요소 파악 등이 가능하다.

데이터스트림즈의 고객사는 현재 금융과 공공이 대다수를 차지한다. 공공 분야 고객으로는 국민건강보험공단, 국민연금관리공단, 특허청, 우체국, 국토해양부, 소방방재청 등이 있으며 금융 분야 고객은 굿모닝신한증권, 신한생명, 미래에셋생명, 선물거래소, 코스콤, 국민은행, 신한은행, 외한은행, 기업은행, 우리은행 등이다.

박 이사는"데이터 품질 관리 시장에서 우리는 후발 주자라 할 수 있지만 메타데이터 시장에서 선발 주자라 할 수 있어 충분히 경쟁력이 있다고 생각한다"고 강조했다. 고객의 신뢰가 늘어날수록 단순히 솔루션만 공급하는 것이 아닌 솔루션에 대한 가이드 제시나, 개발자 리딩에 관한 요구 등도 늘어나고 있다는 것이그의 설명이다. 데이터스트림즈는 향후 일본 시장도 적극 공략할 계획이다.

인포매티카
데이터 통합 플랫폼으로 시장 공략

인포매티카는 데이터 통합 소프트웨어 및 서비스 분야의 기업이다. 기업들은 인포매티카의 데이터 통합 솔루션을 도입함으로써 조직 전반에 걸쳐 정보 자산을 통합하여 더 큰 비즈니스 가치를 확보할 수 있다. 전 세계적으로 3,600개 이상의 기업들이 인포매티카 제품을 사용해 다양한 규모의 복잡한 데이터 통합에 소요되는 비용과 시간을 절감하고 있다.

인포매티카는 최근 3년간 국내에서 데이터 통합 부분의 선두주자로 인식돼 왔으며 약 80여개 사를 고객으로 확보했다. 이 회사는 데이터 품질 관련 시장도 적극 공략하고 있다.

인포매티카의 데이터 통합 솔루션은 Informatica PowerCenter, Informatica PowerExchange 등이다.

Informatica PowerCenter는 거의 모든 비즈니스 시스템에서 모든 형식의 데이터를 엑세스, 검색 및 통합하여 기업 전반에 다양한 속도로 전달하는 통합된 단일 엔터프라이즈 데이터 통합플랫폼이다. Informatica PowerExchange 는 PowerCenter 플랫폼과 연동하여 미션 크리티컬 운영 데이터를 제한 없이 기업 내에서 해당 데이터를 필요로 하는 사람과 프로세스에 제공, 어떠한 프로그래밍 없이도 데이터의 추출, 변환 및 필터링 작업을 배치 또는 실시간으로 처리할 수 있도록 해준다.

한국인포매티카 정인호 본부장은"실시간 데이터 통합과 데이터 서비스를 위한 포괄적인 데이터 통합 플랫폼에 대한 요구가 증가하고 있다"고 말했다. 정 본부장에 따르면 데이터 통합플랫폼 접근 방식은 접근성과 품질의 향상, 대기시간 절감을 비롯해 다양한 애플리케이션으로 실시간 데이터 전송을 가능하게 해준다. 정 본부장은"데이터 문제의 근본 해결을 위한 실시간 데이터 통합 플랫폼의 역할은 매우 중요하다"며"인포매티카는 신뢰할 수 있는 데이터를 제공하기 위한 포괄적인 개방형 데이터 통합 플랫폼을 제공하고 있다"고 말했다.

단일 솔루션으로 확장성이 강점
인포매티카의 데이터 품질 솔루션은 Informatica Data Quality와 Informatica Identity Resolution 등이 있다. Informatica Data Quality는 비즈니스 전문가의 데이터 품질 관리 프로세스를 지원하도록 특별히 설계된 제품이다. 간단하게 작동할 수 있으며 강력한 데이터 품질 프로파일링, 정제, 매칭, 모니터링 성능을 모두 갖춘 단일 솔루션이다. Informatica Identity Resolution는 회사 및 정부 조직이 60개 이상의 국가로부터 수집된 ID 데이터를 배치 및 실시간으로 검색하고 매칭 할 수 있게 해주는 높은 확장성을 갖춘 제품이다.

인포매티카가 올해 확보한 주요 고객사는 아시아나 항공, 제일상호저축은행, 금융감독원, 현대제철, 삼성모바일 디스플레이사업부 등이 있으며 데이터 품질의 경우 아직 레퍼런스 사이트는 없지만 몇몇 업체와 영업을 추진 중이다. 정 본부장에 따르면 현재 국내 데이터 품질 시장은 일반 기업보다 오히려 공공 시장에서 적극적으로 도입하고 있다.

정 본부장은"기업들이 비즈니스 중심의 접근법과 모든 마스터 데이터 유형에 대한 지원, 데이터 품질 매트릭스와 리포트를 통한 지속적인 품질 측정 및 관리, 기업 전사적인 차원의 데이터품질 관리라는 4가지의 핵심 역량을 기반으로 프로젝트를 진행한다면 성공할 수 있을 것"이라고 밝혔다.

이를 위해 인포매티카의 데이터 라이프 사이클을 활용하는 것도 하나의 방법이라고. 인포매티카의 데이터 라이프 사이클이 고객이 프레임워크 안에서 데이터를 잘 관리할 수 있도록 도와 준다는 것이다.

데이터 라이프 사이클은 여섯 단계로 이루어진다. 핵심 이슈가 무엇인지 이해하는 프로파일링 단계와 타깃을 측정하고 정의하는 단계, 데이터 품질 룰을 정의하는 단계, 데이터 품질 룰 승인 후 전체적인 프로세스에 통합하는 단계, 예외적인 부분에 대한 평가 및 처리 단계, 마지막으로 데이터 품질과 실제적으로 승인했던 타깃을 평가하는 단계이다.

인포매티카가 주장하는 콘텐츠 중심의 데이터 품질 관리를 위해서는 프로파일링(Profiling), 파싱(Parsing), 정제 및 표준화(Cleansing and Standardization), 매칭 및 중복 제거(Matching and de-duplication), 데이터 보강(Enrichment) 등 5가지 기능이 필요하다.

콘텐츠 중심의 데이터 품질관리
인포매티카의 데이터 통합 플랫폼은 이러한 5가지 기능을 토대로 콘텐츠 중심의 데이터 품질 관리 활동을 지원한다. 특히 인포매티카의 플랫폼을 통해 구조적 품질 관리에서 부족했던 데이터 값에 대한 매칭 및 오류 패턴 등을 파악할 수 있으며 스코어카드를 통해 데이터 품질 관리 활동을 지속적으로 모니터링 할 수 있어 데이터 값의 정확도와 품질을 향상 시킬 수 있다.

이처럼 인포매티카는 데이터 품질 관리를 위해 단일 제품의 조합이 아닌 플랫폼 기반의 솔루션을 제공하고 하는 전략을 취하고 있다. 기업들은 대용량 데이터 처리를 위해 플랫폼의 데이터 통합 엔진을 사용함으로써 기존의 데이터 품질 관리 제품이 제공하지 못했던 대용량 데이터 매칭 및 정제가 가능하다.

정 본부장은"기업들은 내 외부 상황을 정확히 파악하고 신속하게 의사 결정을 내림으로써 빠르게 변화하고 있는 글로벌 시장 환경에서 경쟁 우위를 확보할 수 있다"며"이러한 의사 결정은 결국 기업 전반에 산재하고 있는 데이터의 분석을 통해 이루어진다"고 말했다.

기업들은 구조 중심적인 데이터 품질 관리에서 콘텐츠 중심으로 접근 방식을 전환하고 프로파일링 및 파싱 단계를 넘어 데이터 매칭 및 정제 단계의 데이터 품질 관리 활동을 통해 적시 적소에서 고품질의 데이터를 활용할 수 있는 환경을 확보해야 하며 인포매티카는 통합 플랫폼을 통해 의사 결정의 근간이 되는5단계의 데이터 품질 관리 활동을 전반적으로 지원한다는 것이 그의 설명이다.

인포매티카의 데이터 품질 솔루션의 주요 기능은 크게 4가지이다. 첫째, 데이터 품질 목표를 설정함으로써 비즈니스 담당자가 데이터 품질을 제어 할 수 있도록 지원한다. 데이터 품질 관리 초기 단계에서 분석가들이 데이터 품질 문제를 파악하여 범주화 및 평가함으로써 모든 비즈니스 상황을 제어가능하게 하는 것이다. 둘째, 기업 전반으로 데이터 품질 관리대상을 확장해 고객 이름, 주소 데이터뿐만 아니라 제품, 재무, 자제, 가격, 주문 및 자산 데이터를 비롯한 모든 엔터프라이즈 데이터에 대한 데이터 품질 관리를 지원한다. 셋째, 엔터프라이즈 전반에 있는 데이터에 대한 지속적인 측정과 모니터링을 통해 데이터의 신뢰도를 확보한다. 마지막으로 기업 전반에 걸쳐 데이터 품질에 대한 정보를 제공함으로써 민첩성을 향상시킨다.

정 본부장은 인포매티가의 데이터 통합 및 품질관리 제품을 도입하면 ▲운영효율성 향상 ▲규정준수 보장 ▲의사결정수준향상 ▲전사적 데이터 품질 이니셔티브의 장기적인 성공 보장 ▲고객에 대한 싱글 뷰를 향상시키고 비즈니스에 고품질 데이터를 공급함으로써 고객 서비스 수준 향상 등의 효과를 얻을 수 있다고 강조했다.

올 11월, 인포매티카 플랫폼 릴리즈 9 출시
현재 인포매티카는 바이텍 정보통신, 비스프로 컨설팅, 씨앤택 시스템즈, CIES 등을 총판사로 두고 있다. 그러나 직접 영업 또한 강화하고 있다. 현재 함께 협력할 데이터 통합 및 품질 전문 컨설팅 업체 그리고 주소 및 이름 정제 분야의 전문성을 가지고 있는 업체를 찾고 있다.

정 본부장은"데이터품질관리 인증센터에서'2009 데이터베이스 무료 품질 진단'을 진행하고 있는데 인포매티카도 참가한다"고 말했다. 데이터베이스 무료 품질 진단은 공공기관 및 민간기업이 운영·서비스하고 있는 DB를 대상으로 품질진단을 실시해 품질 개선을 지원하고 DB 품질의 중요성에 대한 인식을 제고하기 위한 사업이다. 이번 사업은'데이터베이스산업육성지원사업'의 일환으로 무료로 시행된다. 데이터 품질, 데이터 품질관리 프로세스 진단, 데이터 품질관리 도입 성과측정 지원이 대상이다. 인포매티카는 이번 데이터베이스 무료 품질 진단을 계기로 시장을 확대해 나갈계획이다.

정 본부장은"향후 인포매티카는 전사적인 데이터 품질과 GRC 및 MDM 사업 분야에 집중할 예정이며 주소 및 이름 정제가 필요한 고객 관리 업무에도 적용하여 사업 영역을 확대할 예정이다"고 밝혔다.

또한 데이터 통합 시장의 리더십은 지속적으로 확보해나가면서 인포매티카 플랫폼 비즈니스 공략에 더욱 집중할 계획이다. 인포매티카의 데이터 통합 플랫폼은 기업 요건에 맞게 통합, 정제, 매타데이타, 매니지먼트 등 전반적인 기반을 통합해서 제안하는 것을 말한다.

인포매티카는 올해 11월에 유일한 데이터 통합 및 품질 관리를 위한 플랫폼으로서 데이터 품질 관리와 데이터 프로파일링 기능을 통합시킨 퍼베이시브 데이터 품질 관리인 인포매티카 플랫폼 릴리즈 9를 출시할 정이다. 또한 지난 2월 어플리메이션 인수를 통해 추가된 인포매티카의 애플리케이션 정보 수명 주기 관리 솔루션은 개발과 테스트에서 보관과 폐기에 이르기까지 정형 데이터의 가용 기간 동안 데이터를 안전하고 비용 효율적으로 관리하는 솔루션으로 하반기부터 한국에서도 판매가 가능해졌다.

지티원
데이터 품질 시장 영향력 1위

지티원은 지난해 2월 아이티플러스에서 분사했다. 설립 첫 해 95억 원의 매출을 기록하는 등 시장 진입에 성공했다는 평가를 받고 있다.

지난해 수주액은 약 135억 원. 지티원이 이처럼 기대 이상의 실적을 올린 것은 전사 데이터 품질 관리 솔루션인 DQ마이너(DQMiner), 전사 통합 메타데이터 관리 솔루션인 메타마이터(MetaMiner), 애플리케이션 변경 영향분석 솔루션 체인지마이너(ChangeMiner) 등 기존 제품 외에 지난해 초 자체 개발한 자금세탁방지솔루션인 AML익스프레스도 한 몫을 톡톡히 했다고 한다. 지티원의 성장 요인은 고객사의 요구사항에 맞춰 규모와 기능을 유연하게 구현할 수 있도록 한 것으로 분석된다.

지티원에서 프리세일즈와 마케팅 업무를 맡고 있는 백운기 이사는"지티원이 아이티플러스로 데이터 품질 관리 솔루션을 국내 업체 중 가장 먼저 시작했다"며"그 결과 지티원은 현재 국내 데이터 품질 시장에서 업계 선두를 유지하고 있다"고 말했다.

지티원은 매년 데이터 품질로 약 30억 원의 매출을 올리고 있다. 아이티플러스로 사업을 시작할 당시에는 성장폭이 컸지만 현재는 안정적으로 매출을 유지하고 있다. 지티원의 고객사는 약 30여 개이다.

백 이사는 지티원이 국내 데이터 품질 시장에서 선두를 유지하는 이유는 제품의 기술력과 숙련된 노하우와 방법론을 꼽았다. 지티원의 데이터 거버넌스 솔루션 중 하나인 DQ마이너는 고객의 요구에 맞게 데이터 품질을 체계적으로 진단 및 관리함으로써 저품질 데이터로 인한 경영 효율성 저하를 방지하고 올바른 의사 결정을 유도해 경쟁력을 높여준다는 것이 그의 설명이다.

DQ마이너, 전사 차원 품질관리
DQ마이너는 또한 전사 차원의 데이터 품질 수준을 향상시킬 수 있도록 데이터 품질 관리 방법론을 제공하며 이를 기반으로체계적인 데이터 품질 관리 프로세스 및 시스템을 구축할 수 있게 해준다. 기업이 DQ마이너를 도입하면 IT 투자 위험을 줄이고 우수한 데이터 품질 확보를 통해 기업 경쟁력을 강화할 수 있다.

DQ마이너의 주요 기능은 ▲데이터 프로파일링 ▲데이터 품질 관리 활동 ▲계수 검증과 추이 분석 ▲데이터 오디팅 ▲오류데이터 생산 프로그램 추적 ▲데이터 품질 분석 보고 등이다.

백 이사는"현재 금융과 공공 분야에서 수요가 많고 제조 분야는 MDM 이슈가 있다"고 덧붙였다. MDM을 하려면 메타데이터를 해야 하고 이는 결국 데이터 품질 관리를 하면 좋다는 인식을 확산시키기 때문에 결국 데이터 품질 시장도 확산 될 것이라는게 그의 설명이다.

지티원의 데이터 거버넌스 솔루션 중 또 하나인 전사 통합 메타데이타 관리 솔루션인 메타마이너이다. 메타마이너는 기업의 모든 IT 및 비즈니스 정보 자산에 대한 표준화를 기반으로 메타데이터의 생성에서부터 사용, 흐름, 소멸까지의 데이터라 라이프사이클과 각종 정보의 연관 관계를 체계적으로 제공한다.

메타마이너를 도입한 기업들은 위험관리, 빠른 시장 대응, 비용 절감, 통합 거버넌스라는 효과를 얻을 수 있다. 특히 통합 거버넌스의 경우 데이터 품질 관리, 애플리케이션 영향 분석, 애플리케이션 변경 관리 솔루션과의 원활한 연계를 통해 데이터와 애플리케이션의 통합 거버넌스 기반을 구축할 수 있다.

메타마이너의 주요 기능은 ▲데이터 표준 관리 ▲데이터 구조관리 ▲데이터 관리 워크플로우 ▲데이터 관계 관리 ▲데이터구조적 품질 관리 ▲XML 기반 보고서 생성 등이다.

일본과 중국시장 공략 예정 데이터 구조적 품질 관리의 경우 메타데이터 등록 시 필요한 각 속성 정보 항목들이 충실히 채워졌는지 여부를 검증해 세부 누락 항목들을 파악한다. 또한 데이터 구조 정보와 표준사전 사이의 비교 검증을 통해 구조 정보의 표준 준수 여부의 정보 제공도 가능하다.

지티원은 이러한 솔루션을 내세워 향후 일본 시장과 중국 시장도 공략할 방침이다. 국내 시장에서는 지난해까지 직접 영업에 주력했지만 올해는 SI 업체나 파트너사 통해 시장을 확대해 나갈 예정이다.

올해 매출 목표 역시 데이터 품질 관리 분야에서 30억 원 규모이다. 상반기에 공공 기관의 프로젝트가 지연되었고 제조 분야 역시 프로젝트가 지연되었기는 하지만 이 같은 목표는 무난히 달성 할 수 있을 것으로 예상하고 있다. 주요 타깃 시장은 고객의 실무 레벨에 맞는 거버넌스 관련 시장이다. 또한 지티원이 공급하는 솔루션을 묶어 공급하는 것도 다른 전략 중의 하나이다.

체인지마이너와 디큐마이너, AML 익스프레스, 메타 마이너를 통합해 구축한 사례로 한국매트라이프를 들 수 있다. 이들 제품을 통합한 고객사로 KTF도 들 수 있다.

한국IBM
InfoSphere, 포트폴리오로 공략

IBM은 최근 조직 내에서 분산된 정보로 인해 발생하는 다양한 과제를 효과적으로 다룰 수 있도록 하는 포트폴리오를 종합하여 발표했다. IBM은 어센셜 인수 후 정보통합 제품 Information Server에서 데이터 품질관리 기능을 제공하고 있다.

IBM에 따르면 InfoSphere라 불리는 IBM의 포트폴리오는 조직 내에 신뢰할만한 정보의 전달을 가속화함으로써 중대한 정보 중심의 프로젝트를 수행함에 있어서 고객의 가치를 높이고, 리스크를 경감하는 등의 다양한 혜택을 제공한다. InfoSphere는 신뢰할만한 정보의 전달을 통해 비즈니스 최적화를 구현하는 IBM의 정보관리 브랜드이다.

InfoSphere 포트폴리오 안에는 실시간 정보통합 환경을 위한 InfoSphere CDC, 실시간 정보통합을 위한 InfoSphere Information Server, 마스터데이터 관리를 위한 InfoSphere MDM, DW에 최적화된 솔루션으로 획기적인 성능과 유연성을 제공하는 InfoSphere Warehouse, 비즈니스 최적화를 위한 비즈니스 인텔리전스 및 성과관리 등이 포함되어 있다.

그 중에서 InfoSphere CDC의 특징은 ▲이기종 데이터베이스 실시간 복제 및 이중화(Disaster Recovery & High Availability) ▲ Changed Data Capture 등이다. 또한 로그 기반 CDC 기술을 적용하여 실운영 시스템과 DBMS 리소스에 거의 영향을 미치지 않는다. 그리고 재난복구(DR) 시스템을 저렴한 비용으로 구축하여 필수 비즈니스 애플리케이션이 연중무휴 운영되도록 지원한다. 경쟁사와의 차이점은 시스템 부하를 최소화하며 DB2, 오라클을 비롯한 모든 상용 DBMS를 지원한다는 것이다. 또한 비즈니스 관련 이벤트를 감지해 능동적인 의사결정을 내리도록 지원함으로써 고객 중심 서비스 강화와 능동적 비즈니스 대응이 가능하도록 한다.

InfoSphere는 정보통합솔루션
InfoSphere Information Server는 기업이 자사 시스템에 걸쳐 분산되어 있는 복잡하고 이질적인 정보를 새로운 방법으로 액세스 및 활용하여 혁신을 주도하고 운영 효율을 높이며 리스크를 낮춤으로써 많은 가치를 얻을 수 있도록 지원하는 정보통합솔루션이다.

IBM의 관계자는"InfoSphere Information Server는 가트너 Magic Quadrant의 데이터통합, 데이터품질관리, 전사 ETL 등의 영역에서 모두 최고등급인'리더'로 선정되었다"며"지난 10년 이상 국내에서 가장 많은 데이터 통합 프로젝트를 성공적으로 구현했다"고 강조했다. IBM은 성능과 기능, 연결성 및 SOA의 측면에서 유일하게 데이터 통합 시장을 정의하고 주도해 왔다는 게 그의 설명이다. 또한 Certified SAP 데이터통합 파트너로서 ERP 구현 기술을 빠르게 적용하고 ROI를 확보한다.

InfoSphere MDM은 기업의 핵심 데이터에 대한 처리 프로세스와 데이터를 통합, 단일화하여 신뢰할 수 있는 정보를 제공하며 실시간 데이터 품질관리 및 데이터 거버넌스를 완성시켜주는차세대 데이터 통합 솔루션이다. InfoSphere MDM 역시가트너 Magic Quadrant의 PIM(제품정보관리), CDI(고객정보통합) 및 정보통합 영역에서 모두 최고등급인'리더'로 선정되었다.

IBM은 이와 같은 결과가 입증한 바와 같이 타 경쟁사에 비해 가장 광범위한 마스터데이터관리 비전과 전략을 고객에게 제시한다고 밝혔다. 또한 InfoSphere MDM은 서로 다른 시스템의 마스터 데이터를 동기화하고 중앙 관리하는 유연하고 확장성 있는 허브 역할을 수행한다.

IBM의 관계자는"정보를 효과적으로 사용하는 기업은 경쟁사에 앞서고, 혁신을 이끌어 내는 동시에 이해 당사자의 가치를 창출할 수 있다"고 강조했다. 결국 효과적인 정보 통합은 주요 비즈니스 이니셔티브의 성공을 앞당길 수 있다는 것이다.

그는"통합 프로젝트 또는 광범위한 인프라 이니셔티브 모두 IBM의 데이터통합 및 품질 관련 솔루션을 통하여 가능하다"고 말했다. IBM솔루션을 통해 고객은 일관성 있는 높은 품질의 정보를 기업 전체에 전달하여 사용자에게 신뢰할 수 있는 정보를 제공하고 비즈니스와 IT가 서로 협업하여 전략적인 비즈니스 목표를 달성할 수 있다는 것이다.

데이터 품질관리는 선택이 아닌 필수
IBM은 오늘날 대부분의 비즈니스 환경은 조직 재편, 인수합병, 전술적인 차원의 잦은 프로젝트 수행 및 새로운 시스템 도입 등의 변화를 통해 성장해 왔으며 부서나 사업부 별로 자체적인 목적별 시스템을 구축하는 과정에서 새로운 데이터와 콘텐츠 소스가 지속적으로 기업 전반에 걸쳐 추가되고 있다고 강조했다. 이러한 다양한 정보 소스들은 종종 해당 정보를 가장 필요로 하는 사용자나 애플리케이션이 액세스하기 어려울 수 있다.

또한 일관성, 품질, 의미하는 바를 신뢰할 수 없게 됨으로써 사용하고자 하는 데이터의 가치에 의구심을 품을 수 있다는 것. 이러한 이유로 서로 다른 정보 소스를 신뢰성과 일관성이 높은 재사용 가능한 방법으로 통합하고 이용해야 하는 정보의 서비스화에 대한 필요성이 더욱 중요해지고 있다. 대부분의 기업은 필요한 정보를 이미 보유하고 있지만 필요한 정보를 적재적소에 이용할 수 있는 능력이 없다.

실제로 IBM CEO 설문조사에 따르면 60% 넘는 CEO들이 자사 조직이 정보를 활용하는 업무를 개선해야 할 필요가 있다고 답했다. 문제는 이러한 정보가 일반적으로 수많은 이질적인 시스템에 분산되어 있으므로 해당 정보를 전체적인 관점에서 이해할 수 없다는 것이다.

기업은 언제 어디서든 신뢰성이 높은 정보를 활용할 수 있도록 하는 포괄적이고도 유연한 전사 정보 아키텍처가 필요하다. 제공되는 정보는 액세스 가능하고 신뢰할만한 완전한 정보로 일관성을 가지고 시기 적절하게 제공될 뿐만 아니라 관리자가 해당 정보를 활용하여 최선의 의사 결정을 내릴 수 있어야 한다.

IBM은 데이터 통합 및 품질관리는 이제는 선택이 아닌 필수가 되어가고 있으며, 시장이 지속적으로 늘어날 것으로 예상하고 관련 시장을 공략하고 있다. IBM관계자는"정보통합 및 품질관리에 대한 기술과 특정 산업에 대한 경험과 지식을 결합하여 비즈니스 가치 향상을 극대화할 수 있는 InfoSphere 포트폴리오를 통하여 기업의 전사적 데이터 프레임워크를 제공할 것"이라고 강조했다. 주요 타깃 시장은 금융 및 제조 시장을 중심으로 통신시장에 이르기까지 광범위하다.

데이터통합과 품질관리는 최종적으로 기업의 정보와 인프라를 최대한 활용함으로써 비즈니스 가치를 배가하여 경쟁력을 확보하고 비즈니스 성과를 극대화하기 위한 광범위한 비전인 IBM의'스마트 정보 아젠다'의 주요 컴포넌트로 볼 수 있다. IBM은지속적인 투자를 통해 어떤 경쟁사도 제공할 수 없는 차별화 된 정보 활용 접근방안을 제시한다는 계획이다.

저작권자 © 컴퓨터월드 무단전재 및 재배포 금지