닐 고우(Neil Gow) 인포매티카 아태지역 세일즈 컨설팅 부사장


▲ 닐 고우 인포매티카 부사장



[아이티데일리] 가트너가 데이터 품질 툴 부문 매직 쿼드런트 보고서를 통해 리더로 평가하고 있는 인포매티카는 데이터 통합 및 데이터 품질을 위한 플랫폼을 지속적으로 혁신하고 있는 기업 중 하나다.

인포매티카가 지난달 2일 삼성동 코엑스 인터컨티넨탈 호텔에서 연례행사인 ‘2013 인포매티카 유저 컨퍼런스’를 개최했다. 이번 컨퍼런스는 많은 기업들이 직면하고 있는 빅데이터에 대한 고민 해결을 위한 취지로 개최된 만큼 관련 업계 관계자들의 관심을 불러일으켰다. 이번 행사를 위해 방한한 닐 고우(Neil Gow) 인포매티카 아태지역 세일즈 컨설팅 부사장은 연사로 나서 기업들이 가지고 있는 정보의 잠재력을 실현하여 경쟁력 우위를 확보할 수 있는 방안에 대해 설명하는 등 기업 내외부 전반에 걸쳐 분산되어 있는 빅데이터를 효과적으로 통합하고 활용하여 데이터의 잠재력을 발휘할 수 있는 방안을 제시했다.

IT시장 최대 화두인 빅데이터에 대해 데이터 통합 분야 전문 기업인 인포매티카 아태지역 세일즈 컨설팅 부사장인 닐 고우를 직접 만나 이야기를 들어봤다.

‘빅데이터’는 IT 시장의 최대 화두다. 빅데이터의 어떤 점이 매력인가?

대부분 고객이 빅데이터에 대해 열광하는 것은 원하는 목적이 있기 때문이다. 한마디로 빅데이터는 기업이 원하는 가치를 제공해줄 수 있는 잠재력이 있다고 전망되고 있다. 이에 많은 고객사는 데이터를 이해하고 활용해서 다른 경쟁사와 차별하기 위한 운영의 수단으로 활용하고 싶어한다.

이 과정에서 기업들이 빅데이터를 대하는 태도는 크게 두 분류로 나눌 수 있다. 빅데이터를 적극적으로 수용하는 쪽과 빅데이터를 어쩔 수 없이 수용하는 수동적인 쪽이다. 결국 기업들은 데이터 관리를 통해 운영 효율을 높여야 하는 빅데이터 고민에서 자유로울 수 없다.

빅데이터라고 하면 일반적으로 3V의 특성을 지니고 있다고 언급한다. 용량이 크거나 많고(volume), 정형과 비정형 등 데이터 형태가 다양하며(variety), 유통속도가 매우 빠르다(velocity)는 특징을 가지고 있다. 인포매티카는 3V에 또 하나의 V인 ‘가치(value)’를 추가한다.

기업들은 빅데이터를 위해 막대한 자원을 투자할 수밖에 없으며 이런 투자를 통해 큰 가치를 도출해야 한다는 것이다. 인포매티카는 이런 기업들이 가치를 극대화할 수 있도록 지원할 수 있는 독특한 입지에 있는 기업이라 할 수 있다.

최근 빅데이터 이슈를 살펴보면, ‘하둡’, ‘R’, ‘분석’, ‘데이터과학자’ 등으로 점철되어 있다. 어떤 점에 대해 주목해야 하는가?

많은 기업들이 빅데이터 관련해 가치를 도출하기 위해 분석 툴과 인력 그리고 데이터 추출에 많은 중점을 둔다.

빅데이터 프로젝트가 성공하기 위해서는 간과하면 안 되는 중요한 요소가 있다.

첫 번째, 기술을 보유한 인력이다. 빅데이터 기술을 활용하기 위해서는 특정한 기술과 인력이 필요하다. 그러나 이런 기술을 가진 인물은 한정되어 있다. 제대로 된 기술을 보유한 적임자는 찾기 어렵고 막상 채용하려니 몸값이 비싸다.

두 번째, 좋은 분석을 위해서는 데이터 자체 질이 좋아야 한다. 데이터 품질에 대한 이슈는 많은 기업들이 간과하고 있다가 프로젝트가 시작된 후 뒤늦게 깨닫게 되는 요소다. 실제 인포매티카가 파악해 본 결과 빅데이터 프로젝트 전체 소요 기간 중 80%가 데이터 품질 향상을 위해 소비되는 만큼 중요한 요소다.

즉, 빅데이터가 분석에 초점이 맞춰져 있긴 하지만 이것은 빙산의 일각이며, 데이터 품질이 전체 프로젝트의 성공 여부를 가릴 수 있는 중요한 요소라는 것이다.

바로 이런 점 때문이라도 인포매티카가 독특하고 고유한 입지에 있다고 할 수 있는 것이다.

인포매티카의 핵심 능력은 데이터의 다양성과 속도를 관리한다는 점에 있다. 하나의 플랫폼으로 트랜잭션은 물론 웹로그, CDR 등 머신데이터, 트위터, 페이스북 등에서 파생되는 데이터를 지원하며, 이 데이터를 엑세스해서 변환시키고 분석 환경으로 넘겨준다. 이는 품질에 많은 시간을 할애해야 하는 빅데이터 프로젝트에서 인포매티카가 분석에 좀 더 집중할 수 있도록 도움을 제공해 줄 수 있다는 이점을 가지고 있다.

인포매티카는 품질을 위한 준비 작업에 큰 이점을 줄뿐 아니라 빅데이터 프로젝트 성공의 핵심 요소인 빅데이터 기술을 가지고 있는 인력 확보에도 도움을 준다.

기본적으로 빅데이터 기술을 보유한 인력은 하둡 개발자를 구하는 게 일반적인데 이는 인력 확보가 어렵고 비용이 많이 든다는 단점이 있다. 이를 인포매티카 파워센터를 통해서 해결할 수 있다. 제품의 아키텍처 때문에 파워센터를 이용하는 개발자들은 하둡 개발자와 동일한 선상에 능력을 발휘한다. 다시 말하자면 인포매티카가 보유한 파워센터의 기술을 통해 데이터 품질을 높여 분석 환경으로 넘겨줄 수 있는 작업이 가능하기 때문에 이런 인력 희소성에 대한 요구를 최소화할 수 있다.

인포매티카는 데이터 통합 기술력을 가지고 있는 것으로 알려져 있다. 빅데이터 시대에 인포매티카는 어떤 가치를 제공할 수 있는가?

빅데이터 이슈는 정형데이터보다 비정형데이터에 집중되어 있다. 최근에 개발한 기술을 살펴보면 비정형데이터에 대한 처리에 대한 기술들이 쏟아지는 것도 이를 증명하고 있다.

인포매티카는 이런 비정형 데이터의 중요성이 높아진 빅데이터 시대가 도래하기 전에 비정형데이터의 중요성을 미리 간파하고 먼저 개발을 시작한 선도적 위치에 있다.

실제 B2B 트랜잭션이 정형데이터만으로 이뤄진 것만 아니라 엑셀과 PDF 등으로 이뤄졌고, 산업별로 특정 표준화된 포맷이 있다. 이 모든 데이터가 모두 정형데이터는 아니라는 것이다. 이런 점에서 인포매티카는 데이터 통합 리더 업체라는 위치 상 정형데이터 뿐만 아니라 반정형과 비정형 데이터에 대한 준비를 미리 할 수 있었다.

‘인포매티카 에이치파서(HParser)’는 10년 전에 개발된 제품으로 빅데이터 시대 맞춰 HDFS에 존재하는 비정형 데이터 파일을 정형화된 형식으로 파싱하는 제품으로 재탄생했다. 에이치파서가 가진 비정형 처리 기능은 2~3년 전 스프레드시트를 정형데이터로 변환시키거나, CDR 및 바이럴데이터를 정형데이터로 변환시키는 등 이미 준비가 되어 있는 상태였다.

이렇듯 인포매티카가 타 경쟁사와 대비해 가지는 강점은 크게 4가지로 말할 수 있다. 첫 번째 포괄적인 범위의 솔루션을 보유하고 있다. DA, DQ, 라이프사이클, 매니지먼트, 울트라메시징 등 광범위한 영역에 대한 기능을 제공한다.

두 번째 강점은 통합에 있다. 인포매티카는 가상 데이터 머신인 ‘인포매티카 바이브(Vibe)’를 통해 유형, 소스, 볼륨, 컴퓨팅 플랫폼 또는 사용자에 관계없이 재코딩하지 않고 데이터에 액
세스해 데이터를 집계 및 관리할 수 있는 기능을 제공한다. 이 기능을 통해 통합에 대한 시간 단축으로 전체 프로젝트 시간을 감축시킬 수 있다.

세 번째는 개방성이다. 특정 벤더에 종속되지 않고 중립적이라는 장점을 지니고 있다. 제품 사용 시 미들웨어나 데이터베이스 등을 선택하는 것이 아니라 고객이 어떤 환경을 가지고 있던 고객 환경에 맞춰 구동될 수 있도록 해준다. 이는 특정 벤더들이 특정 환경에 최적화된 솔루션을 가지고 있는 것과 비교하면 유연성을 가지고 있다. 기술 선택에 있어 제약이 없다는 장점이 있다.

마지막으로 네 번째는 경제성을 들 수 있다. 인포매티카의 제품은 비교적 쉽게 배울 수 있다. 파트너와 고객이 단기간 내 배울 수 있기 때문에 경제성을 가진다는 것이다.

 

저작권자 © 컴퓨터월드 무단전재 및 재배포 금지