실시간기업을 위한 EDW 및 분석 솔루션 컨퍼런스 개최
'차세대를 위한 데이터 한계를 극복하기 위한 '익스트림 데이터 웨어하우징' 제시

한국NCR테라데이타는 지난달 8일 서울 삼성동 코엑스 인터컨티넨탈 호텔에서 '테라데이타 유니버스 2005'를 개최했다. 이날 행사에서 한국NCR은 2005년 최대 이슈로 떠오르고 있는 실시간기업(Real-time Enterprise)을 위한 엔터프라이즈 데이터웨어하우스(EDW)와 공급망인텔리전스(SCI), 수요망관리(DCM), 고객관계관리(CRM) 등의 분석 솔루션 및 관련 전략과 사례 등을 소개했다.
김달 기자 kt@infotech.co.kr

한국NCR 테라데이타는 지난달 8일 '테라데이타 유니버스 2005'를 개최, 차세대를 위한 데이터 한계를 극복하기 위해 '익스트림 데이터 웨어하우징'을 주제로 실시간기업을 구현한 액티브 EDW 전략과 CRM, SCI, DCM을 포함한 데이터웨어하우스 기반의 분석 솔루션을 고객 활용 사례와 함께 소개했다.
이날 가장 관심을 끌었던 것은 새로 등장한 '익스트림 데이터 웨어하우징(eXtreme Data Warehousing)' 개념으로, 데이터의 모든 한계를 극복한 차세대 엔터프라이즈 데이터 웨어하우징을 뜻한다. 이와 관련해 이날 컨퍼런스의 기조연설자로 나선 스티븐 브롭스트 테라데이타 CTO는 "최근 대형 금융사 통합, 인터넷 및 모바일 사용 증가, RFID의 등장으로 인해 금융과 유통, 통신 등 기업들이 감당해야 할 데이터가 폭발적으로 늘어나고 있다"면서 "실시간 의사결정을 해야 하는 요즘, 이러한 한계를 극복할 수 있는 개념의 새로운 EDW인 익스트림 데이터 웨어하우징을 선보이게 되었다"고 배경을 설명했다.
아태지역을 총괄하고 있는 피터 핸드 부사장의 오프닝으로 시작된 이날 컨퍼런스는 오전에 데이터 웨어하우징 전문가인 스티븐 브롭스트 테라데이타 CTO와 볼더 테크놀로지의 리차드 해커손 사장이 '익스트림 데이터 웨어하우징의 미래'라는 공통주제로 기조연설을 진행했다. 오후에는 사례와 솔루션, 테크놀로지 등 4개 세션으로 나뉘어 20개 트랙이 진행됐는데 영국 테스코를 비롯해, 뱅크 오브 아메리카, AT&T, 벡터 SCM, JC 페니, 메드코 헬스, 우리은행, 포드자동차, 현대해상, 롯데백화점 등의 구축사례와 테라데이타와 SAP 통합, RTE를 위한 데이터 웨어하우스 구축 등을 주제로 한 트랙이 진행돼 인기를 끌었다.
한편, 이날 행사에서 한국NCR은 테라데이타 웨어하우스 8.0과 서버 5400 등 신제품도 함께 발표했다.

테라데이타 웨어하우스 8.0과 5400서버도 선보여
성능면에서 많이 향상된 테라데이타 웨어하우스 8.0은 LDAP(경량 디렉토리 액세스 프로토콜)을 사용해서 쉽게 기업의 MS 윈도우즈 액티브 디렉토리 서비스 인프라와 쉽게 통합할 수 있게 됐으며, BEA 웹로직과 통합으로 보다 안전하고 고성능의 운영 CRM 시스템을 구축할 수 있게 됐다.
테라데이타의 NCR 5400서버는 4.2 페타바이트 규모로 확장될 수 있는 서버로, 테라데이타 웨어하우스의 성능을 20% 개선하는 것은 물론, 고객의 사업 규모 확장에 맞춰, 애플리케이션, 데이터베이스 혹은 툴, 혹은 유틸리티를 재구축하지 않아도 단일 서버에서 수 백 개의 서버로 확장되도록 설계되었다. 5400 서버는 또 캐비닛의 밑넓이가 40% 이상 작아져 데이터센터 플로어의 사용을 최적화하고 10노드 이상 혹은 이전 캐비닛에 맞춰 4노드 이상 개선된 처리 장치들을 지원할 수 있다. 이외에도 하이퍼 스레딩 기술을 갖춘 듀얼 인텔 제온(Dual Intel Xeon) EM64T 3.6GHz 프로세서 기술을 활용해, 32비트와 64비트 솔루션을 모두 지원한다.
한편, 한국NCR 테라데이타의 경동근 사장은 "지난해에는 국내 경기 침체 등의 이유로 매출 목표를 달성하지는 못했지만 올 들어 금융과 제조, 유통 등의 시장에서 데이터웨어하우스 업그레이드 수요가 늘고 있는 만큼 전년대비 100% 성장한 매출을 올릴 것"이라며 매출 중 절반은 금융권에서 확보할 것이라고 밝혔다.

스티븐 브롭스트 NCR테라데이타 CTO
익스트림 데이터 웨어하우징(X-DW)의 미래
이 글은 지난달 8일 개최된 테라데이타 유니버스 2005에 참석하기 위해 방한한 NCR테라데이타의 스티븐 브롭스트 CTO가 기조연설을 통해 발표한 내용을 정리한 것이다. 스티븐 브롭스트 CTO는 이날 기조연설에서 "향후 2년 동안 의사결정지원 데이터의 양이 현재 수준의 네 배가 될 것이며, 이는 4만년 인류 역사에서 생성된 데이터의 양보다도 많은 양"이라면 "이 시점에서 주의해야 할 것은 데이터(data)와 정보(information)를 혼동하지 않는 것"이라고 말했다. 그는 이어 미래의 데이터 웨어하우징 전략으로 X-DW를 제시했다.<편집자>

향후 수 세대동안 데이터 웨어하우징 산업에 어떠한 변화가 일어날 것인지를 고심하던 중 X-DW를 출시하게 되었다. 현 수준의 시스템에 비해 확장성 및 서비스 수준에 대한 요구사항(SLR: Service Level Requirements)이 10배나 높은 데이터 웨어하우스를 기업들이 구축하기 시작한다면 어떠한 변화가 일어날 것인가?
수백만 명의 유저들이 페타바이트급의 데이터에 접근하며, 이 때 의사결정에 대한 응답시간이 밀리초 단위로 측정된다고 상상해보라. 비즈니스에 관련된 사건들을 즉각적으로 파악하는 능력이 필요하게 될 것이다. 또한 데이터는 최대 수준으로 통합됨으로써 지식 근로자들은 모든 대내외 사업상 관계를 파악함으로써 데이터 웨어하우스를 활용, 의사결정을 할 수 있게 될 것이다. 또한 오늘날 데이터 웨어하우스에서 수집되는 데이터는 향후 수 세대동안 수 배로 세분화 될 것이다.
X-DW는 앞으로 많은 기술적, 사회적 이슈들을 야기하게 될 것이다. X-DW 구현과 관련된 기술적인 문제들은 미래 기술발달로 해결할 수 있을 것이다. 그러나 더욱 다루기 힘든 문제들은 사회적 이슈이다.

더 크게, 더 빠르게, 더 새롭게
혹자가 무어의 법칙에 따라 데이터 웨어하우스와 관련한 비즈니스 요구 사항들을 충족시키게 되고 인 메모리(In-Memory) 데이터베이스가 상용화될 것이라고 예상했을 때가 있었다.
당시 우리는 그 말을 믿지 않았던 것이 사실이다.
정보에 대한 요구는 끝이 보이지 않는다. 데이터 저장 비용은 계속해서 감소하는 반면 정보의 가치는 계속 상승하고 있기 때문에 데이터 웨어하우스에서 증가하는 정보를 활용해야 하게 되었다. 이러한 정보에 대한 요구는 무어의 법칙에 따른 메모리칩의 능력으로도 충족시키기가 어려우며, 데이터 저장을 위해 더욱더 고밀도화 된 디스크 드라이브가 필요할 것으로 예상된다. 향후 2년 동안, 의사결정지원 데이터의 양이 현재 수준의 네 배가 될 것으로 예상된다. 이는 40,000년 동안 생성된 데이터의 양보다도 많은 양이다. 그러나 이 시점에서 데이터(data)와 정보(information)를 혼동해서는 안 된다.
정보창출보다 데이터수집이 훨씬 간단한 과정이다. 데이터에서 정보를 창출하기 위해서는 데이터 통합, 정제, 데이터 접근의 과정을 거쳐야 한다. 대규모 기업에 정보를 전달하는 것을 가능케 하는 컴퓨팅 파워는 그 수준이 엄청나며, 앞으로도 계속해서 강력해질 것이다.
다행히 기술 발달이 위와 같은 변화를 용이하게 할 것이다. 고도병렬처리(MPP: Massively Parallel Processing)은 블레이드 기술의 덕택으로 더욱더 고도화할 것이다. 이 고밀도 컴퓨팅 기술은 카드 형태의 서버로 출시되고 있으며, 각각의 블레이드에는 프로세서, 메모리, 입출력 기능이 집약되어 있다.
오늘날의 구현 기술을 이용할 때 블레이드 서버의 입출력 대역폭이 하이엔드의 데이터 웨어하우스 작업 로드에는 충분치 못하지만 기술의 발달로 이러한 종류의 컴퓨팅 파워가 향후 2,3년 동안 크게 늘어나게 될 것이다. 머지않아 상용화된 블레이드를 활용, 테라바이트급 메모리를 보유한 CPU를 대량으로 양산해 새로운 데이터 웨어하우징을 구현할 수 있게 될 것이다. 그리드 컴퓨팅을 기본으로 사용하며, 오늘날의 구현 기술보다 더욱더 발달된 기술을 활용하게 되면, 가상화를 실현할 때 컴퓨팅, 메모리, 입출력 및 스토리지 관리 비용이 크게 절감될 것이다.

BI는 실시간기업의 중추적 역할
기업의 데이터 웨어하우징 활용 능력은 기업 상아탑 내 지식 근로자들의 수준을 넘어서게 되었다. 액티브 데이터 웨어하우징(Active Data Warehousing)으로 인해 기업 일선의 인력 및 소프트웨어 에이전트가 전술적 의사결정 지원을 위해 데이터 분석 서비스에 접근할 수 있게 되었다.
이러한 전술적 의사결정 능력은 정보에 대한 보다 용이한 접근성을 바탕으로 보다 효율적인 사업전략실행을 가능하게 하므로, 기존의 데이터 웨어하우징 활용을 보충하는 역할을 한다. 또한 협력업체 및 고객과 기업을 더욱더 밀접하게 통합시키는 가상 기업의 개념이 발달하고 있는 기업 구조에서 기존 기업의 영역을 벗어난 효과적 정보 공유의 필요성이 늘어나고 있다.
데이터웨어하우스의 전술적 의사결정 작업 로드가 등장하게 됨에 따라 데이터 신선도(data freshness) 부문의 좀 더 강력한 서비스 레벨이 요구되게 되었다. '실시간' 데이터 웨어하우징으로 알려진 현상이 이러한 추세의 단면을 보여준다. 비즈니스 인텔리전스(BI)는 실시간 기업의 의사결정을 단순히 빠르게 이루어지게 할 뿐 아니라 정보를 충분히 활용하여 이루어지게 한다는 점에서 실시간기업에 중추적 역할을 한다. 가트너는 2006년까지 실시간 기업을 구현하지 못하는 기업은 시장에서 주도적인 자리를 유지하기 힘들 것이라고 예상한 바 있다.
실시간 기업을 추구할 때, 데이터 웨어하우스는 거의 실시간으로 정보를 수집, 전달할 수 있어야 한다. 신속한 수집과 전달이 중요한 데이터를 데이터 웨어하우스에 수집할 때, 기업 애플리케이션 통합(EAI) 인프라를 이용한 메시지 기반의 데이터 수집 방법은 배치(batch) 기반의 파일 프로세싱으로 빠르게 대체되고 있다.
엔터프라이즈 데이터 웨어하우징은 전 세계적으로 일어나고 있는 추세이다. 기업들이 세계화를 추구해 나감에 따라 정보에 대한 요구는 국경을 넘어서고 있다.
제품이나 서비스의 가치사슬, 즉 원자재, 제조, 유통, 소비, 처분에 이르기까지 모든 정보가 필요하기 때문에 데이터 웨어하우징은 전세계적으로 실현되고 있다. 델, 보다폰, 3M, 월마트, DHL을 위시한 많은 기업들이 그들의 전세계적 데이터 웨어하우스로부터 데이터를 수집하고 전달하는 데 힘을 쏟고 있다.

X-DW를 이용한 정보 활용 사례
X-DW의 출현으로 정보 활용은 어떠한 변화를 맞게 될 것인가? 미래에 일어날 수 있는 변화를 사례별로 살펴보자.

■ 소매부문의 사례
오늘날 소매 부문의 데이터 웨어하우스는 시장바구니(Market Basket) 분석에 쓰이는 상세 정보로 이루어져 있다. 상점들은 개별 시장바구니 속의 물품 종류, 가격, 비용, 쿠폰, 지불되는 화폐의 종류, 계산 시간, 계산대에 이르기까지의 정보를 수집하게 된다. 이러한 세세한 정보의 수집은 새로운 현상이 아니다.
새로운 것이 있다면, 오늘날의 고도로 세분화된 데이터는 모든 쇼핑 과정을 포함한다는 사실이다. 물론, 위의 시장바구니 분석 정보들도 그대로 수집이 되며, 이에 덧붙여 장바구니에 담기는 물품들의 순서와 고객이 물품을 장바구니에 넣는 각각의 시간까지도 기록이 된다.
고객이 쇼핑하며 상점내에서 이동하는 경로도 기록될 수 있다. 이러한 정보를 수집함으로써 상점주인, 매장 매니저 및 제조업체에서도 소비자의 구매 행태를 좀 더 잘 파악할 수 있으며, 고객을 좀 더 자세히 세분화할 수 있게 된다.
RFID 기술은 각각의 물품이 진열대를 떠나 쇼핑 카트에 담기고 계산대를 지날 때까지 추적하게 된다. 또한 같은 기술을 활용, 쇼핑 카트가 상점 내에서 움직이는 경로도 파악할 수 있다. 고객이 계산대를 지날 때 기존의 시장바구니 분석 데이터에 RFID 정보가 추가로 더해짐으로써 향후 데이터 웨어하우스 분석에 활용되게 된다. 좀 더 나아가, 소매 데이터 웨어하우징에서는 고객의 쇼핑 과정 모두가 정형화된 데이터와 함께 비디오에 포착될 수 있다. 고객의 표정들을 분석함으로써 신상품이나 가격변동에 대한 고객의 반응을 살필 수 있는 것이다.
보안상의 이유로 비디오카메라 감시는 대부분의 소매점에서 이루어지고 있지만, 쇼핑과정 전반에 대한 정보를 습득하기 위해서는 비디오를 더 광범위하게 활용해야 한다. 디지털 이미지를 대조함으로써 대상 개인을 추적하거나, 더 나아가 안면 인식 기술을 통해 상점을 찾는 고객이 이전에 상점을 방문했는지의 여부를 알 수 있는 기술이 이미 개발되었다. 실제로 동 기술은 보안상의 이유로 많은 공항에서 쓰이고 있다.
여기에서 문제가 되는 것이 프라이버시이다. 물품이 상점을 떠나는 순간 RFID 추적이 끊긴다는 것이 관련 업체의 일반적인 설명이며, 대부분의 소비자들도 상점 내에서 비디오카메라를 이용한 감시가 보안상 이유 때문이라는 것을 알고 있다. 하지만 추적 기술이 소비자 패턴을 분석하기 위해 사용된다면, 이는 용인될 수 있는 일일까? 고객 분석의 측면에서 이러한 정보는 매우 유용하겠지만 소비 행태에 좀 더 효율적으로 영향을 주기 위한 목적으로 구매활동 전반이 감시당하고 분석된다면 거부감을 느끼는 사람들도 있을 것이다.
가격 책정과 홍보 측면에서의 시사점도 생각해볼 수 있다. 머지않아, 기업들은 진열대에 부착되는 전자 라벨을 활용함으로써 데이터 웨어하우징 분석을 통해 판매시점(POS)에 기기를 이용, 진열대에 있던 물품의 판매를 책정함으로써 자동적으로 할인 가격을 제시할 수 있게 된다. X-DW를 통해 미래에는 좀 더 효율적인 가격책정과 홍보활동을 개별 고객에 맞게 제공하게 될 것이다.
단골 고객으로 등록되는 고객들은 상점 내에서 PDA와 같이 손에 드는 기기를 활용, 맞춤 서비스를 제공받을 수 있게 될 것이다. 데이터 웨어하우스 분석을 통해 개별 고객에 따라 차별화 된 가격책정이 가능해지는 것이다. 이러한 가격책정 전략은 타상품과 연계한 교차판매(cross-sell)나 수익성 높은 상품을 판매하는 상승판매(up-sell), 고객 충성도에 영향을 미칠 수 있을 것이다. 이렇게 개개인의 고객을 고려한 가격책정 방식이 활용된다면, 기존의 비효율적이었던 쿠폰도 더 이상 쓸 필요가 없게 된다.
물론 고객들이 가격 책정 시 혜택을 받기 위해서는 자신의 프라이버시를 어느 정도 희생해야 하는 것이 사실이다. 또한 차별화 된 가격 책정은 혜택을 받지 못하는 고객들에 대한 공평성 시비도 일으킬 수 있다. 이러한 문제들은 이미 상점들이 단골고객에게 혜택을 제시하면서 불거져 왔지만, 자동화된 차별 가격 책정이 널리 활용된다면 동 문제는 더욱 가시화될 것이다.

■ 보건부문의 사례
치료, 처방전, 치료 결과, 환자의 반응 등에 대한 모든 의료기록이 통합되는 경우, 좀 더 효율적으로 보건 서비스를 제공하는 것이 가능해진다. 기존의 부호화된 형식의 정형 데이터 수집뿐만 아니라 X-레이 및 컴퓨터 단층촬영 등의 비정형 데이터도 X-DW에 통합될 수 있다. 개별 환자의 의료기록을 수집하는 것도 혜택을 가져오겠지만, 그들의 DNA 암호 및 가계의 병력을 수집할 수 있다면, 더 큰 효과를 볼 수 있을 것이다. 이러한 심층 정보를 통해 환자가 특정 질병에 소인이 있는지의 여부를 더욱더 잘 파악하여, 효율적인 의료검진 및 조기 치료가 가능해 진다. 충분한 정보를 활용함으로써 보건 서비스가 좀 더 효율적으로 제공될 것이다.
환자가 직접 사용하는 의료 진단 기기가 이미 출시되어 고혈압 및 당뇨를 포함한 여러 질병을 진단하는 데 쓰이고 있다. 이러한 기기로부터 무선으로 혹은 유선전화를 통해 정보를 수집하는 것도 현재 기술로 가능한 수준이다. 환자가 가정에서 의료 진단 기기를 사용한 후 그 진단 결과가 데이터 웨어하우스로 향할 뿐 아니라 병원내 데이터 수집에도 활용된다.
효율적인 관찰을 통해 계속적으로 실시간에 가깝게 데이터를 수집하는 경우, 좀 더 적극적인 의료서비스 제공이 가능하다. 최신의 데이터와 이전의 병력을 통합함으로써 환자를 조기진단하고 치료할 가능성이 열리게 된다. 건강상 변화가 일어날 때 데이터 마이닝과 여타 정보 분석 활동을 통하여 이러한 변화를 밝혀내고 이에 따른 조치를 취할 수 있게 되는 것이다.
보건 정보에 대한 국제적 접근성도 점점 더 중요해지고 있다. 사회가 모바일화 됨에 따라 환자들이 일차적으로 진료를 받은 후 다른 곳에서도 진료를 받게 될 가능성이 크게 높아진 것이다. 타 도시나 국가의 의사가 환자를 진단해야 할 경우, 처음부터 의료 기록을 작성하거나 이전의 병력을 알지 못하는 것보다, 이미 구축된 병력 데이터베이스에 접근할 수 있다면 큰 혜택을 보게 될 것이다.
데이터 웨어하우스에서 정보를 활용함으로써 의료 서비스 제공을 용이하게 하려는 경우 고도의 데이터 품질 관리가 필요하게 된다. 데이터의 질을 엄격하게 관리하고 데이터 웨어하우스 내 정보의 정확성을 보장하는 것이 필요해진다.
정보접근 권한에 대한 문제도 고려해 보아야 한다. 의료 기록 정보에 대한 접근 권한을 환자 자신이 정해야 하는가? 정보 접근자는 얼마나 많은 권한을 가지게 되는가? 환자가 이를 결정할 권한이 있는가? 이러한 데이터 웨어하우스 구축비용은 누가 감당하게 되는가, 정부기관이 감당할 것인가, 의료 보험업자, 혹은 보건 서비스 제공자가 감당하게 되는가? 프라이버시 문제의 해결 방안은 무엇인가? 그러한 방안의 실행은 어떻게 감독할 것인가?
보건 서비스 관련 데이터 관리라는 민감한 사안은 많은 사회적 이슈를 야기한다.

■ 자동차 보험 부문의 사례
리스크를 좀 더 잘 이해하고 평가하는 것이 보험회사의 주요 업무이다. 개인의 운전습관에 대한 정보가 충분하지 못한 경우, 독립검증 데이터를 활용한 보험 통계로 리스크가 평가된다. 보험료 책정은 차량 타입(엔진 사이즈, 색, 모델 등), 차량이 이용되는 지역, 운전자의 정보(나이, 성별, 학력, 흡연 여부 등)를 고려하여 이루어진다. 개인이 사고 기록이나 과속 딱지를 뗀 기록 등을 축적해 나감에 따라, 이를 바탕으로 리스크가 측정된다.
위의 정보들을 활용해 비슷한 특징을 가진 개인으로 구성된 동질집단(peer group)의 통계치를 바탕으로 개별 운전자의 리스크를 측정하게 된다. 그러나 이 경우 동질집단 내 리스크가 낮은 운전자들이 실제로 리스크가 높은 운전자들과의 차이를 통계치에서 상쇄시키게 된다. 즉 빨간색 스포츠카를 모는 18세 청소년들이 대부분 부주의하긴 하지만, 그들 모두가 그렇지는 않다는 말이다. 동질집단내 개개인의 운전 습관을 좀 더 잘 파악하게 된다면, 더욱 정확한 리스크 측정이 가능하다.
X-DW를 사용하여 이러한 문제를 해결하는 경우, 개개인의 운전습관을 관찰함으로써 좀 더 현실적인 보험료 책정을 가능하게 해준다. 실제 운전 습관을 위성을 통해 관찰, 데이터가 수집된다.
이를 위해, 운전자가 운전석에 앉을 때 신원이 확인되어야 한다. 이후의 운전습관이 운전 중 기록되게 된다. 제한 속도를 어기거나 차선을 자주 바꾸는 운전자들은 그렇지 않은 운전자들보다 더 높은 보험료를 지불하게 된다. 데이터 웨어하우스를 이용함으로써 위의 관찰을 통해 수집된 방대한 양의 데이터를 분석하고 개개인의 보험료 수준을 제시할 수 있다.
운전 습관 관찰 여부는 고객이 선택할 수 있는 문제이지만, 관찰을 거부하는 고객은 좀 더 리스크가 높은 운전자로 간주되어 더 높은 보험료를 지불하게 될 것이다. X-DW를 이용하는 것은 리스크가 높은 운전자들이 실제로 리스크가 낮은 운전자들의 덕을 보는 것을 제한함으로써 좀 더 공정한 보험료를 책정하기 위함이다.
문제는 위의 접근방식이 프라이버시 침해 가능성을 야기한다는 점이다. 정보 사용을 어느 정도까지 허용해야 하는 것인가? 법집행 기관들도 위의 정보에 접근할 수 있어야 하는가? 십대 운전자의 부모는 정보에 접근할 수 있어야 하는가? 물론 운전 습관들이 외부기기에 의해 관찰되는 많은 예가 존재하지만(런던 도심에서 혼잡세를 내는 운전자들의 예를 들 수 있다), 미래에는 한 단계 높은 수준의 관찰이 이루어질 것이다.

해결해야 할 까다로운 이슈들
위의 X-DW 사례들은 적절한 서비스 수준의 지표 및 한 단계 높은 데이터 수준을 요구하게 된다. 그러나 이런 기술을 활용할 때 문제가 되는 것은 기술이 아니라 기업, 정치, 법, 윤리적 측면에서의 난제들이다.
리차드 메이슨(Richard Mason)은 이러한 문제를 간결하게 설명했다. 그는 IT 윤리의 기본틀을 처음으로 제안한 인물이며, 그의 기준이 거의 20년 동안 활용되어 왔다. 메이슨은 IT 윤리 범주를 다음과 같이 구분하였다.

● 프라이버시: 신원확인 및 비밀보장
● 정확성: 데이터 품질 및 신뢰성
● 정보의 소유: 소유권 및 관리
● 접근성: 정보 보유자와 비보유자

이름, 거주지, 재정상태, 건강상태 등의 개인적 정보를 배포하는 것에 관련된 문제가 프라이버시이다. 인터넷을 통해 마우스 클릭 한 번으로 개인 정보가 전세계로 유통될 수 있으며, X-DW를 실행할 경우 이러한 정보의 분석도 매우 용이해질 것이다.
프라이버시 문제는 데이터 웨어하우징과 데이터 마이닝이 보안 애플리케이션에서 점점 더 많이 사용됨에 따라 가시화되었다. 기술 및 프라이버시 고문 위원회(TAPAC: Technology and Privacy Advisory Committee)와 같은 그룹에서는 고객신원 정보의 익명성을 요구하는 데이터 분석 및 데이터 마이닝의 접근방식을 제안하고 있다. 여러 국가에서 입법자 및 프라이버시 옹호 집단들이 프라이버시와 알 권리 간의 균형을 맞추고자 고심하고 있는 것은 분명하다.
대규모 데이터 웨어하우스 정보의 정확성을 유지하는 데에는 많은 비용이 든다. 각각의 데이터 필드의 정확성에 대해 책임을 지는 것은 중대한 문제이다. 또한 상이한 데이터 소스를 통합할 때의 정확성 및 통합된 데이터 분석의 정확성도 중요하다.
그러나 이와 같은 문제들은 데이터 웨어하우스 구축시 충분한 관심을 받지 못하고 있다. 또한 데이터의 정확성에 대한 법적, 윤리적 책임이 제대로 규명되지 못하고 있다. 부정확한 데이터로 피해가 야기되는 경우, 책임 소재를 밝히기가 어려운 경우가 많다.
세 번째 범주, 정보의 소유라 함은 정보를 소유물로 보는 전제에서 시작한다. 그렇다면 데이터 관련 비용은 누가 지불해야 하며 누가 데이터를 관리해야 하는지의 의문이 제기된다. 개인의 모든 행태가 무선 데이터 정보로 기록될 수 있는 현대 사회에서 상표권, 저작권 및 특허권과 같은 기존의 지적 재산권들이 제대로 보호 받지 못하고 있다. 세계적으로 구축되고 데이터 소싱에 활용되는 X-DW가 실현될 때, 정보의 수집 및 활용은 각 국가의 정부 및 규제 기관들의 상이한 법 및 규제의 제약을 받을 수 있다. 기업이 국경을 초월해 특정 목적에 활용하기 위한 특정 정보를 수집, 유지, 사용할 수 있는 권리 및 책임이 있는지를 결정하는 것도 어려운 일이다.
정보 접근성이라 함은 목적에 따라 정보를 이용할 수 있는 권한을 말한다. 정보는 곧 힘이다. 그렇기 때문에 정보에 대한 접근성을 부여하는 것은 힘을 배분해주는 것과 같다. 정보에 대한 접근 권한도 중요한 문제이지만, 정보를 이해하고 관리할 수 있는 능력, 이러한 이해를 가능하게 할 도구들도 중요한 요소들이다. 정보를 가진 자와 가지지 못한 자들이 존재하는 정보격차의 세상은 X-DW가 실현될 경우 비즈니스 인텔리전스를 가진 자와 그렇지 못한 자로 나뉘는 세상이 될 지도 모른다. X-DW가 세계적으로 활용된다면, 데이터는 분석되지 않는 한 그 가치를 유지하지 못할 것이다.
X-DW가 던지는 약속은 희망차지만, X-DW를 둘러싼 난제에 대해 논란이 존재하는 것도 사실이다. 데이터 웨어하우징 서비스를 제공하는 기업으로서, 우리는 충분한 정보를 활용하여, 더 나은 결과를 위해 창조적이고 광범위한 해결책을 추구해야 할 것이다.
저작권자 © 컴퓨터월드 무단전재 및 재배포 금지