SAP 'HANA'

SAP HANA는 다양한 기간계 시스템에서 발생하는 비즈니스 트랜잭션 데이터를 발생 시점에 실시간으로 복제하고 요약정보를 구성해 제공하는 전통적인 데이터웨어하우스(DW) 솔루션 방식에서 벗어나 수십TB의 대용량 상세 데이터를 기초로 가상의 비즈니스 마트를 인메모리에 구성, 실시간에 가깝게 원하는 비즈니스 관점으로 제공한다. 이와 같은 실시간은 메모리에 모든 데이터를 저장하는 인메모리 컴퓨팅 기술을 기반으로 했기 때문에 가능하다. 더욱이 메모리 가격이 계속하락하면서 메모리와 디스크의 가격차이가 줄어들고 있으며, 디스크와 비교해 획기적으로 빠른 속도 등 부가가치가 커지는 것을 고려하면 앞으로 디스크 방식보다 인메모리 방식 도입이 늘어날 전망이다. IT 시장을 흐름을 바꾸고 있는 인메모리 기술을 기반으로 한 SAP HAHA가 주목받고 있다. SAP가 추구하는 '진정한 실시간 비즈니스 구현'에 대해 상세히 알아본다.



인메모리(In-Memory) 기술은 오랫동안 비즈니스 인텔리전스(BI) 솔루션 업체에서 관심을 가지고 있었던 기술이다. 더 빠른 검색 속도에 대한 시장의 지속적인 요건 때문에 솔루션 업체들은 자연스럽게 전통적인 디스크 기반의 스토리지 대신에 인메모리 기술에 관심을 가지고 있었다. 전형적인 BI 기술은 테이블과 다차원 큐브 형태로 되어있는 데이터를 디스크에 로드하고, 그 테이블이나 큐브의 데이터를 대상으로 쿼리를 수행하게 되는 것이다.

하지만 인메모리 기술은 메모리상에 색인(Index)을 로드 하여 필요한 모든 정보를 메모리상의 색인을 통해 빠르게 검색할 수 있도록 하기 때문에 데이터 검색 시간을 획기적으로 줄일 수 있다.

오늘날 정보는 비즈니스의 핵심요소며 기업들은 비즈니스 운영에 대한 인사이트를 필요로 한다. 그러나 비즈니스 인사이트를 가능케 하는 데이터 용량은 전통적인 디스크 기반 시스템이 합리적으로 반응해 시간 내에 처리할 수 있는 범위를 초과하고 있다.

따라서 IT는 가장 기본적인 분석을 제공하는 분석모델에 대한 운영 애플리케이션 데이터에 대해서도 줄이라는 압력을 받는다. 그 결과, 운영 애플리케이션은 분석 환경과 단절되어 분석 시간은 지체되고, 데이터와 실시간 인사이트 사이에 '사후 이벤트'분석을 초래한다.

SAP HANA는 인메모리 컴퓨팅 기반의 정보분석 시스템이다. SAP HANA는 대용량 데이터를 비즈니스 트랜잭션이 발생한 순간 원하는 비즈니스 인사이트로 검색 및 분석할 수 있는 실시간 비즈니스를 실현하는 차세대 솔루션이다.

이 제품은 유연하고 다재다능한 인메모리 어플라이언스로 SAP 파트너가 제공하는 하드웨어에 SAP 소프트웨어 컴포넌트를 최적화해 결합했다.



하드웨어에 최적화된 구조

HANA는 인메모리 컴퓨팅 기반의 어플라이언스로 특정한 구성의 하드웨어에 사전에 설치되어 제공되며, 고객은 목적에 맞게 데이터베이스를 구성하여 바로 사용할 수 있다. HP, IBM, 후지쯔, 델, 레노버, 시스코 등 다양한 하드웨어 공급자를 선택할 수 있으며, 최적의 구성으로 이미 설정되어 고객에게 제공된다.

데이터 및 사용자 증가에 따라 하드웨어를 추가적으로 구성하여 MPP(Massive Parallel Processing) 구조로 확장할 수 있고 장애 대응을 위한 HA(High Availability) 구성을 할 수 있다.



디스크 입출력이 없는 구조

일반적으로 데이터베이스 성능을 좌우하는 요소 중 가장 중요한 사항이 디스크 입출력 빈도를 줄이는 것이며, 데이터베이스 튜닝의 절대적인 부분이다. HANA는 전체 데이터를 메인 메모리 내에 데이터베이스화 하여 저장하고 데이터 처리 및 조회가 메인 메모리 내에서 수행되므로 디스크 입출력이 전혀 발생하지 않는 구조다.

이러한 인 메모리 기반 컴퓨팅은 획기적으로 데이터베이스 성능을 향상시킬 수 있으며 디스크와 달리 랜덤 액세스(Random access)를 통해 병렬처리를 강화할 수 있다. 다만 시스템 장애에 대비하기 위해 트랜잭션이 완료된 내용을 로그 볼륨에 전송하는 작업을 수행하게 되며, 로그 볼륨의 변경 데이터는 특정한 체크 포인트에 의해 데이터 볼륨에 반영된다. 이러한 로그 볼륨, 데이터 볼륨과 같은 디스크 관련 작업은 실제 메모리에서 수행되는 트랜잭션과 비동기적으로 수행되므로 성능에 미치는 영향이 적다.



컬럼 기반 저장 구조

HANA는 레코드 기반의 저장 구조뿐만이 아니라 컬럼 기반의 저장 구조를 제공한다. 대량의 데이터를 분석하는 보고서의 내용을 살펴보면, 테이블을 구성하는 컬럼 중에 일부만을 사용하는 경우가 대부분이다. 이러한 특성으로 인해 기존 레코드 기반의 저장 구조만을 제공하는 데이터베이스는 연산에 불필요한 컬럼까지 검색해야 하며, 상당한 시스템 자원의 부하를 발생하는 문제를 가지고 있다.

이에 반해 HANA는 분석의 대상 컬럼만을 선별적으로 검색할 수 있는 물리적인 저장 구조를 통해 최소의 시스템 자원을 사용하여 작업을 처리하며, 분석 보고서 성능 향상 및 더 많은 사용자가 분석 시스템을 동시에 사용할 수 있다. 이러한 인메모리 기반의 컬럼 저장 구조 및 처리 기능은 SAP가 BWA(Business Warehouse Accelerator) 제품에 이미 적용했으며, 다양한 사례를 통해 성능과 안정성이 검증된 기술이다.

<이하 상세 내용은 컴퓨터월드 8월 호 참조>

저작권자 © 컴퓨터월드 무단전재 및 재배포 금지