APM 도입해 실시간으로 서비스 품질 모니터링 실현
'파란'의 모토 '최고의 서비스를 최상의 품질로' 구현 체제 마련

2006년 업계 1위를 목표로 하고 있는 KTH는 파란닷컴을 통해 게임과 음악, 영상 등의 다양한 컨텐츠를 바탕으로 한 포탈서비스를 제공하고 있으며, KT와 공동으로 와이브로 사업도 진행하는 등 '디지털 미디어 게이트웨이(Digital Media Gateway)'의 비전 실현을 위해 한 걸음씩 나아가고 있다.
KTH의 지난 2004년 총 매출은 615억원으로, 2003년 366억원에 비해 100% 이상 급성장했다. 90년대 말부터 PC 통신의 선두주자였던 하이텔의 포탈서비스 및 시스템 운영 노하우를 바탕으로 인터넷과 휴대폰, 방송 등 다양한 멀티미디어 채널을 제공하는 멀티액세스 포탈로서의 위상을 강화하고 있다.
김달 기자 kt@infotech.co.kr

2004년 7월 KTH가 '국내 5대 포탈 진입'이라는 도전적인 목표를 내걸고 내놓은 포탈사이트 '파란닷컴'은 서비스 개시 100여일 만에 목표를 달성, 이제는 새로운 목표인 국내 포탈사이트 3위 입성을 위해 달리고 있다.
파란닷컴이 단기간 내에 국내 5대 포탈로 진입할 수 있었던 이유는 무엇일까? 그 해답은 파란닷컴이란 포탈서비스의 내용과 질이다.
KTH는 '파란닷컴'을 오픈하면서 5C, 즉 커뮤니케이션(Commu-nication)과 커뮤니티(Community), 컨텐츠(Contents), 커머스(Commerce), 컨텍스트(Context) 등을 만족시키는 서비스를 지향해왔다. 그리고 질적인 측면에서는 이용자들에게 최고 품질의 서비스를 제공할 수 있는 토대를 구축했던 것이다. 여기에서 주목해야 할 부분은 '품질' 부문. KTH는 최고 품질의 서비스를 제공하기 위해 서버관리시스템과 네트웍관리시스템은 물론 머큐리인터액티브의 토파즈(Topaz)를 이용해 애플리케이션 성능 관리(Appli- cation Performance Management ; APM)시스템까지 구축했기 때문이다.
서비스 품질과 가용성 확보 등이 선결과제
KTH는 파란닷컴이 커뮤니티를 기반으로 하여 유무선 종합 컨텐츠를 제공하는 서비스라는 점에서 무엇보다도 품질이 우선시되는 만큼 사이트 오픈 이전부터 서비스 품질을 높이기 위해 노력했다.
실제로 포탈사이트 특성상 매일 천문학적 수치의 페이지 뷰를 기록한다는 점에서, 사이트 방문자들이 어떠한 방해도 받지 않고 서비스를 이용할 수 있도록 뛰어난 성능을 확보하기 위한 노력은 단순히 파란닷컴에만 해당되는 사항은 아니었다. 더욱이 사용자가 늘어날 경우를 대비해 원활하게 대응할 수 있는 시스템을 구축하고 나아가 최고의 국내 포탈사이트를 목표로 하는 KTH 입장에서는 반드시 일정한 서비스 품질을 확보해야만 했다.
게다가 고정적으로 사이트를 방문하는 사용자의 수를 늘리기 위해서는 사이트에 접속하기까지의 시간을 최소화하고 데이터 전달 속도를 높일 수 있도록 시스템 최대의 가용성을 확보하는 일도 시급하다고 KTH는 판단했다.
여기에 또 하나의 문제, 즉 기존 시스템에서는 사용자 측에서 먼저 불만족스러운 사항을 적극적으로 알리기 전에는 시스템 운영자들이 서비스 상의 문제를 전혀 파악할 수 없다는 맹점을 안고 있었다. 때문에 장애가 발생하기 전에 미리 문제점을 파악하고 사용자에게 최고의 포탈서비스 품질을 제공하기 위해서는 애플리케이션 최적화 솔루션을 도입할 필요성이 발생했다.
한편, 시스템 운영자 측면에서는 자원을 통합 관리할 시스템의 부재로 인해 객관적인 데이터를 확보할 수 없었던 것도 해결해야 할 문제였다. 수치화된 객관적인 자료를 확보하기 어려웠던 탓에 장애나 성능 저하 원인을 제대로 분석할 수 없었고, 서비스별로 혹은 부서별로 시스템이 분산된 탓에 서비스 업무를 처리하는데 있어 효율성이 떨어졌다. 이와 같은 문제도 종국에는 대고객 서비스 품질 향상과 직결된다는 점에서 반드시 개선해야 할 또 하나의 과제였다.

구간별 장애 관리할 수 있는 시스템 구현
KTH는 객관적인 성능분석 기준을 확보해 내부적으로 확인되지 못하는 문제점들을 파악할 수 있는 모니터링 시스템, 즉 애플리케이션 성능 관리 솔루션을 도입함으로써, 이러한 문제를 해결하기로 결정했다.
이와 관련해 KTH IT지원실의 이호철 대리는 "모니터링 기능이 다양하고 시스템 관리 및 네트웍 관리 소프트웨어와 쉽게 연동할 수 있는 제품을 도입하기로 방침을 마련했다"면서 "전통적으로 엔터프라이즈 테스팅 및 성능관리 분야의 선두업체인 머큐리인터액티브의 '토파즈(Topaz)'를 선택했다"고 전했다.
솔루션 선정 작업을 끝낸 KTH는 작년 6월부터 2개월에 걸쳐 토파즈를 기반으로 구간별 장애를 효율적으로 관리할 수 있는 통합관제시스템을 구축했다. 최종 사용자 입장에서 측정할 수 있는 APM 시스템을 갖춘 KTH는 비즈니스 관점의 장애관리를 통해 입체적으로 장애 원인을 분석할 수 있게 됐고, 시스템의 안정성과 가용성도 확보할 수 있었다.
이호철 대리에 따르면 APM 운영으로 KTH는 ▲24시간 모니터링을 통한 신속한 장애 인지 ▲실시간 경보로 장애에 신속한 대응 가능 ▲서비스 응답속도 저하 및 접속장애 발생시 신속한 분석을 통한 조치 및 사전 예방 ▲측정 데이터의 DB화로 운영서비스의 트렌드 분석 ▲SLA 기준의 일/주/월간 만족도 리포팅 가능 ▲장애원인에 대한 객관적인 데이터 제공 ▲서비스 가용성 확보를 통한 대고객 만족 서비스 강화 ▲애플리케이션 측면에서의 네트웍과 시스템 성능 분석 등의 효과를 얻고 있다.
특히, 비즈니스 프로세스와 최종 사용자의 성능관리, 고객 영향 평가 등의 IT 활동을 통합 운영할 수 있는 시스템을 갖게 되면서, KTH는 비즈니스 관점에서 IT를 운영 및 관리할 수 있게 되었고 IT투자를 비즈니스의 수익과 연결시킬 수 있는 토대를 마련하게 되었다.
APM 솔루션 도입 이후 KTH는 기존의 서비스 운영센터의 관점에서만 서비스 성능을 진단하던 것에서 벗어나, 고객의 입장에서 실시간 서비스 품질 모니터링을 실현하고 최종 성능을 관제하는 것이 보다 용이해졌다. 이호철 대리에 따르면 이전에는 시스템 장애가 발생할 경우 원인을 발견하는 것도 어려웠지만, 찾아낸다고 하더라도 문제를 해결하는 데 어려움을 겪었는데, 새로운 시스템을 구축한 후에는 실시간으로 문제점을 해결하는 것은 물론 사전에 장애를 예방할 수 있기 때문에, 시스템 가용성을 극대화하고 고객 불만을 최소화할 수 있게 됐다.
현재 KTH는 고객만족팀과 각 서비스팀에서 토파즈를 운영하고 있다.

최종사용자 관점에서 서비스 성능 측정
KPI 및 SLA 만족도 향상을 위해 토파즈를 운영하고 있는 고객만족팀은 토파즈의 리포팅 기능을 통해 KPI 지수를 측정해 시스템의 가용성과 응답시간에 대한 정략적인 데이터를 확보했으며 서비스 성과를 정확하게 측정할 수 있게 됐다. 포탈서비스의 사활이 걸려있다고 해도 과언이 아닌 응답률 속도도 더욱 빨라졌다. 이후 이렇게 수치화된 정확한 데이터를 근거로 지속적으로 시스템을 모니터링하고 업그레이드 할 수 있었고, 이는 곧 대고객 서비스 품질의 향상으로 이어졌다.
비즈니스를 성공적으로 운영하기 위해서는 고객만족도를 극대화하는 것도 중요하지만, 비즈니스 운영자 측면에 있어서도 업무 프로세스에 있어서 얼마만큼 효율성을 확보하느냐는 점 역시 간과해서는 안 된다. 따라서 KTH는 기존에 구축되어 있는 애플리케이션을 최적화하고 시스템 운영자들의 역량을 최대화하기로 했다. 단일한 뷰(view)를 통해 시스템 개발자와 연구자, 또 관리자들이 모두 통합관제시스템을 구축하여 지속적으로 성능을 모니터링하고 IT 인프라를 구성하는 요소들을 감시함으로써 협업체제를 강화했다. 다양한 애플리케이션으로 구성된 전체 IT 인프라를 더 적은 인력으로도 효율적으로 관리할 수 있게 되어 비용절감 효과를 거둘 수 있었다.
이와 함께 KTH는 각종 서비스 시스템, 네트웍에 대한 정보는 물론, 사용자들에게 제공되는 주요 서비스를 모니터링 할 수 있는 관제 시스템을 구성하는 한편, 품질 개선을 위해 필수적인 비즈니스 유닛(개발), 운영팀, 연구소, 중역 등이 하나의 표준 아래 협업할 수 있도록 다양한 뷰를 적용했다. 기존 업체들이 전체 시스템을 갖추고 서비스별로 Top View를 운영하는 것을 넘어서서 KTH는 부서별로까지 세분화된 시스템을 구축하여 업무 처리의 효율성과 전문성을 강화했으며, 중앙시스템운영팀을 중심으로 다시 각 부서들을 강력하게 연계시킴으로써 효율성과 통합성을 동시에 만족시킬 수 있는 내부 협업 체제를 구현했다.

응답시간은 줄고 시스템은 조기 안정
절대 다수의 사용자들이 동시간 대에 한꺼번에 접속하는 포탈사이트에서 로그인이나 각각의 개별 서비스 접속 시간이 길어진다면 치명적인 영향을 줄 수 있다. 따라서 KTH는 언급한 것처럼 토파즈를 사용함으로써 최종사용자 관점에서 응답시간을 대폭 단축시켰으며, 사이트의 시스템 안정성을 조기에 확보할 수 있었다. 무엇보다도 철저히 고객의 관점에서 설계된 시스템 덕분에 고객이 장애를 인지하기도 전에 시스템 운영자 측에서 사전에 장애를 감지, 신속하게 처리할 수 있었고 이를 근간으로 고객만족도를 한층 극대화할 수 있게 됐다.
IT 시스템이 비즈니스에 핵심적인 역할을 하는 기업일수록 IT의 성능을 극대화하고 품질을 향상시키고 이를 효율적으로 운영하는 것이 절실하다. 앞선 안목으로 KTH는 이번 프로젝트를 통해 선진 포탈시스템 구축에 성공함으로써 '원 소스 멀티 유즈(One Source Multi Use)'를 실현하는 차세대 인터넷 선도자 입지를 확고히 했다.
파란닷컴은 사용자 관점에서 설계된 시스템 덕분에 고객주도형 선진 서비스를 제공하게 되어 여타의 경쟁 포탈들과 차별화를 실현해 올해 안에 국내 3대 포탈로 도약하기 위해 박차를 가하고 있다. 향후 KTH는 국내 업계에서 선도적인 디지털 미디어 사업자로서의 입지를 강화하고 업계 최고의 비즈니스 경쟁력을 가진 글로벌 기업으로서 거듭날 것으로 기대하고 있다.
저작권자 © 컴퓨터월드 무단전재 및 재배포 금지