KB국민은행

[컴퓨터월드] A은행 전산팀에 근무하는 이대리는 분기별 거래분석보고서 작업 수정으로 며칠째 야근 중이다. 보고일인 내일 모래까지는 작업이 끝날 수 있을지 걱정이다. 수천만 고객과 2만개가 넘는 지점별 실적을 뽑는 집계기준이 달라져 해당 소스를 추적하는데 만 꼬박 이틀이 소비되고 변경된 지점별 실적 배분에 따른 중간 프로그램 소스와 데이터를 맞추느라 오늘도 철야 업무를 해야 하는 상황이다.

거미줄처럼 얽히고 설켜있는 프로그램과 데이터를 촉박한 시간에 맞추느라 고생하는 이대리는 우리 주위에 흔히 볼 수 있는 기업 IT 샐러리맨들의 자화상이다.

데이터를 효율적으로 관리하고 효과적으로 사용하기 위해 기업들은 그동안 데이터 표준화, 데이터 품질관리, 데이터 보안 등을 위한 정보시스템을 구축해왔다. 시스템 내에 데이터는 끊임없이 이동하고 가공되어 마치 거미줄처럼 엮여가며, 스케줄러 시스템과 배치작업에 의해 데이터웨어하우스와 데이터마트 사이를 이동한다.

이미 구축된 정보시스템으로는 이렇게 복잡한 데이터의 흐름을 파악하기 쉽지 않다. 지금까지 대부분의 IT담당자는 매핑정의서를 참조해 작업하려 했으나 업데이트가 안되어 있고 신규 시스템들이 들어오면서 실제와 상이하여 결국 형상관리 서버에서 소스를 받아 수천/수만 라인의 소스코드를 뒤져 데이터 흐름을 파악하고 자신이 변경할 부분을 찾아 수정해야만 했다.

이러한 문제를 해결하기 위한 SW가 국내 선도 KB국민은행에 도입돼 성공적으로 활용되고 있는데, 바로 데이터 흐름관리 SW Q-Track이다.


‘Q-Track’ 도입으로 복잡한 데이터 흐름 한눈에 파악

Q-Track은 데이터플랫폼SW 전문기업인 데이터스트림즈에서 개발해 공급하는 국산 SW로 데이터를 가공하는 프로그램을 분석해 데이터흐름 정보를 생성하며 시스템 간의 데이터 흐름을 총체적으로 관리한다.

Q-Track은 적시 적소에 데이터를 활용하고자 하는 기업들의 요구사항에 부합하도록 데이터 흐름과 관련한 방대한 매핑 정보, 작업 스케줄링, 병렬작업 모니터링, 데이터 변경 요구사항 처리, 데이터 장애 발생 시 연관 업무 처리 등을 지원하는 순수 국산 SW이다. 현재 KB국민은행 정보계시스템은 ETL시스템으로 테라스트림(TeraStream)을 사용하고 있는데 데이터 가공의 핵심인 ETL 시스템의 분석율을 높이면서 중요 핵심 데이터흐름 정보를 확보할 수 있었다.

Q-Track의 핵심 기능은 프로그램 파싱(Parsing)이다. 업무 시스템을 구성하는 프로그램소스를 분석하기 위해 각 프로그램언어의 문법을 분석하는 파서(Parser) 엔진을 탑재했다. 이러한 Q-track은 사용자의 활용 방안에 따라 업무에 적용될 수 있는 케이스가 많으며, 테라스트림을 사용하는 기업들과 함께 적용 추진을 진행하고 있다.

KB국민은행은 업무의 분업이 명확하고 업무 담당자간 데이터 접근 권한이 매우 철저해 담당 업무 외의 데이터는 접근할 수 없도록 정책이 수립되어 있다. 이러한 특성상 본인의 업무에서 가공되는 데이터가 대략 어느 업무에서 활용되는지 인지하고 있지만 정확한 파악을 위해서는 해당 업무 담당자를 통해 확인하는 절차를 거쳐야 한다. 실례로 담당자가 인지하지 못한 다른 업무 시스템에서 데이터가 활용되고 있는 경우도 분석 결과 확인됐다.

▲ Q-Track의 연계 및 대상 범위


다양한 분야에서 업무 효율성 향상

KB국민은행은 데이터흐름관리시스템 도입으로 개선될 업무 효율성은 다음과 같다.
첫째, 데이터 변경 요건 처리 시 부서간의 동시 대응이 가능해진다. 원천에서 데이터 변경 시 정보계의 데이터 사용 현황을 확인하고 변경 예정을 통보함으로써 데이터를 활용하는 정보계에서 이에 대비할 수 있게 됐다. 즉 원천과 정보계간의 원활한 의사소통을 기대할 수 있게 된 것이다.

둘째, 고객 정보 데이터와 같이 민감한 특정 데이터들의 연관 관계, 매핑 정보를 자동 관리함으로써 보다 강력한 정보 보호를 수행할 수 있으며, 웹 기반 서비스를 통해 데이터 현황 파악이 더욱 편리해져 관리의 용이성이 크게 높아질 것으로 기대된다.

셋째, 신규 정보시스템 구축이나 현 정보시스템 변경에 의한 프로그램 수정이 발생할 경우, 업무 담당자와 개발자간의 프로그램 변경에 필요한 작업 범위 산정과 변경에 따른 영향도 파악이 프로그램 소스 단위까지 가능해 업무의 효율성이 매우 증대됐다. 특히 작업 범위 산정에 활용될 수 있어 보다 정밀한 자원 배치가 가능해졌다.

기업의 정보시스템은 지속적인 고도화 작업을 통해 발전하고 있다. 구축한 정보시스템의 규모가 커질수록 데이터의 양과 데이터 가공에 필요한 프로그램도 늘어나기 마련이다. 이러한 대규모 환경에서 고도화된 정보시스템을 운영하기 위한 분업화는 더욱 심화됐고, 데이터 보호 정책과 권한관리가 강화되면서, 전사 데이터 흐름을 관리하기 위한 시스템 구축은 필수 요소가 되었다.

지금까지 KB국민은행에서 업계 최초로 구축한 다수의 정보시스템들은 타 은행의 모범사례가 됐다. 이번에도 최초로 데이터흐름관리시스템 구축에 성공하였고, 지금 업계에서는 다시 한번 그 결과에 주목하고 있다.

▲ Q-Track 아키텍처

Q-Track의 주요 기능은 크게 세가지로 구분된다. 먼저 데이터흐름 분석을 담당하는 관리기능, 데이터흐름분석 정보를 생성하는 분석기능, 그리고 사용자에게 데이터흐름정보를 제공하는 조회기능이다.

사용자 측면에서는 데이터흐름정보를 얻고자 하는 다양한 방법으로 조회하는 것이 주요 사용 방법이다. 정보를 얻고자 하는 대상이 테이블, 컬럼 이름을 검색어로 사용해 연관된 부서, 업무, 프로그램 등을 조회할 수 있으며, 데이터흐름정보를 다이어그램 형식의 흐름도를 통해 시각적으로 정보를 탐색할 수 있다.

Q-Track은 테이블흐름도, 컬럼흐름도와 같이 데이터흐름도의 개념을 도입했다. 즉 데이터흐름을 나타내는 단위를 테이블, 컬럼 단위의 노드를 생성해 선후행 관계를 표현하고 데이터 흐름의 방향성을 화살표로 표시해 다이어그램으로 제공했다.

시각적인 흐름도 정보는 사용자로 하여금 데이터에 대한 새로운 표현으로 이해하기 쉬운 직관적인 표현으로 업무 담당자간의 의사소통 시 활용할 수 있는 자료가 될 것으로 생각한다. 컬럼매핑 정보 역시 웹서비스 화면에서 노드 형식으로 조회해 볼 수 있다.

ETL의 경우 프로그램 안에서 데이터 흐름을 블록흐름도 또는 프로그램흐름도로 표현해 조회한 프로그램의 소스-타겟 정보를 흐름도로 표현해 보다 쉽게 프로그램의 정보를 확인할 수 있다. 그리고 데이터연관정보에 대해 집계표를 제공해 사용자가 조회한 기준 테이블이나 컬럼이 활용되는 연관 부서, 업무, 프로그램 등 데이터흐름정보를 표로 정리해 볼 수 있고 이러한 정보는 모두 엑셀파일로 다운로드 받을 수 있다.

Q-Track의 데이터흐름분석 작업은 모두 자동화 되며, 스케줄링 기능을 통해 모니터링 할 수 있다. 또한 웹 기반 서비스로 여러 사용자가 쉽게 접근하여 사용할 수 있도록 했다.

저작권자 © 컴퓨터월드 무단전재 및 재배포 금지