김현표 건강보험심사평가원 진료정보분석실 부장

 
[컴퓨터월드] 건강보험심사평가원이 빅데이터를 기반으로 국민의료 기관에게 맞춤형 정보 제공을 위한 개발에 착수했다. 이를 통해 앞으로 자신의 질환과 관련된 예상 치료비, 관련 병원 등을 쉽게 파악할 수 있게 되고, 병원·요양기관 등도 효과적인 기관 운영을 위한 다양한 지역별·규모별·기관별 의료 정보를 쉽게 얻을 수 있게 될 전망이다.
최근 심평원은 빅데이터 활용을 더욱 촉진하기 위한 ‘2014년도 정부 3.0 추진계획’ 수립과 함께 ‘정부3.0 추진단’을 발족시켰다.
심평원이 추진할 정부3.0 과제를 살펴보면 크게 △신규 일자리 창출을 지원하기 위한 ‘보건의료산업 생태계 조성’ △의료기관 서비스 가격을 비교할 수 있는 ‘비급여 진료비 정보공개’ △심평원의 보유 정보를 활용해 보건의료 활성화를 위한 ‘의료정보 지원센터 운영’ 등 대표과제를 추진하며, 심사평가원이 자체 발굴·선정한 △국민생활 밀착형 질병통계 정보 사전공개 확대 △병원간 환자 진료정보 교류시스템 구축 등 10개 선도과제의 세부 실행계획을 마련 후 추진할 계획이다.
심평원 정부3.0 추진단 내 정보(데이터) 개방팀 소속 김현표 진료정보분석실 부장을 직접 만나 심평원의 빅데이터와 이를 활용하기 위한 계획에 대해 들어봤다.

건강보험심사평가원에 대해 소개를 해 달라.
건강보험심사평가원은 국민 의료에 질을 높이고 적정한 비용으로 국민들이 진료를 받을 수 있도록 역할을 하는 기관이다. 가장 대표적인 업무라고 한다면 심사가 있다. 병의원, 약국 등에서 환자를 진료하고 그 진료비를 건강보험법에 인정하는 기준으로 올바르게 청구했는지를 확인(심사)하는 것이다. 그 다음으로 평가 업무가 있다. 의약학적면과 비용효과적인 면에서 진료가 적정하게 이뤄졌는지 평가해 의료기관에 그 결과를 알려줌으로써 의료서비스 질을 향상시킬 수 있도록 돕고 있다. 그 외 △진료비확인신청 △응급의료비대불 △정부정책지원 등의 업무가 있다.

심평원은 우리나라 국민 5천만 명의 진료 내용이 DB화되어 있으며 이 체계는 세계적으로 유례가 없을 정도로 선진화되어 있다. 심사와 평가 기준 그리고 의약품 유통 등의 데이터들이 하나의 시스템으로 통합되어 있어 빅데이터 관점에서 보면 심평원의 데이터 체계는 환상적인 데이터로 해외에서 관심을 가지고 있다.

국민건강보험공단과 건강보험심사평가원의 차이점은.
국민건강보험공단과 건강보험심사평가원은 보건의료를 다룬다는 점에서 공통점이 있지만 서로 보건의료를 바라보는 시각이 다르다. 건보공단은 국민 개개인에 주안점을 뒀다면 심평원은 요양기관 및 기업 등 유관기관에 주안점을 두고 있다.
실제 최근 건보공단과 심평원이 보유한 데이터 중 진료비 명세서 데이터가 중복돼 빅데이터 활용 부분에 있어서 지적을 받고 있다. 이에 보건복지부 주관으로 중복 문제에 대해 기관의 데이터와 역할에 맞는 기능 수행 및 협력을 하자고 합의점을 찾았다.

“평소 어깨, 허리 등에 다양한 통증이 있는 A씨는 나에게 맞는 의료기관을 찾는데 어려움이 있었다. 그러나 ‘맞춤형 진료정보’를 활용해 증상과 관련되는 치료과정, 예상 치료비, 관련 병원정보를 파악할 수 있게 된다.”

“수도권에서 개인병원을 운영하는 의사 B씨는 친지들의 권유로 고향 근처에서의 개원을 준비 중이나, 의사결정을 내릴 수 있는 정보가 부족하여 고민이 많았다. 그러나 ‘의료경영지원’ 서비스를 통하면 개원 희망지역의 의료 서비스 수요와 규모별 병원정보 등을 제공받아 적합한 규모의 개원을 결정할 수 있게 된다.”

 

최근 심평원에서 발표한 2014년도 정부3.0 추진계획 핵심 내용은 무엇인가.
최근 발표한 ‘2014년도 정부3.0 추진계획’의 핵심은 데이터에 있다. 데이터와 정보를 민간에게 제공하는 것이 1차 목표다. 그 다음 데이터 개방과 개방 생태계를 조성해 외부에서 활용하는 것이 2차 목표다. △보건의료산업 생태계 조성 △비급여 진료비 정보공개 △보건의료산업 활성화를 위한 지원센터 운영 등 3대 대표과제가 이 목표 아래 수립된 것이다.

△국민생활 밀착형 질병 통계 정보 사전공개 확대 △주요의사 결정 과제의 이해관계자 참여 확대 △병원간 환자 진료정보 교류시스템 구축 △신의료기술평가 절차 동시진행 제도 도입지원 △의료자원 신고 일원화 △통합데이터 분석기반의 모니터링 시스템 운영 △의료기관 진료정보 지표관리를 통한 진료행태 개선유도 △손쉬운 병원찾기 서비스 △의료경영지원서비스 개발 △건강보험 보장성 강화를 위한 국민소통 서비스 시행 등 10대 선도과제는 원본 데이터를 개방해 데이터를 활용한 과학적인 행정 구현과 함께 서비스 콘텐츠 발굴을 통ㅎ 민간에 서비스를 제공하는 과제로 이뤄져 있다.

대표과제와 선도과제를 통해 방대한 데이터를 활용할 경우 민간에서는 경제적 가치 유발이 이뤄지고 일자리가 창출을 이끌어내는 것이 큰 목적이다. 또한 데이터 개방을 통해 국민들의 알 권리 보장과 맞춤형 서비스 제공하는 것에 대한 효과도 기대하고 있다.

심평원은 정부3.0 이전부터 데이터를 업무에 활용하고 있었다. 대표적으로 데이터 기반의 전산심사가 그 예다. 다만 정부3.0은 정보를 연계한다는 점에서 차이점을 찾을 수 있다. 이전에는 심평원 내에서 데이터를 분석해 내부 업무에 활용했다면, 이제는 외부 데이터를 도입하거나 오픈 API를 통해 업무와 서비스를 연계하는 등 데이터 가치를 높이는 방법을 찾고 있다.

또한 웹 기반에서 탈피해 모바일 애플리케이션 등 다양한 기반의 서비스도 추구하고 있다.

진료 정보 교류시스템은 예전부터 논의됐지만 번번이 실패했다.
‘병원간 환자 진료정보 교류시스템 구축’ 과제는 기존에도 시도가 됐던 사업이지만 사회적 인식 미흡 등 어려가지 상황에 부딪쳐 보류됐던 사업이었다. 최근 정부3.0과 빅데이터 이슈 등 인식에 많은 개선이 이뤄졌다. 또한 교류를 위한 표준화 기술이 소프트웨어만으로 가능해져 구현에 문제가 없는 상태다.

진료 정보 교류시스템은 환자들의 불필요한 중복검사와 중복처방에 따른 부작용 및 비용 등을 사전에 예방 할 수 있다는 점에서 기대가 크다. 우선 2016년까지 영상 진료 기록을 교류할 수 있도록 하며 2018년에는 진료 정보까지도 병원간 교류할 수 있도록 시스템을 구축할 계획이다.

현재 기본적인 연구용역을 통한 방법론이 제시가 됐으며, 내년까지 이해관계자들을 설득하고 합의에 나설 예정이다.

 
심평원의 데이터 종류와 양은 어느 정도인가.
심평원이 보유한 핵심 데이터는 국민들의 병원 진료 내역이다. 요양 기관의 자원 정보 및 의약품을 생산하고 유통하고 수입하는 유통 정보도 가지고 있다.

실제 심평원은 5억 8,100만 건의 심사정보(33TB)와 116억 건의 처방정보(6.5TB), 2,200만 건의 의료기관 정보(4TB), 70만 건의 의약품생산내역(6.4TB)과 12억 건의 공급실적(6TB) 등의 데이터 등을 보유하고 있다. 또한 심평원을 중심으로 전국 의료기관 및 약국과 정보 연계망을 구축하여 의사가 의약품을 처방하고, 약사가 조제할 때 환자별 투약정보를 바탕으로 의약품 안전성과 관련된 정보를 진료·조제 컴퓨터에 실시간 제공함으로서 약화사고를 사전에 차단하여 국민건강을 보호하는 의약품안심서비스(DUR)를 위한 300TB 정도의 데이터도 보유하고 있다.

데이터 품질 확보를 위해 어떤 노력을 하고 있나.
심평원이 보유한 데이터를 빅데이터 관점에서 바라보자면 버라이어티보다는 볼륨에 초점이 맞춰져 있다. 기본적인 품질은 정보통신실에서 IT 관점의 품질 관리 계획 하에 하고 있다. 그리고 진료정보분석실에서 질병코드와 관련한 품질 확보를 위한 노력을 하고 있다. 심평원의 데이터는 대부분 시스템에서 품질을 관리할 수 있지만 질병 코드는 시스템만으로는 품질이 확보될 수 없다. 실제 질병 코드 지침과 병원에서 사용하고 있는 코드 상에 괴리가 있을 수도 있다. 코드 조작이나 실수 등 여러 가지 변수가 많다. 이 부분에 대한 정합성을 확보하기 위해 연구용역을 시작했으며 올해 7월 이후 나온 연구용역 결과를 토대로 질병코드관리 고도화를 시행할 예정이다.

최근 개인정보가 해커들이 먹잇감이 되고 있다. 보안에는 문제가 없나.
빅데이터를 진행하면서 두 가지 문제가 생기고 있다. 보안과 개인정보 침해가 그것이다.
그러나 심평원은 보안과 개인정보 침해에 관해서 안전한 구조를 가지고 있다. 데이터를 분석하는 기능을 가지고 있지만 실제 개인정보를 열람하는 기능은 애초에 없기 때문에 보안사고가 날 수 없는 구조다. 지난해 개인정보보호 우수기관 대상을 수상하며 대통령상을 받았던 것도 이점 때문이다.

또한 심평원 내 보안 부서가 존재해 정기적으로 모니터링하는 것은 물론 정보접근권한도 단계적으로 관리하고 있어 정보가 유출될 수 있는 환경을 만들지 않고 있다.

최근 정부3.0 등 공공데이터 개방에 대한 이슈가 있는 만큼 데이터를 개방하기 위한 원내 정보 개방 시스템이 별도로 구축되어 있으며, 내방이 힘든 이용자를 위해 원격 접근 처리 시스템도 마련되어 있다.

그러나 의료정보가 개인정보와 밀접한 관계를 맺고 있는 만큼 기본적으로 개인정보 침해가 우려되는 정보에 대해서는 마스킹 기술을 적용해 익명으로 표시되어 있으며, 개별 정보를 수집하는 것이 아닌 데이터 분석을 통해 가공된 데이터만 반출이 가능한 것 등 개인정보를 보호하기 위한 노력을 취하고 있다.

보건의료 분야 데이터사이언티스트 양성에도 집중하고 있는 것으로 알고 있다.
심평원이 보건의료 분야 데이터사이언티스트 양성에 나선 것은 우선 보건의료 데이터가 다른 분야와 다르게 상당한 전문지식을 요구한다는 점에 있다. 속성부터 값의 의미 등 보건의료에 대한 전문지식이 없을 경우 분석이 어려울 뿐더러 오류 소지가 다분하기 때문에 직접 보건의료에 특화된 전문 인력을 양성하게 됐다. 또한 보건의료 데이터를 개방하고 있지만 이를 활용하는 인력이 없을 경우 무의미한 개방이 된다. 이를 활용할 수 있는 인력을 확보하기 위한 일종의 저변 확대 의미도 담고 있다.

SAS와의 협력은 심평원 주력 분석 소프트웨어가 SAS로 구축되어 있기 때문이다. 심평원 데이터는 큰 데이터이기 때문에 대용량 데이터 분석 역량이 필요했다. SAS와 SPSS를 비교했을 경우 대용량 데이터를 분석할 수 있는 역량에서 SAS가 앞섰다. 최근 주목받고 있는 R의 경우는 필히 하둡과 연계된 시스템을 구축해야 한다. 그러나 심평원 내 데이터는 정합성을 중시하는 데이터로 하둡이 아닌 RDB에 적합한 데이터이므로 R는 논외 대상이었다.

이에 심평원 내 보건의료 데이터를 다루기 위한 실무 경험을 갖춘 인력을 양성하기 위해 SAS와의 협력은 필수였다.

빅데이터를 도입하고자 하는 기관들이 주의해야 할 점은.
심평원 입장에서 빅데이터는 속도와의 전쟁이라고 볼 수 있다. 대용량 데이터를 빠르게 분석할 수 있는 시스템을 구축하는 것이 필요하다. 이런 점에서 빅데이터 기반 시스템을 구축하기 위해서는 기존 IT 기반을 가지고 있는 기관들이 빅데이터의 역할과 데이터 활용의 목적에 맞게 장기적인 접근을 해야 한다.

무조건 빅데이터라고 해서 유행에 맞춰 무한정으로 시스템만 도입하게 되면 실패할 확률만 높아진다. 기관의 전략에 맞춰 장기적인 관점에서 기관이 가지고 있는 고유의 자원 활용에 대한 논의가 있어야 한다.

또한 내부 직원의 분석 능력 향상도 같이 이뤄져야 한다. 최근 데이터가 개방되면서 독점력이 사라지고 누구나 원 데이터를 활용할 수 있게 된 상황에서 분석 능력이 갖춰지지 않으면 역량에서 뒤쳐지는 상황이 발생할 수 있다.

관련기사

저작권자 © 컴퓨터월드 무단전재 및 재배포 금지