데이터 접근성‧활용성 높여…지원 없이 항구적 운영 가능한 플랫폼 목표

[컴퓨터월드] 문재인 정부는 최근 수 년간 데이터 기반의 IT 산업 활성화 정책을 지속적으로 추진해왔다. 올해에는 국내 ICT 생태계의 혁신을 위한 ‘디지털 뉴딜’ 전략을 발표하며 ‘데이터 댐’이라는 전략을 제시한 바 있다. 과거 후버댐 건설이 미국 대공황 시절에 일자리 창출과 경제 활성화에 기여했던 것처럼, 모든 IT의 근간이 되는 데이터들을 결집한 데이터 댐을 건설해 국내 IT 산업계의 부흥을 이끌겠다는 취지다. 데이터 댐 이전에는 모든 산업계를 데이터를 중심으로 연결하고자 하는 데이터 고속도로라는 개념이 제시됐다.

특히 지난해에는 공공과 민간이 협업해 산업계에서 활용할 수 있는 데이터 풀을 구축하고자 하는 ‘빅데이터 플랫폼 및 센터 구축사업’이 진행됐다. 데이터 중심 IT 정책의 일각을 담당하고 있는 빅데이터 플랫폼 및 센터 구축사업의 현황을 살펴본다.


세계 최초 공공-민간 협업한 데이터 유통 플랫폼 구축

지난 2018년 8월, 문재인 대통령은 데이터 규제혁신 행사에 참석해 “대한민국은 인터넷을 가장 잘 다루는 나라에서 데이터를 가장 잘 다루는 나라로 변화해야 한다”고 강조했다. 이를 위해 2019년에는 국내 데이터 산업 활성화를 위해 1조 원의 예산을 투입하겠다고 밝혔다.

여기에는 공공 데이터에 대한 전수조사를 통해 민간에서 활용할 수 있는 데이터들을 적극 공개하거나, 데이터 확보‧가공에 어려움을 겪고 있는 중소기업과 스타트업들을 위한 데이터 구매‧가공 바우처를 제공하겠다는 계획들이 포함됐다. 금융과 통신 분야에서 먼저 시작된 ‘마이데이터 시범사업’ 역시 데이터 산업 활성화를 위한 전략의 일환이다.

‘빅데이터 플랫폼 및 센터 구축사업’은 이러한 취지의 연장선상에서 시작됐다. 해당 사업은 국내 데이터 산업을 활성화하기 위해 과학기술정보통신부(이하 과기정통부)와 한국정보화진흥원(NIA)이 추진한 사업이다. 국내 전 산업계의 혁신을 위해서 데이터가 중요하다는 점을 인식하고, 정부 차원에서 양질의 데이터를 생산 및 유통할 수 있는 체계를 만들어 데이터 생태계의 활성화를 가속한다. 공공과 민간이 협력해 그동안 소외돼 있던 활용 가치가 높은 데이터들을 수집‧생산‧구축하고 개방 및 공유할 수 있는 체계를 마련하겠다는 전략이다.

당시 정부가 주도하면서도 공공과 민간의 협력을 통해 운영되는 데이터 유통 플랫폼은 전 세계에서 유래를 찾을 수 없는 것이었다. 가령 데이터 유통이 활발하고 관련 생태계가 잘 갖춰졌다고 평가받는 미국의 경우, 데이터 브로커 역할을 하는 민간 기업들이 주도적으로 데이터 플랫폼을 개발 및 운영하고 있다. 이들은 정부의 개입 없이 자체적으로 데이터를 생산하고 가격을 매겨 유통 체계를 완성했다. 반대로 중국은 정부 차원에서 운영하는 데이터 거래 플랫폼을 구축했다. 운영 또한 국유기업이 담당해 민간 기업의 개입을 배제했다.

공공기관 입장에서야 다양한 데이터를 공개하고 민간과 공유해 시너지를 일으켜 산업 활성화에 기여하는 게 좋다. 하지만 민간 기업 입장에서는 직접 생산‧수집하고 구축해온 데이터들을 다른 기관‧기업과 공유할 이유가 없다. 데이터가 기업의 핵심적인 경쟁력으로 떠오른 시대에 독자적인 데이터를 갖추고 있다는 것은 큰 힘이 되기 때문이다. 따라서 정부는 기업들이 안으로 숨기고 있는 데이터들을 밖으로 끄집어내어 더욱 다양한 분야에서 활용될 수 있도록 단초를 제공해야 한다. 또한 기업들이 당장은 데이터 공개에 부담을 느낄지라도, 장기적으로는 다른 기업들이 공개한 데이터들과 접목할 기회를 얻음으로써 자신들에게도 이익이 돌아갈 것이라는 확신을 심어줘야 한다.

NIA 측은 지난해 초 이번 사업에 대한 공모를 진행할 때, 사업에 참여하고자 하는 기업들이 컨소시엄을 구성하는 과정에서 각자가 보유하고 있는 데이터 목록을 공유하며 많은 파란이 일었다고 설명했다. 참여 기업들이 서로가 필요로 하던 데이터를 가지고 있었다는 것을 알게 되고, 사업 추진 이전부터 데이터를 주고받거나 거래하는 일이 일어나기도 했다. 본격적인 플랫폼 구축사업에 들어가기 전부터 이미 서로 데이터를 공개‧공유하는 일이 강력한 시너지를 창출할 수 있다는 것을 체감하게 된 것이다.


지난해 인프라 구축에 초점…분야별 10개 과제 선정

빅데이터 플랫폼 및 센터 구축사업에는 2019년부터 3년간 총 1,516억 원이 투입되며, ▲데이터 생산·구축·수집·분석·유통·활용 등을 위한 인프라 구축 ▲데이터 품질 확보 및 표준화 등 양질의 데이터 재생산 비용과 창업 지원 ▲데이터 도메인별 전문 교육 ▲데이터 활용을 위한 전문기술 지원 등에 활용한다.

▲ 최종적으로 선정된 10개 빅데이터 플랫폼

해당 사업은 정부의 주도와 투자를 통해 산업 분야별로 10개의 빅데이터 플랫폼과 100개의 센터를 구축하게 되지만, 사업 종료 후에는 정부의 추가적인 지원 없이도 해당 플랫폼들이 자생할 수 있도록 만드는 게 목표다. 이는 플랫폼 간의 체계적인 정보 공유와 협력, 공공과 민간의 유기적인 협업을 통해 다양한 데이터들을 한 데 모음으로써 가능해진다. 10개로 나뉜 각각의 플랫폼에서 각 산업별 특징을 살린 데이터들을 결합해 시너지를 일으키고, 이렇게 결합된 데이터들을 플랫폼 간의 유기적인 소통으로 다시 결합시켜 다른 곳에서는 찾아볼 수 없는 가치를 가진 데이터들을 생산한다면 충분히 경쟁력을 가질 수 있다는 설명이다.

공공과 민간의 데이터 간에도 시너지를 일으키기 위해 각각의 과제는 해당 분야에서 양질의 데이터를 보유하고 있다고 판단된 기업들과 이를 적절히 활용할 수 있는 기술력을 갖춘 기업, 그리고 이를 지원할 수 있는 공공기관들이 컨소시엄을 구성해 추진했다. 가령 가장 높은 점수를 획득한 문화·미디어 분야의 ‘문화체육관광 빅데이터 플랫폼’의 경우, 한국문화정보원을 중심으로 22개 기업·기관이 컨소시엄을 구성해 참여했다.

사업 1차 년도였던 지난해에는 플랫폼 및 센터의 인프라 구축에 중점을 뒀다. 지난 3월 6일부터 4월 16일까지 사업 공모를 실시해 총 10개 분야에서 44개 빅데이터 과제를 접수했으며, 두 차례의 평가절차를 거쳐 최종적으로 10개의 과제를 선정했다. 하반기에는 플랫폼과 센터 구축이 본격적으로 추진돼, 본격적인 데이터 확보와 유통을 위한 기반을 다졌다.


모든 데이터 한 눈에 볼 수 있는 ‘데이터 지도’ 출시

올해 빅데이터 플랫폼 및 센터 구축사업은 지난해 마련한 플랫폼과 센터들이 정상적으로 작동할 수 있게끔 체재를 가다듬는 데에 있었다. 특히 데이터를 양적으로 확대하고 품질을 높이는 한편, 활용 가능성과 접근성을 높이기 위해 많은 역량이 투입됐다. 민간 기업이 손쉽게 플랫폼에 접근하고 생산 및 구축한 데이터를 구매하는 한편, 이를 통해 많은 효과를 거두고 시너지를 창출할 수 있어야 지속적으로 수요가 이어질 수 있기 때문이다. 사업 기간이 내년까지로 계획돼 있는 만큼 발 빠르게 체제를 정비하고 향후 추가적인 지원 없이도 자체적으로 운영될 수 있는 모습을 갖춰야 하는 상황이다.

▲ 통합 데이터 지도 서비스 메인 화면

이번 사업을 주관하고 있는 NIA 측은 향후 빅데이터 플랫폼들이 모두 자생 가능한 역량을 갖출 수 있도록 장기적인 로드맵을 수립하고 있다고 밝혔다. 이에 대해 오성탁 NIA 지능데이터본부장은 “10개 플랫폼 모두 성격이 천차만별이다. 어떤 쪽은 신규 서비스 개발에, 어떤 쪽은 데이터의 거래에, 어떤 쪽은 데이터 결합과 융합에 포커스를 맞추고 있다. NIA는 모든 플랫폼들을 전체적으로 살펴보면서 각각 다른 부분에 대해 성공적인 로드맵을 만들어내고자 노력하고 있다”고 말했다.

또한 오성탁 본부장은 “10개 플랫폼들이 현재 작동 자체는 정상적으로 하고 있는데, 이를 통해 어떻게 가시적인 성과를 달성해 기업들의 참여를 유도할 것인지 고민하고 있다”고 덧붙였다.

특히 지난 3월, 과기정통부와 NIA는 빅데이터 플랫폼들의 데이터 현황을 한 눈에 확인할 수 있는 ‘빅데이터 플랫폼 통합 데이터 지도(이하 데이터 지도)’ 서비스를 출시했다. 데이터 지도 서비스는 10개 빅데이터 플랫폼들이 생산‧공개하는 데이터들을 분야별‧유형별‧주제별‧지역별로 구분해 시각화한 통계 정보를 제공하는 한편, 시맨틱 검색을 통해 이용자가 원하는 데이터 간의 연관성을 자동으로 분석해 제공함으로써 일반인도 손쉽게 데이터 분석‧융합을 할 수 있도록 지원한다.

또한 10개 플랫폼의 데이터를 기반으로 사회 현안 등 다양한 주제에 맞춰 분석‧시각화한 데이터와 사례들을 리포트 형식으로 공개해 활용성을 더욱 높였다. 아울러 데이터 지도 서비스 출시에 맞춰 제각기 나뉘어 있던 10개 플랫폼들의 홈페이지 주소를 통일감있게 정비함으로써 이용자의 접근성을 제고했다.

▲ 데이터 지도 서비스 출시와 함께 10개 플랫폼들의 홈페이지 주소를 정비했다.

데이터 3법 개정 시행, 상호간 시너지 기대

한편 국내 데이터 산업계의 숙원으로 여겨졌던 데이터 3법 개정안이 지난 8월 5일부터 본격 시행되면서, 빅데이터 플랫폼 및 센터 구축사업과의 시너지가 기대를 모으고 있다.

데이터 3법 개정안은 개인정보보호법·정보통신망법·신용정보법 개정안을 통칭하는 것으로, 데이터를 안전하게 보호하면서도 활용성을 높이는 것이 골자다. 가령 데이터를 활용하는 기업에서는 개인정보처리자의 책임을 강화하고 보다 강력한 안전조치 사항을 준수하도록 하는 한편, ‘가명정보’ 개념을 신설해 기존에는 활용할 수 없었던 민감정보들도 적절한 비식별 처리를 거친다면 활용할 수 있도록 했다.

데이터 3법 개정안에 대해 산업계의 반응은 매우 호의적이다. 특히 지난 2018년에 데이터 3법 개정안이 구체화된 이후부터 관련 비즈니스를 준비해왔던 기업들은 저마다 발 빠른 행보를 보이고 있다. 빅데이터 플랫폼 및 센터 구축사업에 참여한 기업들 역시 플랫폼을 통해 생산‧수집한 데이터들을 데이터 3법 개정안과 결합해 활용할 수 있는 방법을 찾기 위해 동분서주하고 있다.

하지만 데이터 3법 개정안이 시행된 지 한 달이 지난 시점까지 아직 이렇다할 성과는 나오지 않은 상황이다. 국내 데이터 전문기업 A사 관계자는 “데이터 3법 개정안을 통해 고객의 민감정보를 비식별화해 사용할 수 있게 됐지만, 아직 이를 적극적으로 사용하려는 기업은 없는 것으로 알고 있다”며, “개정안이 시행되기는 했다지만 기업 입장에서는 데이터를 어디까지 자유롭게 사용해야 할지 몰라 서로 총대를 미루며 눈치를 보는 상황”이라고 밝혔다.

실제로 관련 기업들은 데이터 3법 개정안에서 지켜야 하는 규범과 가이드라인이 구체적으로 나오기 전까지는 최대한 수비적으로 접근하겠다는 태세다. 한때 데이터 3법 개정안이 고객의 민감정보들을 기업 마음대로 써먹으려는 ‘개인정보 도둑법’이라는 멸칭을 들었던 만큼, 개정안을 활용하는 기업에서는 단 한 번의 실수도 용납되지 않기 때문이다.

A사 관계자는 “데이터 3법 개정안은 굉장히 힘들고 지난한 시간을 거쳐 태어난 만큼 산업계에서는 매우 조심스럽게 접근하고 있다. 데이터를 가지고 새로운 원동력을 만들고자 하는 취지를 이해하고 이에 대한 국민적 합의를 무너뜨리지 않기 위해서는, 무엇보다 데이터를 안전하게 잘 취급하고 활용할 수 있게끔 정부 차원에서 적절한 가이드라인을 제시해줘야 할 것”이라고 덧붙였다.

사실 빅데이터 플랫폼 및 센터 구축사업은 데이터 3법 개정안이 통과되기 전부터 시작된 만큼, 데이터 3법 시행과는 무관하게 운영 가능하도록 만들어졌다. 만약 데이터 3법 개정안 통과가 무산되더라도 시스템 운영에는 문제가 없도록 하기 위해서다. 하지만 데이터 3법 개정안이 통과되자 관련 기업들은 빅데이터 플랫폼에 구축된 데이터들을 새로운 제도 안에서 어떻게 활용하고 결합할 것인지를 고민하기 시작했다.

빅데이터 플랫폼 및 센터 구축사업과 데이터 3법 개정안이 모두 데이터 생태계 활성화라는 같은 목표를 가지고 추진된 만큼, 향후 이들 간의 시너지를 통해 국내 산업계가 퀀텀 점프를 이룰 수 있도록 정부의 리드와 민간의 협력이 이뤄져야 할 시점이다.

민간 수요로 자생 가능한 플랫폼 구축이 목표
오성탁 한국정보화진흥원 지능데이터본부장


Q. 코로나(COVID-19)로 인해 전 세계가 큰 타격을 입었다. 사업 추진에 어려움은 없었는지?

다행히 이번 사업 추진에 큰 영향은 미치지 않았다. 사업 자체가 대면을 요구하지 않고, 참여한 기업들 역시 IT 기술에 해박한 곳들이 많아 코로나에 의한 변화에 빨리 적응한 것으로 보인다. 업무 체제가 온라인으로 전환됐음에도 비대면 업무 체계를 빠르게 마련하고 활용했다. 확실히 IT 분야 종사자들은 시스템과 기술이 정상적으로 작동한다면 굳이 사람하고 지속적으로 접하지 않아도 되다보니, 코로나로 인한 변화에 금방 적응한 것으로 보인다.

올해 사업 추진 성과를 보자면 전반적으로 빅데이터 플랫폼 및 센터들이 보유한 데이터 양도 크게 늘었고, 데이터 지도를 마련해 이를 필요로 하는 기업들의 접근성도 높였다. 당초 목표로 삼았던 것의 약 70%에는 도달한 것으로 보인다. 하반기에도 각 플랫폼들이 양질의 데이터 확보를 가속화하고 거래가 활성화될 수 있도록 더욱 노력하겠다.


Q. 특히 높은 성과를 거둔 플랫폼이 있다면?

먼저 10개 플랫폼들이 모두 우수한 성과를 거두고 있다는 점을 말하고 싶다. 지난해 사업 초기부터 참여기업들이 서로 정보를 공유하면서 이번 사업을 통해 얻을 수 있는 메리트를 확인한 만큼, 모두가 빅데이터 플랫폼의 완성과 활성화에 많은 노력을 쏟고 가시적인 성과를 만들어내고 있어 매우 고무적이다.

개인적으로 특히 인상깊은 플랫폼을 꼽자면 유통과 금융 분야다. 유통 분야에서는 KDX한국데이터거래소를 만들었는데, 벌써부터 많은 회원을 확보하고 활발히 데이터를 거래하고 있다. 데이터 유통 생태계를 만들고 활성화시키려는 의지가 강하다고 생각한다.

금융 분야에 대해서는 다루는 데이터들의 활용성이 높다는 점을 말하고 싶다. 금융 분야의 주관기관은 비씨카드인데, 카드 매출 데이터나 이용 데이터들이 소비자들의 트렌드를 직관적으로 보여주다보니 시장에서의 수요가 매우 높다. 이를 운영기관 측에서도 인지하고 있어 매우 고무적이며, NIA에서도 금융 데이터를 활용한 이종 데이터 결합 상품이 나올 수 있도록 지속적으로 지원하고 있다.


Q. 내년 사업 추진 계획과 목표는?

전체적인 생태계를 완성해 추가적인 지원 없이도 자생할 수 있는 시스템을 갖추는 것이 목표다. 각각의 플랫폼들이 양질의 데이터를 생산하고 공유‧공개할 수 있도록 지속 가능한 동기를 부여하고, 이를 위해 데이터를 필요로 하는 수요 기업들이 10개 플랫폼에 꾸준히 관심을 보일 수 있는 체계를 만들 계획이다. 또한 지금은 플랫폼들이 제각기 분야별로 나뉘어 있는데, 내년에는 서로 간에 시너지를 창출할 수 있도록 플랫폼과 플랫폼, 플랫폼과 센터, 센터와 센터 사이의 교차(cross)를 지원하고자 한다.

또한 올해 공개한 ‘데이터 지도’처럼 각각의 센터들이 보유하고 있는 데이터들을 한 곳에서 보여줄 수 있게끔 할 계획이다. 어떤 데이터들이 어디에 있는지를 한 번의 검색만으로 쉽게 파악하고, 메타데이터의 표준 작업 등을 통해 서로 다른 센터의 데이터들을 손쉽게 비교하고 결합할 수 있게 되기를 바란다. 더 나아가면 향후 공공데이터 포털과도 연계해 공공과 민간 데이터를 한 곳에서 모두 아우를 수 있는 통합 포털의 출범을 생각하고 있다.

저작권자 © 컴퓨터월드 무단전재 및 재배포 금지