주목받는 ‘데이터거래사’, 데이터 시대의 주인공 될 것

[컴퓨터월드] 데이터 시대가 본격 열렸다. 데이터는 디지털 시대의 핵심 자원이자 혁신과 생존의 아이콘으로 떠올랐다. 한 마디로 데이터를 잘 유통시키고, 활용하는 것이 디지털 시대의 핵심 가치라는 것이다. 지난 2021년 데이터 시장 규모는 약 23조 원이고, 연평균 12.6%라는 성장세로 성장가도를 달리고 있다고 한다. 특히 데이터 판매 및 제공 서비스업 매출은 67%로 급증하고 있다고 한다.

그러나 데이터 거래는 불합리한 가격 및 유통채널 부족 등으로 인해 거래 환경이 제대로 성숙되지 못 하고 있는 게 현실이다. 정부는 이에 따라 지난 2021년 10월 데이터 산업 및 이용촉진에 관한 기본법을 제정했고, 지난해 4월부터 시행하고 있다. 이를 근거로 ‘데이터거래사’가 탄생했다. 올해 초 52명의 데이터거래사가 처음으로 배출되기도 했다. 이들은 법에서 정한 데이터 가치평가, 데이터 유통 및 거래 등을 하며 데이터 경제시대에 필요한 역할을 할 것으로 본다.

한 마디로 데이터거래사가 데이터 시대의 주인공이 된다고 할 수 있다. 본지는 이에 따라 데이터거래사와 관련, 어떤 데이터들이 어떻게 거래되고 있고, 거래 시장은 어디이고, 어떻게 유통되고 있는지 또한 각종 제도 및 법적 장치, 데이터거래사 자격은 어떻게 취득할 수 있는지 등에 대해 데이터거래 전문가들을 통해 ‘전문가 강좌’를 연재한다.

1. 거래 및 유통의 핵심 -김상복 거래사-
2. 유통거래 시 법적 쟁점 -문상권 거래사 -
3. 거래의 투명성과 윤리 -김계철 교수 -
4. 거래의 현실과 도전 -양필규 거래사-
5. 거래의 프로세스 –최교순 거래사-
6. 거래 및 유통의 파급효과 -이원재 기술사-

양필규 거래사
양필규 거래사

<주요 약력>
경영학 박사
과학기술정보통신부 데이터거래사 1기
개인정보보호위원회 등 가명정보전문가
과학기술정보통신부, 창업진흥원 외 다수 공공기관 과제 평가위원

 

들어가며

2016년 3월 서울 포시즌스 호텔에서 진행된 이세돌과 알파고의 바둑대결 결과는 인공지능(AI) 프로그램인 알파고의 압도적 승리로 끝났으며 AI 시대의 신호탄이 됐다. 2022년 오픈AI(OpenAI)에 의해 출시된 챗GPT(ChatGPT)는 출시 5일 만에 사용자 수 100만 명을 넘어섰으며, 분야를 떠나 현재 많은 서비스에서 도입했거나 도입이 검토되고 있다.

클라우스 슈와브(Klaus Schwab)가 정의한 3차 산업혁명을 기반으로 디지털, 바이오, 물리학 등 기존 영역의 경계를 허무는 기술혁명인 4차 산업혁명을 목격하고 있다. 1989년 WWW(World Wide Web)이 등장한 이래 30여 년이 아날로그 시대에서 디지털 시대로의 전환의 시기였다면, 지금부터는 디지털 세계에서의 데이터와 AI가 만나 새로운 서비스와 질서가 등장하게 될 것이다.

이 같은 배경으로 2022년 시행된 데이터산업법에 의거한 제1차 데이터 산업 진흥 기본계획에서는 데이터를 AI 기술 발전을 좌우하고 경제·사회 전반의 혁신을 가속화 하는 디지털 경제·사회의 원동력으로 정의하고 있다. 가비지 인, 가비지 아웃(Garbage in, garbage out). 앤드류 응(Andrew Ng) 교수가 말했듯 AI의 성능은 코딩(SW)이 아니라 데이터가 좌우한다. 지금까지의 흐름이 기존 아날로그 경제·사회 체계의 디지털로의 전환이었다면, 앞으로는 갇혀있는 데이터의 개방·공유·유통·융합을 통해 거부할 수 없는 흐름인 4차산업의 새로운 경제·사회 질서를 만들어 갈 필요가 있겠다.

정부도 2021년 23조 원 규모의 한국 데이터 시장을 2027년까지 50조 원 규모로 확대하고자 하는 계획과 투자를 진행하고 있다. 여기에서는 데이터 거래의 현황과 거래 활성화를 위한 시사점을 살펴보고자 한다.


거래의 정의

거래의 사전적 의미는 ‘주고받음 또는 사고팖’으로 정의된다. 거래에는 거래비용이 수반된다. 거래비용은 재화 또는 서비스를 거래하는 데 수반되는 모든 비용을 말하며, 단순히 거래 대상 물건의 가치에 대한 가격뿐 아니라 거래 전 정보 수집 단계, 협상 단계, 계약의 준수 및 감시 비용, 계약의 불완전성 등 계약 전반의 모든 비용을 포함한다.

디지털 데이터의 경우 실물 상품과 달리 눈으로 확인이 어렵고, 상품으로서의 데이터 자체에 가치가 내재되기보다 데이터를 가져다 쓰는 쪽에서 가치가 만들어진다는 특징이 있다. 또한 본연의 비즈니스를 위해 수집, 가공된 데이터를 다른 비즈니스에서 활용하기 위해서는 추가 가공이 필요하며 이로 인한 품질 이슈가 수반되게 된다. 디지털 데이터의 많은 부분을 차지하고 있는 개인데이터의 경우 엄격한 법규제에 따른 또 다른 거래비용이 발생하게 된다.


시장의 정의

시장(market)이란 여러 가지 상품을 사고파는 장소로 정의된다. 시장이 형성되기 전 자급자족의 사회에서는 부족한 물품이나 잉여 생산품을 물물교환을 통해 거래했다. 물물교환의 형식도 내가 필요한 물건이, 또 나의 물건을 필요로 하는 사람이 어디에 있는지 일일이 찾아다닐 수가 없기에 장소와 시간을 정해 거래하는 ‘시장’이 만들어지게 됐다.

산업통상자원부에 따르면 전체 유통업체 매출 중 온라인이 차지하는 비중이 2023년 오프라인을 추월했다. 금융기관의 경우 온라인 비대면 채널 거래가 영업점에서의 대면 거래를 뛰어넘은 지 오래다. 30년이 채 되지 않는 한국 인터넷의 역사를 돌이켜 볼 때 놀랄만한 속도라 할 수 있겠다. 데이터 거래 시장의 경우는 어떠할까?


데이터 거래, 시장 현황

한국데이터산업진흥원은 2015년부터 데이터산업 백서를 매년 발간하고 있다. 2023년 데이터산업 백서에 따르면 미국의 데이터 시장 규모가 2023년 3,685억 달러로 전 세계에서 가장 크며, 4년간 17.4%의 연평균 성장률을 보이고 있다. 이에 반해 한국의 데이터 산업 시장 규모는 2022년 약 25조 원으로 5개년 연평균 성장률은 12.6%로 추산되고 있다.

국내 데이터산업 시장에는 데이터 처리 및 관리 솔루션 개발·공급업 시장, 데이터 구축 및 컨설팅 서비스업 시장, 데이터 판매 및 제공 서비스업 시장을 모두 포함하고 있으며, 데이터 판매 및 제공 서비스업 시장은 2022년 12조 5,235억 원으로 산정하고 있다. 인구수를 감안하더라도 한국의 데이터 시장 규모가 선도국에 비해 크게 차이가 남을 알 수 있다.

미국은 데이터 유통 분야의 선도국가로 그 중심에는 데이터 브로커가 합법적으로 활동하고 있다. 데이터 브로커는 정부, SNS의 공개 정보, 기업 및 다른 데이터 브로커로부터 구매 등을 통해 데이터를 수집, 연계, 가공해 판매한다.

미국이 데이터 유통 분야의 선도국가가 된 데에는 옵트아웃(Opt-out) 제도가 자리 잡고 있다. 옵트아웃 제도는 선택적 거부 방식으로 개인정보 영역에 있어서는 원칙적으로 수집, 활용이 가능하나 정보 주체의 거부가 있을 경우에는 중지해야 하는 방식으로, 포괄적으로는 금지된 것 외에는 모두 가능한 방식을 말한다.

옵트인(Opt-in) 제도는 그 반대로 명시적인 동의, 가능하다고 나열된 것 외에는 모두 금지되는 방식을 말한다. 이 같은 차이로 인해 새로운 산업 영역인 데이터 산업에 있어 미국과 한국은 출발선과 확장 가능한 영역의 범위에 있어 큰 차이가 있으며, 민간 주도의 미국의 데이터 산업과 정부 주도의 한국의 데이터 산업으로도 대비가 된다.


개인정보와 가명정보

2011년 IDC는 디지털 데이터 중 개인 데이터의 비중이 75%에 달한다고 추산한 바 있다. 또한 사회·경제·생활의 많은 부분이 디지털 세계로 옮겨가고, 스마트폰의 보급과 온오프라인의 결합으로 개인 데이터의 비중이 증가하고, 디지털을 통해 개개인이 누릴 수 있는 편익도 증대되고 있다.

한국은 2020년 8월 데이터3법(개인정보보호법, 신용정보법, 정보통신망법) 시행을 통해 기업 내에 갇혀 있던 개인정보를 정보주체의 동의에 기반한 마이데이터를 통해 활용할 수 있도록 하고, 개인정보를 가명 처리한 가명정보를 통해 기업이 활용할 수 있도록 법제도적 기반을 마련했다. 헌법 제17조 모든 국민은 사생활의 비밀과 자유를 침해받지 아니한다. 개인정보는 헌법에 명시된 국민의 기본권의 영역으로 엄격한 법률적 보호를 받고 있다. 2차 산업혁명을 이끈 석유와 같이, 4차 산업의 원유로 비유되는 데이터의 활용과 데이터 생태계 구축을 위해 정부에서도 많은 노력을 기울이고 있다.

신용정보법에 의거한 금융 분야 마이데이터는 본허가 69개 사, 허가심의 중 30개 사이며, 최근 개정 시행된 개인정보보호법에 의거한 비금융분야 마이데이터도 25년 시행을 앞두고 준비 작업 중에 있다. 금융·비금융 마이데이터 모두 API 기반의 전송 항목 및 체계가 정부 주도로 진행이 되고 있다.

가명정보의 경우 개인정보처리자간의 결합은 신용정보법에 의한 데이터전문기관, 개인정보보호법에 의한 결합전문기관에서만 결합, 활용이 가능하다. 전 세계에서 유일한 한국만의 제도로 알려져 있다. 현재 데이터전문기관은 12개, 결합전문기관은 24개 기관이 지정이 돼 있다.

2023년 7월 금융위원회 보도자료에 따르면 23년 6월 말까지 데이터전문기관에서의 가명정보결합은 총 287건이며, CSS(신용평가시스템) 개발이 42.2%로 가장 높은 비중을 차지하고 있으며, 결합 건수 또한 증가추세에 있다. 외부데이터와의 결합을 통한 신용평가모델 고도화 및 대안신용평가는 이통3사가 신용평가사를 설립할 정도로 비금융기관에까지 확대가 되고 있다.

2023년 7월 관계부처합동 가명정보 활용 확대방안에서 23년 6월 기준 일반 51건, 금융 287건, 총 338건 결합이 완료됐고, 53건이 진행 중이라 밝힌 바 있다. 금융 분야의 결합이 압도적으로 많은 것을 볼 수 있으며, 그 내용 또한 선도사례 등으로 살펴볼 때 비금융 분야는 금융 분야에 비해 공익적 성격의 결합이 많은 부분을 차지하고 있다.


데이터거래소

거래비용을 줄이기 위해서는 손쉽게 필요한 상품의 공급자와 수요자를 찾을 수 있고, 거래의 신뢰를 확인하기 용이한 거래의 장소, 시장이 필요하다. 데이터거래소는 디지털 데이터를 거래하기 위한 디지털 플랫폼 형태의 거래소가 대부분이며, 한국거래소와 같이 법률에 근거해 설립된 기관이 아닌, 시장과 같은 역할을 하고자 만들어진 플랫폼 성격의 장소라 할 수 있다.

국내 데이터 거래소는 공공데이터포털, 금융데이터거래소 등 공공기관이 운영하는 거래소, 정부지원·민간운영 형태의 빅데이터 플랫폼 및 센터, 한국데이터거래소 등 민간운영 거래소, 플랫폼 형태는 아니지만 데이터 공급역할을 하는 그랜데이터와 같은 민간데이터댐으로 구분해 볼 수 있다.

수요자 측면에서 데이터는 구매 후 바로 이용할 수 있는 일반 공산품과 달리, 구매 후에도 비즈니스 및 서비스에 적용하기 위한 추가가공 및 공수, 노력을 필요로 하게 된다. 거래 데이터 자체만으로는 가치가 만들어지지 않는다는 것이다. 데이터 공급자 측면에서 데이터 판매업은 기존에 영위하던, 데이터의 입수경로가 되는 본연의 비즈니스가 아닌 새로운 비즈니스에 해당돼 공급에서부터 가치 창출까지의 기존 완전완비제품에 해당하는 서비스를 제공할 만한 준비가 부족한 상태이다. 데이터 산업이 생태계로 발전하기 위해서는 오픈이노베이션과 같이 최종가치 관점에서 분절된 각 단위의 유기적인 소통과 협업이 필요하다.


데이터 거래 활성화를 위한 제언

첫째, 분야별 성공사례 발굴이 필요하다. 금융 분야 가명정보결합의 대세로 자리 잡은 대안신용평가는 2020년 데이터3법이 시행되기 전부터 준비해 법시행이 되자마자 외부데이터결합을 통한 카카오뱅크의 중금리 상품의 성공이 첫 사례라 할 수 있다. 각 산업에는 해당 산업의 혁신을 이끄는 리딩 컴퍼니와 팔로워가 있다. 리딩컴퍼니는 각 분야에서 시장을 이끌어가는 선도기업을 뜻하며, 혁신에 따른 시장에서의 성공과 성공에 따른 충분한 투자 여력이 선순환을 만들게 된다.

경영에는 유한한 리소스의 제약으로 인한 투자 우선순위가 있으며, 아직 이렇다 할 성공사례가 없는, 투자에 따른 성과를 담보할 수 없는 리스크를 감수할 기업은 그 수가 많지 않을 것이다. 때문에 정부 주도의 선도사례 발굴에 예산지원이 이뤄지고 있으나, 보다 창의적이고 확장성이 높은 민간 주도의 혁신을 위해서는 분야별 리딩 컴퍼니와 혁신기업들의 변화된 비즈니스 환경, 게임의 룰에 대한 보다 많은 관심이 필요하겠다.

둘째, 데이터 활용에 대한 인식 제고가 필요하다. 디지털데이터의 많은 부분이 개인정보이며, 한국의 개인정보는 엄격한 법규제의 적용을 받고 있다. 인터넷이 등장한 이래 2010년대 중반부터 애플, 알파벳, MS, 아마존, 메타 등 미국의 디지털 플랫폼 기업이 글로벌 시가총액 TOP 10에 포진하고 있다. 이들 기업은 일찍이 시공간의 제약이 없는 디지털 환경과 데이터 활용이 자유로운 여건하에서 전 세계를 시장으로 비즈니스 모델을 만들어 왔다.

기업의 활동은 경제적 가치(EV·economic value) 추구로 대표되지만, 경제적 가치를 사회적 가치(SV·social value)와 칼로 두부를 자르듯이 구분해 낼 수 있을 것인가. 범죄 활동을 제외한 모든 경제적 가치 추구 활동은 거래상대방에게 그 대가로서의 교환가치를 창출하게 된다. EV와 SV는 칼로 두부 자르듯이 구분할 수 있는 것이 아니다.

이런 측면에서 개인 데이터의 활용을 무조건적으로 금기시하는 것은 새로운 미래에 얻을 효익을 전면적으로 부정하는 것과 다르지 않을 것이다. 현재 누리고 있는 편익의 대부분은 불과 얼마 되지 않은 과거에는 존재하지 않았던 것이며, 급속한 기술의 발전 속도로 인해 멀지 않은 미래 또한 마찬가지 상황일 것이다.

셋째, 데이터 거래 시장 형성을 위해서는 거래비용 감소를 위한 모든 활동이 필요하다. 앞서 언급했듯이 거래비용은 거래에 수반되는 모든 비용을 말한다. 플랫폼이 네트워크 효과에 의한 승자독식 구조를 가지게 되는 것도, 거래의 누적과 거래경험자의 평가에 의한 신뢰 형성에 따른 거래비용 감소가 중요한 요인이 된다. 국내 데이터거래 시장 형성을 위해 정부에서는 빅데이터 플랫폼, 데이터 바우처, 선도사례 발굴 등 다양한 노력을 진행하고 있다. 거래 형성에는 지불하는 대가에 대한 효익을 얻을 수 있다는 믿음, 신뢰가 필수적이다. 하지만 애초 데이터공급자 입장에서 수집, 가공된 무형상품이라는 데이터의 특성상 수요자의 입맛에 맞는, 데이터 구매를 통해 수요자가 얻고자 하는 바를 달성하기 위해서는 거래 과정에 있어서 많은 관여가 필요하게 된다. 마케팅 용어로 데이터 상품은 고관여 상품에 해당한다.

국내 민간데이터댐 1호인 그랜데이터 2023년 설명회에서 금융보안원은 금융데이터거래소에서의 데이터 검색, 전자계약, 결제, 커뮤니케이션, 안전한 데이터 송수신, 원격분석환경, 데이터 결합 등 원스톱(One-stop) 기능을 소개한 바 있다. 데이터 허브 네트워크에 참여한 모든 기업의 개별 네트워크 구축을 지원하고 편리하고 안전한 거래 및 데이터 송수신을 위한 중개 인프라를 추구하는 것으로 보인다. 눈에 보이지 않는 상품, 그리고 활용 목적이 사용하는 곳마다 다르다는 데이터의 특성상 거래에 수반되는 비용을 최대한 줄여주는 노력이 필요하겠다.

넷째. 데이터 거래사의 활용과 역할이다. 전 세계 데이터 산업의 선도 국가인 미국은 민간주도의 데이터 브로커가 중추적인 역할을 하고 있다. 한국에서는 2022년 시행된 데이터산업법에서의 데이터 거래사가 있으며, 2023년 4기까지 총 162명의 데이터 거래사가 양성됐다. 데이터는 무형의 고관여 상품이다. 아직 분야별 많은 거래 사례가 있지 않아 시장 전반에 거래에 대한 신뢰 형성이 이뤄지지 않은 상태로, 데이터 거래에 관심과 전문성을 가진 거래사를 적극 활용하고 참여를 유도할 필요가 있겠다. 이를 위해 정부 사업에서부터 일정 부분 참여를 의무화해 사례를 만들고, 경험을 통해 제도를 다듬어 나갈 필요가 있을 것이다.

한편으로 거래사 간의 활발한 소통과 연결을 위한 정기적인 장을 마련할 필요가 있겠다. 이종산업, 이종데이터간 융합의 시대에 한국의 데이터 시장을 개척해 보겠다는 뜻을 가진, 각 분야에서의 전문성을 가진 데이터거래사 간의 활발한 소통과 이에 대한 지원이 필요해 보인다.

참고문헌
1. 관계부처합동(2023), “제1차(’23년~’25년) 데이터 산업진흥 기본계획(안)”
2. 한국데이터산업진흥원(2023), “2023 데이터산업 백서”
3. 정용찬(2021), “데이터 유통산업의 현황과 전망”, 코스콤
4. 정준화・박소영(2022), “데이터 거래 활성화를 위한 거래소・거래사・크롤링의 현황과 개선과제”, 국회입법조사처
5. 이주희(2021), “가명정보 결합에 의한 재식별화 방지에 관한 비교법적 연구 - GDPR과 CCPA 및 개정 개인정보보호법 비교를 중심으로”, 국제거래와 법
6. 금융위원회(2023), “빅데이터 생태계의 토대인 데이터 결합의 저변을 확대해나가겠습니다.”
7. 관계부처합동(2023), “가명정보 활용 확대방안”
8. 그랜데이터(2023), “데이터 거래소를 이용한 데이터 유통 방안”, https://www.youtube.com/watch?v=peTV17HVBzQ

관련기사

저작권자 © 컴퓨터월드 무단전재 및 재배포 금지