권순률 데이터거래사
[컴퓨터월드]
1. 인공지능 전환 시대의 디지털 촉매, 데이터 경제 개요
우리는 인공지능 전환 시대에 살고 있다. 온디바이스 AI 기반 소프트웨어를 활용해 맞춤형 초개인화 서비스를 이용하고, LLM(Large Language Model) 기반 AI 에이전트를 통해 반복 작업을 지능적으로 자동화해 처리한다.
지능형 서비스의 근간에는 바로 ‘데이터’가 존재한다. 지능형 서비스는 엣지 디바이스 상에 설치된 인공지능 모델의 추론 기능에 따라 제공되므로, 모델의 추론 성능이 지능형 서비스의 가치를 결정하는 중요한 요소라 할 수 있다. 따라서 지능형 서비스의 가치를 향상시키기 위해서는 인공지능 모델이 높은 수준의 예측 및 분류 능력을 보유할 필요가 있으며, 실제 세계와 유사한 수준의 다양성과 유효성을 보유한 고품질 데이터를 확보하는 것이 무엇보다 중요하다.
한편 우리나라는 2022년 4월 20일 데이터산업법(데이터 산업진흥 및 이용촉진에 관한 기본법)을 시행한 이후 데이터 생산, 거래 및 활용 촉진의 기반을 조성하기 위한 다양한 제도적 방안을 마련해 오고 있다.
예를 들어 플랫폼 측면에서는 공공데이터포털, 데이터거래소를 통해 공공, 민간데이터를 이용할 수 있는 시스템을 제공하며 데이터 분석을 위한 데이터안심구역을 지정해 운영하고 있다. 데이터 품질 측면에서는 데이터 품질인증(DQ인증) 및 데이터 가치 평가 제도를 통해 기업이 보유한 데이터의 품질 수준을 판단하고, 경제적 가치를 금액으로 평가함으로써 데이터 거래 환경 개선을 지원하고 있다.
또한 2024년 과학기술정보통신부는 ‘국가 데이터 인프라’ 구축 전략을 통해 품질이 확보된 데이터를 신뢰 기반으로 자유롭게 교환할 수 있는 통합 데이터 카탈로그 플랫폼을 설계하고 현재 ‘원윈도우’라는 이름으로 서비스를 제공함으로써 데이터 경제 성장을 견인하고 있다.
2. 데이터 산업 현황 분석
2025년 한국데이터산업진흥원에서 배포한 ‘2024년 데이터산업 백서’에 따르면, 국내 데이터산업 시장 규모는 2023년 13조 3,555억 원에서 2025년 27조 1,513억 원 규모로 성장할 것으로 보인다. 연평균 성장률(CAGR, Compound Annual Growth Rate)은 12.7%로 지속적인 성장세를 이어갈 것으로 조사됐다.
반면 데이터 연관 산업의 시장 규모가 성장하는 것과 달리, 데이터 유통 및 거래 활성화를 촉진할 데이터거래소는 기대와 다른 양상을 보이고 있다. 2020년 5월 금융기업과 핀테크 기업들은 데이터를 사업화할 모범 사례를 만들기 위해 데이터 거래소를 출범시켰다. 그러나 4년이 지난 현재까지 누적된 데이터 거래량은 1만 7,185건에 불과하다. 이는 4년 동안 상품 1개당 평균 1.4건의 거래만 이루어졌다는 의미다.
데이터 산업 시장 규모 통계와 금융 데이터 거래소의 거래 실적 통계는 데이터 경제를 바라보는 서로 다른 관점을 반영한다. 데이터 산업에서는 데이터 기반 비즈니스 모델을 통해 재화나 서비스를 제공하는 기업의 성장성과 수익성이 매우 중요하다. 지능형·맞춤형 서비스에 대한 수요가 증가하면서 관련 시장 규모 역시 확대될 가능성이 크다.
반면 데이터 거래 관점에서는 거래 참여자의 비즈니스적 이해관계가 거래 성사 여부를 좌우하는 핵심 요소다. 또한 데이터는 특성상 무형성과 비가시성을 갖고 있어 거래 과정에서 다양한 리스크와 불확실성이 발생할 수 있다. 이러한 요소는 이해당사자에게 불이익을 초래할 가능성이 있어 데이터 거래를 주저하게 만드는 요인으로 작용한다.
이번 기고에서는 데이터 산업의 현황을 분석한 후, 제도적 측면과 기술적 측면으로 나누어 데이터 거래와 유통을 활성화하기 위해 산업 현장에서 요구하는 실질적인 방안을 제시하고자 한다.
3. 제도적 측면 데이터 거래 유통 활성화 방안
데이터 거래 유통을 활성화하기 위한 핵심 요소 중 하나는 데이터 거래 당사자간의 이해 관계를 조율할 신뢰할 수 있는 제도적 장치를 마련하는 것이다. 이를 통해 거래 과정에서 발생할 수 있는 리스크와 불확실성을 줄이거나 제거할 수 있다.
2024년 과학기술정보통신부는 ‘데이터 표준계약서 활용 안내서’와 ‘데이터 가치평가 안내서’를 배포해 데이터 거래를 위한 제도적 장치를 마련했다. 그러나 산업현장에서 실질적으로 데이터 거래의 신뢰성을 높이려면 추가로 고려해야 할 요소들이 남아 있다.
데이터 표준 계약서 관점에서, 데이터 판매자는 보유 데이터를 데이터 구매자에게 양도하거나 이용을 허락하는 방식으로 계약을 체결할 수 있다. 이후 구매자가 계약서에 명시된 사항을 준수하는지 확인할 수 있도록 관리적·기술적 수단을 마련해야 한다.
예를 들어 판매자가 허락하지 않는 범위에 대해 구매자가 거래한 데이터를 활용해 수익을 창출하려는 행위를 할 수 있다. 그러나 데이터 특성상 판매자의 데이터가 불법적인 영역에 활용되고 있음을 식별하기 위해서는 거래 대상 데이터 특성을 진단할 수 있는 데이터 전문가를 통한 판단이 필요하므로 제 3자적 관점에서 데이터 거래 계약의 유효성을 진단 및 조치할 수 있는 수단을 구체적으로 표준 계약서에 ‘특약 사항’으로 명시하고, 관계 데이터 전문가를 통한 주기적인 진단 프로세스를 수행하는 방법을 고려할 필요가 있다.
데이터 가치 평가 관점에서, 데이터 구매자가 필요로 하는 데이터의 경제적 가치를 금액으로 평가하는 과정에 데이터 품질 수준을 진단할 수 있는 데이터 전문가를 참여시킴으로써 가치평가 결과 산정된 금액의 신뢰성을 확보할 필요가 있다.
예를 들어 데이터 구매자가 데이터를 구매하려 해도 공급 지속성, 안정성, 유효성에 대한 불확실성 때문에 데이터 거래소나 공공데이터포털을 이용하지 않는 경우가 많다. 이는 거래소에서 제공하는 일부 데이터 샘플만으로는 전체 데이터의 통계적 특성(사분위수, 평균 등)을 충분히 파악하기 어렵기 때문이다. 그 결과 거래 금액 산정의 신뢰성이 낮아지고 구매자가 불신을 갖게 된다. 따라서 제3자의 관점에서 신뢰할 수 있는 평가 근거를 제공할 필요가 있다.
4. 기술적 측면 데이터 거래 유통 활성화 방안
데이터 거래 유통을 활성화하기 위한 또 다른 핵심 요소는 상호호환성을 갖춘 표준화된 인터페이스를 적용해 데이터 플랫폼을 설계·구축하는 것이다. 또한 플랫폼에 적재된 데이터를 체계적으로 큐레이션해 고품질 데이터를 유지할 수 있도록 주기적으로 관리하는 것도 중요하다.
데이터 플랫폼 측면에서 민간 분야는 도메인별 데이터거래소가 구축돼 서비스되고 있으며, 공공 분야는 공공데이터포털, 원윈도우가 구축돼 서비스를 제공하고 있다. 하지만 개별 플랫폼 별로 데이터를 구매 및 이용하기 위한 인터페이스가 서로 달라 상호호환되지 않는 문제점이 존재해 데이터 결합을 통한 부가가치 창출에 제약 사항으로 작용하는 상황을 해결할 필요가 있다.
예를 들어 A 거래소는 REST API 인터페이스를 통해 데이터를 기계적으로 이용할 수 있도록 제공하는 한편, B 거래소는 API 제공 없이 수작업으로 직접 파일 다운로드를 통해 이용할 수 있는 인터페이스만 제공한다. 이로 인해 소프트웨어를 이용해 서로 다른 거래소 간의 데이터를 수집해 결합하는 과정에서 ETL(Extract, Tranfer, Load) 데이터 파이프라인을 별도로 구성하고 처리해야 하는 불편을 감수해야 한다. 이러한 문제점을 해결하기 위해 데이터 거래에 대한 기술 표준을 수립하고, 표준을 준수하도록 함으로써 데이터 플랫폼 간의 상호 운용성과 호환성을 확보할 필요가 있다.
데이터 큐레이션 측면에서 데이터산업법에 따른 데이터 품질인증을 일정 규모 이상의 데이터 거래 시 의무화하고 관계 데이터 전문가가 외부 전문가로 참여해 주기적으로 데이터 품질 진단을 수행함으로써 데이터 내용과 데이터 관리체계를 객관적으로 신뢰할 수 있도록 데이터 기술 진단 프로세스를 수립할 필요가 있다.
산업 현장에서는 IoT 센서, ERP, CRM 등 다양한 정보처리체계에 의해 생산되는 데이터가 정작 데이터 수집 관리체계의 부재로 인해 다크 데이터로 방치되거나 사라지고 있다. 또한 데이터 파이프라인이 유효하게 구축돼 있지 않아 결측치와 이상치 비율이 높은 데이터가 데이터거래소에 등록되는 경우도 많은 실정이다. 불순도가 높은 불량 데이터를 학습 데이터로 사용해 구축된 인공지능 모델이 만약 인간의 생명이나 신체, 재산과 관련된 분야의 추론 모델로 적용된다면, 그 결과는 어떠할지 생각만 해도 끔찍하다.
데이터 생산, 축적, 관리, 분석 및 활용 전 과정을 통제하고 개선하는 데이터 큐레이션을 통해, 데이터 구매자 입장에서는 데이터의 완전성, 유효성, 적시성, 다양성 등의 특성을 일정 수준 이상 확보했는지 객관적으로 검증받은 결과 데이터를 구매 및 활용하게 돼 데이터 기반 비즈니스 모델의 가치를 극대화할 수 있게 된다. 데이터 판매자 입장에서는 판매할 대상 데이터의 품질 특성을 확보하기 위한 데이터 프로파일링, 데이터 클렌징 작업을 자동적으로 수행하는 데이터 파이프라인, 데이터 플랫폼 구축 및 관리 체계를 수립하게 됨으로써 데이터 공급의 안정성을 확보할 수 있게 된다.
2026년 1월 22일 머지않아 인공지능 기본법이 시행될 예정이다. 인간의 기본권에 중대한 영향을 미칠 ‘고영향 인공지능’의 등장도 멀지 않았다. 고영향 인공지능의 행동 양식은 ‘데이터’를 기반으로 형성된다는 사실을 우리는 잊어서는 안 된다.
참고문헌
과학기술정보통신부, 한국데이터산업진흥원(2024), 데이터 가치평가 안내서
과학기술정보통신부, 한국데이터산업진흥원(2024), 데이터 표준계약서 활용 안내서
과학기술정보통신부, 한국데이터산업진흥원(2025), DQ인증 가이드라인
한국지능정보사회진흥원(2024), 국가 데이터 인프라 개념과 추진 전략
한국데이터산업진흥원(2025), 2024 데이터산업 백서
박성준, 장문기(2024.07.10), “금융데이터거래소 5년차 맞았지만... 데이터 허브로서 의미 없다”, 아주경제, https://www.ajunews.com/view/20240710153808831
임철영(2025.01.13), “금융데이터 활성화 의지 있었나 방치된 데이터 거래소... 한해 거래 고작 1500만원”, 아시아경제, https://www.asiae.co.kr/article/2025011213190463049


