권영우 데이터거래사

                                        권영우 데이터거래사
                                        권영우 데이터거래사

권영우 데이터거래사

. 한국인공지능협회 인공지능연수원장
. 한국경영기술지도사회 인공지능사업단장
. 대한민국산업현장교수
. 경영학박사(디지털경영전공)
. (前)경기대학교 산학협력단 교수

[컴퓨터월드]

한국형 독자 AI 파운데이션 모델의 출범과 의미

전 세계적으로 인공지능(AI) 패권 경쟁이 격화되는 가운데, 한국이 AI 3대 강국으로 도약하기 위한 핵심 전략이 본격화되고 있다. 과학기술정보통신부가 올해 6월부터 추진해 온 ‘독자 인공 지능 기초 모형(AI 파운데이션 모델)’ 사업은 8월 네이버클라우드, 업스테이지, 에스케이텔레콤, 엔씨에이아이, 엘지경영개발원 AI연구원 등 5개 정예팀 선정을 통해 실질적 궤도에 올랐다.

이번 프로젝트는 단순한 기술 개발을 넘어 ‘소버린 AI(Sovereign AI)’ 구축이라는 국가적 목표를 담고 있다. 소버린 AI는 자체 데이터, 인프라, 인력 및 비즈니스 네트워크를 사용하여 AI를 구축하는 국가의 역량 또는 독자적 AI 모델을 의미한다. 영어와 서구권 문화 중심의 챗GPT, 제미나이 같은 글로벌 AI 모델과 차별화된 한국형 AI 생태계 구축이 핵심이다.

한국 정부는 2027년까지 총 5,300억 원 규모의 지원을 통해 글로벌 프런티어급 AI 모델 대비 95% 이상 성능 확보를 목표로 하고 있다. GPU 지원에 4,500억 원, 데이터 확보에 628억 원, 인재 채용 지원에 최대 250억 원이 투입될 예정이다.
 

성공의 핵심: 양질 데이터 확보와 거래 시장 활성화

AI 파운데이션 모델의 성능을 좌우하는 가장 중요한 요소는 학습 데이터의 품질과 다양성이다. 특히 한국어 특화 AI 모델 구축을 위해서는 한국 문화와 맥락을 담은 고품질 데이터셋이 필수적이다. 현재 정부는 국가기록원, 국사편찬위원회, 통계청, 특허청, 한국문화정보원 등 공공기관 보유 데이터 및 전문서적, 시험문제 등을 관련 기관과의 협의를 거쳐 제공할 계획인데, 이는 시작에 불과하다.

진정한 경쟁력을 갖춘 AI 모델 구축을 위해서는 민간이 보유한 다양한 산업 특화 데이터, 실시간 생성되는 소셜 데이터, 전문 분야 지식 데이터 등이 필요하다. 이러한 데이터는 시장 메커니즘을 통한 거래와 유통이 활성화돼야 효율적으로 확보할 수 있다.

데이터 거래 활성화는 단순히 데이터 확보 차원을 넘어 시장 검증 시스템으로서의 역할이 중요하다. 시장에서 거래되는 데이터는 수요자 검증을 거친 양질의 데이터일 가능성이 높으며, 가격 형성 과정에서 데이터의 실질적 가치가 반영된다. 또한 지속적인 데이터 거래를 통해 AI 모델 학습에 필요한 최신 데이터를 안정적으로 확보할 수 있는 생태계가 조성된다.
 

데이터거래사 제도의 전략적 활용 방안

데이터 거래 활성화를 위해서는 전문성을 갖춘 중개기관의 역할이 필수적이다. 현재 데이터거래사 자격제도가 운영되고 있지만, AI 파운데이션 모델 구축이라는 국가적 프로젝트와 연계한 전략적 활용이 미흡한 상황이다.

데이터거래사는 ‘데이터 산업진흥 및 이용촉진에 관한 기본법 및 관련 시행령’에 근거해 데이터 거래에 대한 전문적인 업무를 수행하는 전문가를 말한다. 데이터거래사는 데이터 가치 평가, 품질 검증, 거래 중개, 법적 리스크 관리 등 전문적 서비스를 제공할 수 있는 핵심 인력이다. 특히 AI 학습용 데이터의 경우 개인정보보호, 저작권, 데이터 편향성 등 복합적 이슈가 존재하므로, 이를 체계적으로 관리할 수 있는 전문가의 역할이 중요하다.

정부는 데이터거래사를 활용한 체계적 데이터 거래 시스템 구축을 위해 다음과 같은 정책 방향을 적극 고려해야 한다.

첫째, AI 파운데이션 모델 구축 프로젝트와 연계한 데이터거래사 전문화 교육 과정을 신설하고, AI 학습용 데이터 특성을 반영한 별도 인증 체계를 도입해야 한다. 둘째, 올해 8월 정부의 ‘AI 파운데이션 모델’ 사업에 선정된 5개 정예팀의 데이터 수요와 공급자를 매칭하는 전담 데이터거래사 풀을 구성하고, 이들이 체계적으로 데이터 거래를 중개할 수 있는 플랫폼을 구축해야 한다. 이를 통해 정예팀들은 각자의 AI 모델 개발 전략에 맞는 특화된 데이터를 효율적으로 확보할 수 있다.
 

전담 조직 설립과 거버넌스 체계 구축

데이터 거래 활성화를 위한 체계적 접근을 위해서는 전담 조직 설립이 필요하다. ‘한국 AI 데이터거래 진흥원(가칭)’ 같은 전담기관을 통해 데이터 거래 시장의 투명성과 신뢰성을 지금보다 한 단계 더 고도화해 나가고, 산업별로 보다 세분화된 데이터 거래 표준 및 가이드라인을 제정해야 한다.

이 조직은 지금보다 강화된 데이터 품질 인증, 가격 산정 기준 마련, 거래 분쟁 조정, 데이터거래사 관리 등의 기능을 수행하며, AI 파운데이션 모델 구축 프로젝트의 데이터 전략을 총괄해 나가는 것이 바람직하다. 또한 국제적 데이터 거래 표준과의 호환성을 확보해 글로벌 데이터 시장 진출 기반도 마련해야 한다.
 

지속가능한 생태계 구축을 위한 제언

한국형 독자 AI 파운데이션 모델의 성공은 일회성 프로젝트가 아닌 지속가능한 생태계 구축에 달려 있다. 이를 위해 데이터 거래 시장이 AI 모델 개발의 핵심 인프라로 자리 잡아야 한다. 우선 데이터 공급자에 대한 고도화된 인센티브 체계를 마련해 양질의 데이터가 지속적으로 시장에 공급될 수 있도록 해야 한다. 또한 중소기업이나 스타트업도 데이터 거래를 통해 AI 개발에 참여할 수 있는 기회를 제공해 AI 생태계의 저변을 확대해야 한다.

마지막으로 데이터 주권과 보안을 고려한 거래 시스템을 구축해 핵심 데이터의 해외 유출을 방지하면서도 필요한 해외 데이터는 안전하게 도입할 수 있는 균형점을 찾아야 한다.

한국형 독자 AI 파운데이션 모델 프로젝트는 이제 시작 단계다. 데이터 거래 활성화를 통한 체계적 데이터 확보 전략이 이 프로젝트의 성공과 한국의 AI 강국 실현을 좌우할 핵심 요소가 될 것이다.

저작권자 © 컴퓨터월드 무단전재 및 재배포 금지