[커버스토리] AI 3대 강국 핵심 전략은 ‘소버린’ (上)
1부 소버린 AI로 한국형 AI 꿈 실현
[컴퓨터월드] 소버린(Soverign)은 ‘자주적인’, ‘주권이 있는’이라는 사전적 의미가 있다. 이를 산업적인 맥락으로 확장하면 클라우드 및 인공지능(AI) 등과 같은 해외 빅테크 중심의 기술 분야에서 자국 기술 개발·운영에 대한 자주성을 가지는 것으로 해석할 수 있다.
최근 새정부 출범으로 ‘소버린 AI’에 대한 관심이 높아지고 있다. 정부가 AI를 미래 먹거리로 보고 AI 분야에 총 100조 원 규모의 투자 계획을 발표한 가운데 업계에서는 소버린 AI 실현을 위한 데이터 활용 범위 기준, 인재 확보 등에 대한 논의가 이어지고 있다. 한편 클라우드 업계에는 2022년 즈음 ‘소버린 클라우드’란 개념이 등장했다. 업계에서는 최근 대두되고 있는 소버린 AI 구현을 위한 기반 인프라로서 소버린 클라우드에 대한 관심과 투자 또한 함께 이뤄져야 한다고 목소리를 높이고 있다.
소버린 AI 정의 놓고 신경전
소버린 AI에 대한 정의는 처한 입장에 따라 제각각이다. 인프라, 데이터, 모델 등 AI 전 과정을 자국에서 이뤄내야 한다는 주장이 있고, 외산 기술이나 제품을 활용해도 통제권을 갖고 있다면 소버린 AI라 할 수 있다는 주장도 있다. 국내에서 이러한 견해 차이는 특히 네이버클라우드와 KT클라우드의 신경전으로 더욱 두드러졌다.
지난 4월 네이버클라우드 김유원 대표는 “외산 기술을 들여와 국산 상표를 붙인다고 소버린 AI가 되는 것은 아니다”라며 KT클라우드가 마이크로소프트(MS)의 기술을 활용하면서 소버린 클라우드, 소버린 AI라 한다며 비판했다. 이에 대해 KT클라우드 최지웅 대표는 “소버린 AI는 기술 국적이 아닌 데이터 주도권이 중요하다”며 “AI가 어떤 실질적 효과를 줄 수 있는가를 중심으로 접근해야 한다”고 반박했다.
이러한 논쟁은 지금까지도 이어지고 있다. IT 업계 관계자들 역시 처한 입장에 따라 소버린을 바라보는 시각에 차이가 있다. 국내에서 자체 기술을 개발해 사업 중인 기업은 네이버클라우드, 외산 기업과 협업하고 있는 기업은 KT클라우드의 손을 들어주는 경향이 강하다.
이에 대한 정부의 명확한 입장은 아직 없는 상황이다. AI에 대한 투자를 강화하면서 소버린 AI의 중요성을 강조하고 있는 상황에서 정부가 소버린에 대한 개념을 정리할 필요가 있다는 지적도 제기된다. 물론 소버린 AI에 대한 명확한 개념 정리에 신중해야 한다는 의견도 있다. 국가가 나서서 개념을 단정하는 행위가 자칫 특정 기업들의 편을 들어줄 수 있다는 우려다.
KOSA 안홍준 본부장은 “양측의 의견 모두 설득력 있어 정부가 너무 선명한 메시지를 내는 것은 바람직하지 않다”며 “KOSA가 제시하고 싶은 개념은 하이브리드 소버린이다. 현재 기술력으로 대체하기 어려운 인프라 부문은 일단 외산을 활용하되 점진적으로 완벽한 소버린 AI를 이루는 것”이라고 말했다.
소버린 AI에 대한 여러 우려 존재
현 정부가 AI 3대 강국으로 거듭나겠다는 목표로 소버린 AI를 강조하고 있다는 점은 확실하다. 그러나 소버린 AI에 대한 부정적인 시각이 있는 것 또한 사실이다. 이미 빅테크 기업들이 그동안 엄청난 투자를 통해 선도하고 있는 분야에 뒤늦게 뛰어들어 경쟁이 가능하겠냐는 것이다.
그럼에도 소버린 AI를 강조하는 데는 여러 이유가 있다. 먼저 국가 주권 및 안보 강화 측면이다. AI 모델이 해외 기업에 의해 개발되고 운영될 경우 민감 데이터가 유출될 가능성이 있다. 특히 국가의 핵심 분야인 군사, 외교 관련 시스템에도 AI가 도입되고 있어 AI 주권 확보가 국가 안보와 직결되는 상황이다.
경제적 주권도 주요 원인으로 꼽힌다. 글로벌 빅테크 AI 모델에 대한 의존도가 높아질수록 이들 기업에 종속될 가능성이 높다. 향후 모델 사용료로 막대한 비용을 청구해도 해결책이 없게 된다.
문화적 독립성도 중요한 요인이다. 글로벌 AI 모델은 주로 영어권이나 서구권의 데이터를 중심으로 학습돼 한국 문화의 특수성을 제대로 반영하지 못하거나 특정 편향을 내포할 수 있다. 반면 소버린 AI를 통해 개발된 모델은 한국어와 한국 문화적 맥락을 이해해 문화적 다양성을 보존하고 AI가 우리 사회에 가치와 규범을 담을 수 있다. 결론적으로 소버린 AI를 통해 한국 문화에 대한 이해, 국가 경쟁력 강화, 주권 확보 등을 이룰 수 있다.
크라우드웍스 김우승 대표는 “특히 공공, 교육, 금융, 제조분야에서는 현장에 맞는 로컬 특화 데이터와 AI 모델이 매우 중요하다. 그런 측면에서 소버린 AI는 ‘한국형 AI 생태계’의 질적 도약을 위한 중요한 기반이 될 것으로 생각한다”고 소버린 AI의 중요성을 강조했다.
그러나 일부 업계 관계자들은 소버린 AI 필요성에 공감하지만, 현실적인 한계와 부작용이 드러날 수 있다는 우려를 표하고 있다. 이들이 얘기하는 가장 큰 우려는 비현실적인 목표 설정이다. 이미 글로벌 빅테크가 선점한 거대언어모델(LLM) 시장에서 경쟁이 되겠냐는 것이다. 포티투마루 김동환 대표는 “가슴으로는 하고 싶은데 머리로 계산해 보면 안 된다”고 밝혔다.
소버린 AI 모델 개발에만 집중하다 보면 기회비용이 발생할 수 있다는 점도 문제로 지적한다. 독자 AI 파운데이션 모델 사업을 중심으로 많은 기업들이 LLM 모델 개발에 집중할 경우 기존에 집중하던 분야에 소홀해질 수 있다는 것이다. 정부가 다방면으로 지원한다고 해도 기업들은 자사 인력과 리소스를 투자할 수밖에 없으며 그 과정에서 LLM 외 다른 분야에서 생기는 비즈니스 기회를 놓칠 수 있다는 우려다.
또한 정부 과제 중심의 개발 구조도 부작용을 초래할 수 있다고 주장한다. 그리드원 김계관 대표는 “지금 같은 구조로는 개발하는 기업이 고객보다 정부 과제 심사자의 의중에 초점을 맞추게 된다”며 “결과적으로 글로벌 경쟁에서 밀리고 한국 공공기관에서만 사용하는 갈라파고스형 결과물이 완성돼 국내 정보화 수준 자체를 후퇴시키는 부작용이 발생할 수 있다”고 우려를 나타냈다.
새로운 비즈니스 기회 창출
소버린 AI 추진은 국내 IT 생태계에 큰 변화를 가져올 것으로 예측된다. 특히 산업계에 새로운 활력을 불어넣어 다양한 비즈니스가 창출될 것으로 기대된다.
정부가 AI 3대 강국을 목표로 100조 원 규모의 예산을 투입하고, 정부 사업들을 추진하는 점은 산업 전반에 긍정적이다. 국내 AI 관련 기업들에게 새로운 프로젝트 참여 기회를 제공해 기술 개발 및 상용화를 촉진할 수 있다. 특히 공공, 금융, 교육 등 영역에서는 현장에 맞는 로컬 특화 데이터가 중요해 한국형 데이터의 중요성도 높아질 것이다.
실질적인 비즈니스 기회 창출도 기대된다. 금융·법률 등 신뢰성이 중요한 산업에 국산 LLM을 중심으로 AI 도입이 확산되고 공공기관에서도 AI 도입이 활발해질 것이다.
또 소버린 AI 구축 경험 자체가 비즈니스로 이어질 가능성도 있다. 현재 AI 선두 국가들이 시장을 주도하고 있는 상황에서 AI 주권을 확보하려는 국가는 우리나라뿐만 아니다. KOSA 안홍준 본부장은 “중동, 유럽 등 일부 지역에서 소버린 AI를 구축하고자 하는 움직임이 있다. 우리나라가 먼저 소버린 AI를 구축하며 확보한 기술력을 내세워 다른 국가들을 지원해줄 수도 있을 것”이라고 말했다.
AI 리터러시에 대한 교육 수요 증가도 기대된다. 소버린 AI를 통해 공공 인프라처럼 국민 누구나 AI에 쉽게 접할 수 있는 환경이 조성되면 사회 전반의 AI 활용도가 높아지기 때문이다.
우리나라는 수십 년간 소프트웨어 분야에 막대한 투자를 해왔지만 국내 소프트웨어 중 해외 시장에서 성공을 거둔 사례는 거의 없는 실정이다. 특히 몇몇 소프트웨어는 정부 지원을 많이 받았음에도 불구하고 해외에서는 쓰이지 않고 국내에서만 활용되고 있다. 이는 곧 소프트웨어 산업의 갈라파고스화를 초래했다.
AI는 소프트웨어의 연장선이다. 소프트웨어는 시장, 사용자, 피드백을 통해 끊임없이 개선되고 진화해야 경쟁력을 갖출 수 있다. 하지만 지금 같은 정부 사업 구조로는 기업이 고객보다 정부 과제 심사자에게 초점을 맞추게 되고, 이런 구조로 만들어진 솔루션은 결국 경쟁력을 갖추기 힘들다.
특히 AI 분야는 특정 기업에 자원을 집중한다고 혁신이 나오는 구조가 아니라고 생각한다. 다양한 인력과 산업, 수많은 기업이 자율적으로 실험하고 경쟁해야 혁신이 나올 가능성이 높다. 단순히 자본을 많이 투자한다고 AI 경쟁력을 갖출 수 있다면 그냥 GDP 순서대로 AI 강국 순위를 세우면 된다.
결국 정부는 소수의 대형 프로젝트를 지원하는 방식이 아니라, 수많은 인재와 기업이 누구나 아이디어만 있으면 서비스를 개발하고 상용화할 수 있도록 환경을 만들어야 한다. 아이디어 발굴, LLM 학습 인프라 제공, 해외 진출 등을 지원하는 ‘AI 서비스 상용화 밸류체인’이 필요한 것이다. 이러한 방식이야말로 민간 솔루션이 스스로 성장하고 글로벌 경쟁력을 갖출 수 있는 생태계 조성의 핵심이다.
“데이터는 많은데 활용할 데이터는 부족하다”
한국형 데이터는 한국의 정서에 맞는 AI를 만들기 위해 구성된 우리나라 독자 데이터로, AI가 우리나라 규범과 가치를 담은 답변을 제공하고 한국인에게 특화된 답변을 제공하기 위해 필수적인 요소다. 그러나 현재 한국형 데이터는 AI 모델 학습에 활용되기엔 충분치 않은 상황이다. 특히 CCTV와 같은 멀티모달 데이터가 부족하다. 개인정보보호법을 준수하기 위한 비식별화 과정이 걸림돌로 작용하고 있기 때문이다. 데이터는 많으나 실제 활용 데이터가 적은 현상이 발생하고 있다.
실제 ‘공공데이터포털’이 운영되고 있으나 정부 부처마다 데이터를 공개하는 형식이 다르고 업데이트 주기가 불규칙해, 기업들이 이들 데이터를 활용하는데 어려움이 있다. ‘데이터 칸막이’ 현상이 발생하는 것이다.
한국형 데이터를 구축하기 위한 산업용 데이터 확보도 문제다. 우리나라 기업들은 자동차, 조선, 가전 등 제조 분야를 선도하는 만큼 고품질 데이터를 많이 확보하고 있다. 이를 활용할 경우 산업용 AI 개발에 많은 도움이 될 수 있지만 국내 기업들은 경쟁사 유출 우려와 같은 이유로 자사 데이터 공개를 꺼리는 경우가 많다. 이에 해결책으로 데이터 거래 활성화가 제시되고 있다. 이는 기업이 공개하는 데이터에 적절한 보상을 제공해 부담감을 줄이는 방안이다.
이런 시장상황 속에서 한국형 데이터 활용 방안에 대한 논의가 활발히 진행되고 있다. 개방과 폐쇄에 대해 다양한 의견이 존재하며 개방 측은 △기술 발전 및 생태계 조성 △AI 편향성 해결 △오픈 생태계의 장점 등을, 폐쇄 측은 △국가 안보 및 민감 정보 보호 △데이터 주권 확보 등을 주요 근거로 내세우고 있다.
개방을 주장하는 관계자들은 폐쇄적인 방식은 기술 발전을 저해하고 갈라파고스화를 초래할 수 있다고 강조한다. 해외 AI 기업들이 영어 데이터뿐만 아니라 한국어 데이터가 필요한 것과 같이 우리나라 기업들도 해외 데이터가 필요하다. 만약 우리 데이터를 공개하지 않을 경우 해외 데이터 활용에 어려움이 생길 수 있다. AI 편향성 해결도 중요하다. 만약 해외에서 개발된 AI가 한국형 데이터에 접근하지 못하고 일본 데이터만 학습한다면 ‘독도는 일본 땅’과 같은 잘못된 정보를 생성하게 된다.
그럼에도 데이터의 완전한 개방은 문제를 일으킬 수 있어 폐쇄가 필요하다는 목소리도 존재한다. 국방, 외교, 안보, 핵심 산업 기술 등을 포함한 민감 정보가 포함된 데이터의 무분별한 개방은 국가 안보에 위협이 될 수 있다. 특히 우리나라의 강점인 고유한 산업 데이터가 공유될 경우 기존에 보유한 기술 주권을 상실할 가능성이 있다.
또 한국형 데이터를 통제하고 그 가치를 보존할 경우 데이터 활용에 대한 정당한 대가를 요구할 수 있다. 이는 데이터 주권 확보로 이어진다.
결과적으로 한국형 데이터의 가치와 활용성을 극대화하기 위해서는 전략적인 개방이 요구된다고 할 수 있다. 즉 개방과 폐쇄 사이의 균형 잡힌 전략이 동반돼야 한국형 데이터가 성공적으로 역할을 할 수 있는 기반이 마련될 것이다.
변화하는 인재상, 인재 확보 어려움 심화
현 정부는 AI 3대 강국 진입과 미래 전략 산업 육성이라는 비전 아래 소버린 AI 개발, AI-제조업 융합 생태계 조성, AI 인재 양성 등을 주요 목표로 삼았다. 기업들은 AI 인재 양성에도 큰 어려움을 겪고 있다. 아무리 방대한 데이터와 최첨단 인프라를 구축한다고 해도 이를 효율적으로 활용하고 AI를 개발할 인재가 없다면 기술 경쟁력을 갖추는 것은 불가능하다.
현재 국내에는 AI를 설계부터 구축까지 완전히 최고 수준으로 수행할 수 있는 고급 AI 인재가 부족하다. 이러한 현상은 해외 인재 유출로 인해 더 두드러지고 있다. 국내에서 양성된 우수 AI 인재들은 국내 기업보다는 해외 빅테크 기업으로 취업하는 경향이 강하다. AI 인재들은 해외 빅테크를 선호하는 이유로 높은 연봉뿐 아니라 연구 환경, 동료들의 수준, 충분한 실험 기회 등을 꼽았다. 단순한 비용 지원만으로는 인재 확보 문제를 해결할 수 없다는 점을 시사한다.
AI 강국으로 가기 위해서는 국내 인재 양성 외에 해외 인재 유치도 매우 중요하다. 해외 우수 인재들이 한국 기업을 선택하도록 유도할 필요가 있다는 것으로 연봉 외에도 연구 환경, 문화적 적응, 비자·주거 등 종합적인 유인책이 필요하다.
업계 관계자들은 비효율적인 인재 양성 시스템도 인재 확보에 어려움을 겪는 원인으로 꼽았다. 국내 교육 시스템이 고급 인재보다는 초급 인재를 대량 양성하는 데 집중돼 있어 기업들이 원하는 역량을 갖춘 인재 확보가 어렵다는 지적이다. 그리드원 김계관 대표는 “특히 대학에서 창의성과 문제 해결 능력보다 취업 중심의 구조가 두드러진다. 학력보다는 AI 실무 중심의 인재 육성 시스템을 구축할 필요가 있다”고 강조했다.
소버린 AI 정책 추진이 화두로 떠오른 상황에서 범용 모델 개발에만 매몰되는 것은 위험하다. AI를 실제로 산업에 적용하는 AX와 데이터 개방도 함께 병행돼야 한다. 특히 AI를 잘 활용하는 기술인 AX 자체가 경쟁력이 될 수 있다.
AI 모델이 잘 만들어진 자동차 엔진이라면 이를 활용해 산업에 적용하는 AX는 자동차에 비유할 수 있다. 우리나라가 자체 엔진을 만드는 데 집중해 좋은 결과물을 만들었을 때 이미 글로벌 트렌드는 전기자동차로 넘어간 상황이 발생할 수 있다. 다른 나라 기업들이 이미 선점한 시장에 뛰어들다가 시대에 뒤떨어질 수 있는 것이다. AI 모델 자체의 기술력 확보도 중요하지만, 그 모델을 활용해 실제 산업에서 어떻게 활용하고 부가가치를 창출할 것인지도 고려돼야 한다.
아직도 산업 현장에서는 클라우드 시스템조차 제대로 활용되지 않고 있으며 문서 중앙 집중화조차 이뤄지지 않은 경우가 많다. 업무 생산성이 향상될 여지가 많은 것이다. 또 산업 현장에는 IT 관련 전문가가 부재한 경우가 많아 AI 도입이 우리 조직에 효과적일지, 어떤 솔루션을 활용해야 할지에 대한 정보가 부족하다.
이 문제를 해결하기 위해선 AX 전문 기업과 수요 기업을 매칭하는 사업이 필요하다. 또 각 정부 부처에는 도메인별로 특화된 데이터가 많다. 이를 기반으로 AX 기술을 개발하고 도입하면 관련 산업 분야가 함께 발전할 수 있을 것이다.
현 정부가 AI 3대 강국을 목표로 100조 원 규모의 투자를 예고한 만큼 모델 개발 외에도 AI 전반에 대한 지원이 이뤄질 것으로 예상한다. 100조 원 투자에 AX 생태계 조성을 위한 노력도 포함되길 바란다.
점검 개선 필요한 소버린 AI 정책
새 정부는 AI 3대 강국으로의 도약을 목표로 총 100조 원 규모의 투자를 발표하며 소버린 AI 정책을 적극적으로 추진하고 있다. 특히 추경 사업을 통해 피지컬 AI 분야에 상당한 예산을 배정하는 등 산업용 AI의 중요성을 인지하며 관련 인프라 구축에 박차를 가하고 있다. 행정안전부와 과학기술정보통신부를 중심으로 공공 데이터 개방 수준을 높이고 데이터 통합 제공 시스템을 구축하려는 움직임도 포착된다.
그러나 업계에서는 정부의 소버린 AI 추진 방식에 대한 점검과 개선이 필요하다는 목소리가 크다. 먼저 ‘AX(AI 전환)’에 대한 명확한 정책 부재다. 한국이 강점을 가진 제조 분야 등 산업 AX의 중요성에 대한 선언적 언급은 많지만, 이를 구체적으로 어떻게 지원하고 활성화할지에 대한 실질적인 계획이 미비하다는 지적이다. 중소·중견기업들은 AI 도입 필요성을 느끼고 있으나 높은 비용과 불확실한 투자수익률(ROI)로 인해 AX에 적극적으로 나서지 못하고 있다. 이에 정부가 먼저 성공 사례를 만들어 공유하는 등 관련 정부 사업을 확대해야 한다는 주장이다. 포티투마루 김동환 대표는 “정부의 ‘마중물’ 역할이 필요하다. 정부가 앞서서 AX 성공 사례를 남기고 공유할 필요가 있다”고 강조했다.
또한 ‘독자 AI 파운데이션 모델 사업’의 실효성에 의문을 제기하는 목소리도 있다. 글로벌 빅테크 기업들이 선점한 LLM 시장에 국가적 자원을 집중해 뒤늦게 뛰어드는 것이 옳은 선택인지에 대한 의문이다. 시장 구도가 단순 기술 경쟁에서 자본 경쟁으로 변하고 있는 흐름도 우리나라에 불리하다.
독자 AI 파운데이션 모델 사업의 목표인 ‘글로벌 모델 대비 95% 수준 달성’이 실현된다 해도 그 자체가 의미가 없을 수도 있다. 글로벌 모델에 비해 뒤떨어지는 모델을 개발할 경우 외국은 물론이거니와 심지어 국내에서도 선택받기 어렵기 때문이다.
이러한 현상은 AI의 중요성이 강조될수록 더 심화된다. 더 높은 수준의 성능을 보장하는 AI를 활용하는 게 이익이 된다면 기업들은 비용 지불을 감수하고 빅테크 모델을 활용할 것으로 예상된다. 빅테크에 근접한 성능을 내는 것이 아니라 뛰어넘는 모델을 만든다는 목표를 세워야 한다는 의견이 나오는 이유다.
오픈소스 생태계, 소버린 AI 실현 열쇠 될까
업계 관계자 사이에서는 ‘오픈소스 생태계’가 소버린 AI 실현의 열쇠가 될 수 있다는 목소리가 나온다. 오픈소스 생태계의 가장 큰 강점은 ‘기술 발전 속도’에 있다.
메타(Meta)와 같은 빅테크 기업들은 다양한 오픈소스 프로젝트를 주도하며 생태계 확장에 기여해 왔다. 이는 기업들이 큰 비용과 시간을 들여 처음부터 모델 개발을 하지 않고도, 이미 공개된 모델을 활용해 효율적으로 기술력을 확보할 기회를 제공한다. 이러한 오픈소스 생태계에 참여하지 않고는 국내 기업들이 기술 경쟁력을 갖기는 어렵다는 주장이다. 실제로 독자 AI 파운데이션 모델 사업에서 오픈소스 공개 수준이 평가 항목으로 포함돼 정부도 오픈소스 생태계의 중요성을 인식하고 있는 것으로 해석된다.
반면 오픈소스 모델에 대한 의존이 완전한 기술 주권 확보와는 상충될 수 있다는 우려도 존재한다. 전쟁 등 극단적인 상황에서 오픈소스 공급이 중단될 수 있다는 불안감이다. 그러나 오픈소스 진영의 특성상 공급이 중단되더라도 기존에 공개된 모델들을 활용해 지속적인 개발이 가능하며, 인간의 협력적 본성이 기술 발전의 근본 동력이라는 반론이 제기된다. 그리드원 김계관 대표는 “많은 사람들이 우려하는 대로 설령 한 기업이 모델 공개를 막더라도, 대체 모델이 빠르게 등장할 수 있는 것이 오픈소스 생태계의 특징이다. 이는 리눅스, 파이토치 등 다양한 오픈소스를 통해 증명됐으며 AI도 마찬가지일 것”이라고 주장했다.
올해 초 IT 업계를 뜨겁게 달궜던 딥시크(DeepSeek) 개발자들은 오픈 커뮤니티를 통해 성장한 것으로 알려졌다. 우리나라 인재 양성 방식도 이러한 흐름에 맞춘 변화가 요구된다. 단순한 도제식 교육이 아니라 개발과 관련된 논의를 통해 자발적으로 성장할 수 있는 환경이 필요하다. KOSA 안홍준 본부장은 “오픈소스 전략은 이제 선택이 아닌 필수다. 기존에는 우리나라 사회 전반에 자체 기술을 숨기는 경향이 강했으나 이제는 바꿔야 할 때다. 기업들도 예외는 아닐 것”이라고 말했다.
현재 우리나라는 소버린 AI의 성공적인 실현을 위한 중요한 기로에 서 있다. 정부는 업계에서 나오는 우려의 목소리를 반영해 균형 잡힌 정책 추진을 추진하고 AI 인재 양성 시스템 혁신, 오픈소스 생태계 적극적 활용 등을 통한 지속 가능한 AI 경쟁력을 확보해야 한다. 결과적으로 소버린 AI가 단순한 선언에 그치지 않고 대한민국 AI 생태계 조성의 기반이 되기를 기대한다.