[기획특집] IT 인프라 넘어 생성형 AI 혁신 ‘선봉장’ 된 클라우드
CSP·MSP 모두 핵심 성장동력은 AI…PaaS 중요성도 커져 업계 “AI 토대인 국내 클라우드 경쟁력 강화 위해 정부 노력 필요”
[컴퓨터월드] 지난 10년간 디지털 전환(DX)을 위한 기본 토대로 자리 잡으며 성장해 온 클라우드 산업이 생성형 인공지능(Generative AI) 시대라는 새로운 변혁의 시기를 맞았다. 클라우드는 이제 빅데이터 기반의 생성형 AI 학습·개발을 위한 필수 IT 인프라 역할을 넘어, 생성형 AI의 실질적인 도입과 활용을 지원하는 ‘선봉장’으로 떠오르고 있다. 이에 클라우드 서비스 제공업체(CSP)와 클라우드 관리 서비스 기업(MSP)을 비롯한 각종 소프트웨어(SW) 기업들은 클라우드 전환이 미진한 영역을 공략하는 한편, 다양한 맞춤형 서비스와 기술력을 선보이고 있다. 클라우드를 통한 DX, 그리고 생성형 AI 도입을 모두 지원하기 위해 나아가는 클라우드 산업 전반의 움직임을 살펴본다.
혁신과 기회 맞이한 클라우드 시장
생성형 AI가 전 세계 클라우드 시장에 새로운 혁신과 기회를 가져오며 거센 바람을 일으키고 있다. AI 모델의 학습과 추론, 서비스 운용을 뒷받침할 수 있는 높은 확장성과 가용성을 갖춰, AI 시대에 가장 이상적이고 안정적인 인프라라는 이유에서다.
나아가 클라우드상에서 구동 가능한 머신러닝(ML) 플랫폼, 클라우드 기업들의 자체 개발 파운데이션 모델(FM), 생성형 AI 기반 비즈니스 지원 애플리케이션 등에 관한 역량이 클라우드 기업들을 평가하는 척도가 되고 있다.
앞서 클라우드 산업은 전 세계, 전 산업군의 DX에 큰 영향력을 발휘해 왔다. 특히 코로나19 기간 폭발적인 성장세를 보였다. 이후 잠시 성장이 더뎌졌지만, 오픈AI(OpenAI) 챗GPT(ChatGPT)의 등장과 함께 다시금 성장동력을 확보하게 됐다.
생성형 AI 개발과 솔루션 구축을 위해선 고성능 컴퓨팅이 필수적으로 요구되는데, 수년간 발전해 온 클라우드 인프라가 실질적으로 AI를 발전시킬 수 있는 가능성을 열게 된 것이다. 막대한 데이터와 리소스를 수용할 수 있는 클라우드는 생성형 AI와 불가분의 관계를 맺고 있다.대규모 데이터 세트 처리는 물론, AI 모델과 각종 응용 애플리케이션들을 서비스형 소프트웨어(SaaS)로 제공하는 등 전 세계 AI 확산을 이끌며 동반 성장하는 중이다.
특히 기업들은 비용 측면에서 큰 이점을 느끼고 있다. 클라우드를 통해 수천억 원 규모의 AI 인프라 투자를 줄일 수 있기 때문이다. 고비용의 하드웨어(HW) 인프라를 구축해야 하는 기존의 온프레미스 시스템에 비해 적절하게 비용을 관리하면서도 클라우드상의 다양한 AI 모델, 플랫폼, 서비스를 활용할 수 있어 중소기업도 AI의 활용이 가능하도록 돕고 있다.
시장에선 이러한 혁신과 투자가 발 빠르게 확산되고 있다. IDC에 따르면, 퍼블릭 클라우드 서비스에 대한 전 세계 지출 규모는 2024년 8,050억 달러(한화 약 1,179조 6,470억 원)에서 2028년 2배로 늘어날 전망이다. 5년간 연평균 19.4%에 달하는 성장률을 기록한다는 관측으로, 생성형 AI 서비스 확산이 주효한 성장 요인으로 꼽힌다.
가트너 또한 지난해 전 세계 퍼블릭 클라우드 서비스 지출이 총 6,754억 달러(한화 약 923조 2,718억 원)로, 전년 기록인 5,610억 달러(한화 약 766조 3,260억 원) 대비 20.4% 증가할 것으로 전망한 바 있다.
가트너의 시드 내그(Sid Nag) VP 애널리스트는 “퍼블릭 클라우드 지출이 지속적으로 성장할 것으로 예측되는 이유는 범용 기반 모델이 지속적으로 생성되고 있으며, 생성형 AI를 지원하는 애플리케이션을 대규모로 제공하기 시작하고 있기 때문”이라며 “지속적인 성장으로 인해 퍼블릭 클라우드 사용자 지출은 2030년 이전까지 1조 달러(한화 약 1,363조 1,000억 원)를 넘어설 것으로 보인다”고 설명했다.
AI 개발·활용 전 과정 지원 서비스 속속 출시
생성형 AI라는 새로운 활로가 열리며 글로벌 CSP들은 곧장 핵심 신규 서비스들을 선보이며 사업 확장에 나섰다. 먼저 아마존웹서비스(AWS)는 고객의 ML 과정을 지원하는 기존 서비스를 강화하고 컴퓨팅 인프라 투자를 확대했다. 특히 생성형 AI 파운데이션 모델(FM)을 유연하게 활용할 수 있도록 돕는 플랫폼 서비스 ‘아마존 베드록(Amazon Bedrock)’을 2023년 하반기 출시하며 사용성을 극대화했다.
이보다 더욱 선제적으로 움직인 곳은 마이크로소프트(MS)다. MS는 챗GPT를 통해 AI 시장을 선도한 오픈AI에 발 빠르게 투자하며 전략적 제휴를 맺고 독점 라이선스를 확보했다. 이를 통해 자사 애저(Azure) 클라우드 서비스에 오픈AI의 챗GPT 기술을 접목했다.
구글 클라우드 역시 AI 애플리케이션 학습·배포를 지원하는 자체 ML 플랫폼 ‘버텍스 AI(Vertex AI)’를 내세우며 생성형 AI에 의한 시장 변화에 대응했다. 특히 구글은 2023년 말 자체 거대언어모델(LLM) ‘제미나이(Gemini)’를 출시하며 AI 모델 라인업도 본격적으로 확장하기 시작했다.
이들 CSP들은 서비스형 인프라(IaaS) 영역부터 생성형 AI 특화 플랫폼, 자체 FM 등 AI 개발부터 실질적 활용에 이르는 전 과정 지원 서비스들을 모두 강화했다. 생성형 AI를 안정적으로 학습·고도화할 수 있도록 하는 인프라를 지원하고, 클라우드상에서 고객들의 자체 AI 모델 ML을 서비스하거나 시장에 있는 다양한 FM 활용할 수 있는 플랫폼을 제공한 것이다.
이와 함께 CSP가 자체 개발한 LLM을 활용할 수 있도록 서비스할 뿐만 아니라, 클라우드상에서 이용할 수 있는 생성형 AI 기반 애플리케이션 프로그래밍 인터페이스(API) 도구들도 제공 중이다.
엔비디아 GPU 확보전 속 대안 모색도 활발
기본적인 컴퓨팅 인프라의 성능을 고도화하기 위해 최신 엔비디아(NVIDIA) GPU 확보가 기업들의 중요한 과제로 떠올랐다는 점도 주목된다. 글로벌 빅테크 CSP들은 시장 전반에서의 GPU 수급난에도 불구하고, 엔비디아와 최우선 공급 계약을 맺어 물량을 확보하는 한편 엔비디아 플랫폼을 함께 지원하는 등의 협력을 추진했다.
이 같은 흐름 가운데 코어위브(CoreWeave), 람다 랩스(Lambda Labs) 등 몇몇 글로벌 스타트업들은 생성형 AI 사업 초기 GPU 기반의 고성능 데이터센터를 선제 구축해 AI 학습·추론을 위한 GPU 클러스터 공급 사업을 확산시켰다. 이를 지칭하는 서비스명은 ‘구독형 GPU(GPUaaS)’로, 최근 빠르고 저렴하게 GPU를 이용하려는 수요 기업들로부터 지속적인 관심을 받고 있다.
한편으로 CSP들은 엔비디아와의 협력은 유지하되, 엔비디아 GPU 종속을 탈피하기 위해 자체 반도체 칩을 개발하는 움직임도 보였다. GPU 수급난이 시장 환경에 미치는 변동성이 큰 상황 속에서 자사만의 특화 칩을 활용해 다양한 AI 워크로드에 대응과 고객 선택권을 넓힐 수 있다는 판단에서다. 실제 CSP들은 보유한 데이터센터 내에 GPU 대체 칩을 탑재한 시스템을 도입, 성능과 효용성을 검증하며 가능성을 저울질하고 있다.
국내 CSP, 생성형 AI 영역 강화 총력
국내 CSP들도 글로벌 기업 대비 자본과 인력 부족이라는 어려움은 있지만, 생성형 AI 트렌드에 대응하기 위해 분주히 움직이고 있다. 특히 앞으로 공공에서 속속 발주될 AI 구축 프로젝트를 수행함으로써 관련 레퍼런스를 착실히 쌓겠다는 전략이다.
먼저 네이버클라우드는 자체 LLM ‘하이퍼클로바X’를 선보인 이후부터 생성형 AI 시장에서 공격적인 영업을 전개하고 있다. 하이퍼클로바X 기반의 챗봇 서비스 구축부터 법률 AI 개발·적용, AI 디지털교과서 사업 등을 선점해 가는 상황이다. 또 그룹 차원에서 사우디아라비아의 디지털 트윈 구축 프로젝트에도 착수해 중동권을 중심으로 한 해외시장 진출에도 나서고 있다.
아울러 하이퍼클로바X 모델을 쉽게 커스터마이징할 수 있는 하이퍼스케일 AI 개발 도구인 ‘클로바 스튜디오’, 완전 관리형 하이브리드 클라우드 서비스로 강력한 보안과 전용 AI 플랫폼을 동시에 제공하는 솔루션 ‘뉴로클라우드 포 하이퍼클로바X’ 등을 선보이며 AI 관련 솔루션을 다양하게 정비해 왔다.
AI 특화 데이터센터 운용에 강점을 둔 KT클라우드는 AI 전환 트렌드에 맞춰 클라우드 기반의 AI 인프라와 GPU 공급 서비스를 더욱 강화하고 있다. 최신 엔비디아 GPU를 작은 단위로 잘라 사용하는 슬라이싱 기술을 적용해 AI 추론 전용 인프라 서비스 ‘AI 서브(AI SERV)’와 AI 학습용 서비스 ‘AI 트레인(AI Train)’ 등 GPUaaS를 앞세워 AI 사업을 추진 중이다.
뿐만 아니라 KT 본사에서는 MS와 AI·클라우드 영역에 대한 전략적 파트너십을 체결, 국내 시장 상황에 특화된 클라우드 서비스를 공동 개발하고 있다. 아울러 MS ‘코파일럿’ 서비스를 내부에 적용하고, 대외 시장으로 함께 확산하는 등 글로벌 CSP인 MS와 다방면의 협력을 이어오고 있다.
NHN클라우드는 ‘광주 국가 AI 데이터센터’를 중심으로 하는 AI 인프라 시장 선도기업을 목표로 사업을 영위하고 있다. 앞서 NHN클라우드는 광주와 판교 데이터센터 등에 엔비디아, 그래프코어(GRAPHCORE), 사피온(SAPEON) 기반 GPU 등 ‘멀티 AI GPU 팜(Farm)’을 구축한 바 있다.
특히 데이터 보안을 중시하는 민간기업에 리전(Region)형 클라우드와 프라이빗 클라우드를 결합한 하이브리드 클라우드 공급을 확대할 계획으로, ‘오픈스택(Openstack)’ 기술 개발 역량 고도화도 지속적으로 추진하고 있다. 또한 NHN클라우드는 과기정통부 지정 보안관제 전문기업으로서, 경남 김해시 보안관제센터를 통해 AI를 접목한 보안 위협 탐지 및 자동 방어 체계 서비스도 지원하고 있다.
카카오엔터프라이즈는 고성능 컴퓨팅(HPC) 역량을 토대로 하는 AI 서비스를 제공할 수 있다는 것을 강점으로 내세우고 있다. 지난해 카카오엔터프라이즈는 자사 서비스 ‘카카오클라우드’의 슈퍼컴 2종으로 글로벌 슈퍼컴 톱500에서 44위와 70위를 각각 달성한 바 있다. 해당 순위권에 든 국내 기업 중 CSP는 카카오엔터프라이즈가 유일하다.
카카오엔터프라이즈는 AMD, 델 테크놀로지스, 아리스타 네트웍스(Arista Networks) 등 하드웨어(HW) 전문회사들과 기술 협력을 강화하며 카카오클라우드의 HPC 성능을 지속적으로 업그레이드시킬 계획이다.
이처럼 각자만의 특화 전략을 바탕으로 사업을 확장하고 있는 국내 CSP들은 정부 주도의 K-클라우드 프로젝트, AI 바우처 지원사업, 고성능컴퓨팅 지원사업 등 공공사업에 다양하게 참여하며 국가 AI 산업 생태계 활성화에 나서고 있다, 이와 함께 엔터프라이즈 고객을 대상으로 하는 신규 상품 출시도 준비하며 AI 산업에서의 영향력을 확대해간다는 계획이다.
MSP, 클라우드 넘어 AI 매니지드 기업으로
클라우드 구축을 돕는 MSP 생태계에도 변화가 일어나고 있다. 클라우드 MSP로 성장한 기업들이 이제는 AI MSP를 표명하며 클라우드뿐만 아니라 AI까지, 핵심 IT 영역을 모두 아우를 수 있는 역량을 갖춰가고 있는 양상이다.
특히 AI 고도화를 위한 기업들의 클라우드 이용 수요와 비용이 늘어남에 따라 비용관리의 중요성이 대두되는 상황 속에서, MSP들은 클라우드 관리 플랫폼(CMP)을 보다 고도화하고 있다. CMP는 고객의 클라우드 비용 관리부터 운영 관리 효율성을 높이기 위한 핵심 서비스로, 최근에는 AI 관리까지 다뤄야 하는 영역이 넓어지고 있다. 기존에는 클라우드와 관련된 요건들이 주로 고려됐다면, 이제는 서비스의 범위가 기업 IT 인프라 전반, 애플리케이션 단위, 데이터 및 AI 모델 관리까지로 확장된 것이다.
한국IDC 측은 “기업들이 시스템 혁신과 운영 관리에 있어 클라우드 MSP 사업자를 모든 IT 인프라 전반을 아우를 수 있는 종합 매니지드 사업자로 채택하는 양상이 점차 증가할 것”이라고 전망한 바 있다. MSP 기업들이 클라우드·AI 관리 및 운영의 핵심 사업자가 될 것이라는 예측이다.
이에 대해 MSP 업계 한 관계자는 “모든 산업 분야에서 AI가 가장 큰 영향을 미칠 것이며, 향후 클라우드 운용에 있어서도 결코 AI를 배제할 수 없다”면서 “AI를 비즈니스에 도입하고 잘 활용하기 위해서는 어떤 AI가 적합할지, 그 기반이 되는 데이터는 어떻게 관리하고 운영할 것인지에 관한 판단이 전제돼야 한다는 상황에서 MSP의 역할이 확대될 것”이라고 강조했다.
또 다른 업계 관계자도 “최근 많은 기업이 도입을 고려하고 있거나 도입 중인 AI/ML 기술은 대부분 클라우드 환경에서 운영되고 있다. 따라서 기술 지원 역할을 담당하는 MSP의 역할이 더욱 중요해지고 있음은 분명하다”며 “이제 MSP도 빅데이터, AI 등 고객이 보유한 데이터 활용을 지원할 수 있는 데이터 전문기업으로서의 역량 확보에 나서고 있다”고 말했다.
실제 메가존클라우드는 기업 맞춤형 생성형 AI 엔드투엔드 서비스 ‘젠AI360(GenAI360)’을, 베스핀글로벌은 대화형 AI 구축 운영 플랫폼인 ‘헬프나우AI(HelpNow AI)’를 출시하며 민간·공공을 가리지 않고 다양한 생성형 AI 구축 프로젝트를 수행 중이다.
GS네오텍도 자사 AI센터를 중심으로 검색증강생성(RAG)과 AI 에이전트 등에 다양한 연구개발(R&D)을 수행하고 있다. 지난해에는 AWS의 아시아태평양 지역 개발자 대회 AWS 게임데이(Game Day)에서 우승과 준우승을 모두 거머쥐며 글로벌 AI 역량을 자랑하기도 했다.
네이버클라우드 전문 MSP인 클라비는 하이퍼클로바X 기반의 LLM 구축 솔루션 ‘클라리오(CLARIO)’부터 평가·최적화 솔루션 등 AI 서비스들을 다각화하며 공공부문 AI 구축 사업을 다양하게 수주해 성장하고 있다. 솔트웨어 역시 AI 전문조직을 꾸리고 LLM 기반 기업용 AI 챗봇 ‘사피봇(Sapie Bot)’을 출시해 AI 사업 확대에 박차를 가하고 있다.
AI와 클라우드 네이티브 확산에 PaaS도 성장
생성형 AI 시대를 맞아 유연한 인프라 관리와 민첩한 소프트웨어(SW) 개발·운영을 지원하는 ‘서비스형 플랫폼(PaaS, Platform as a Service)’의 중요성도 더욱 커졌다. 이제 기업들은 단순히 클라우드 서비스를 도입하는 수준을 넘어, 클라우드가 제공하는 확장성·탄력성·민첩성을 최대로 활용하는 ‘클라우드 네이티브(Cloud Native)’를 구축하는 수준에 올랐다. 이에 클라우드 네이티브의 효율적인 운영·관리를 돕는 PaaS 솔루션들이 이전보다 더욱 각광받고 있다.
업계 실무진들은 “기존의 클라우드 네이티브 전환 흐름과 더불어 생성형 AI 수요 증가로 PaaS 시장이 수혜를 받을 것”이라며 “장차 기업 및 기관들의 IT 시스템이 클라우드 네이티브 환경으로 진화할 수밖에 없고, AI 애플리케이션 개발에는 쿠버네티스 기반 PaaS가 필수적”이라고 설명했다.
AI/ML 워크로드를 실행하는 핵심 기술 환경으로는 PaaS가 지원할 수 있는 ‘컨테이너(Container)’와 ‘쿠버네티스(Kubernetes)’가 자리 잡았다. PaaS의 자동화된 컴퓨팅 리소스 관리를 통해 민첩성을 확보할 수 있고 데이터센터 및 퍼블릭 클라우드, 나아가 에지(Edge) 환경 전반에 걸쳐 ML 모델을 일관성 있게 개발하고 배포할 수 있다. 또 필요에 따라 AI/ML 환경을 프로비저닝할 수 있고, AI 솔루션 스택의 자동 확장 및 고가용성도 보장한다.
이에 대해 PaaS 업계 한 관계자는 “AI 애플리케이션은 기본적으로 컨테이너를 기반으로 개발되고, 쿠버네티스 환경을 통해 배포된다”며 “이미 해외에서는 수많은 데이터를 학습시키는 AI 워크로드를 쿠버네티스로 구동하고 있다”고 말했다.
이어 “AI와 PaaS는 떼려야 뗄 수 없는 기술이다. 향후 PaaS 솔루션들은 쿠버네티스 관리를 넘어 AI 애플리케이션에 특화된 개발 도구 및 기능을 지원하는 방향으로 고도화될 것”이라고 덧붙였다.
글로벌 시장 대비 우리나라 PaaS 시장은 이제야 본격적으로 개화되고 있는 단계다. 생성형 AI 애플리케이션 개발과 고도화를 위한 PaaS의 역할이 주목받고 있는 만큼, 업계에서는 국내 PaaS 확산에 대한 목소리를 높이고 있다.
정부, ‘국가 AI 컴퓨팅센터’ 구축에 방점
국가 AI 경쟁력 강화를 위해 우리 정부에서는 ‘국가 AI 컴퓨팅센터’ 구축 사업에 방점을 둬 AI 산업 육성 관련 계획들을 실행할 방침이다. 정부는 내년 상반기까지 고성능 GPU 1만 8,000장을 확충하고, 국가 AI 컴퓨팅센터 내의 국산 NPU(신경망처리장치) 비중도 높여간다는 목표를 밝혔다.
특히 정부는 해당 사업과 관련해 2조 원 규모의 민관합작 특수목적법인(SPC)을 설립해 사업을 추진, 민간 주도로 국내외 AI 반도체와 클라우드 기반 인프라를 구축한다는 계획이다. 선진국 대비 뒤처진 AI 경쟁력을 발 빠르게 성장시키기 위해 기술력을 갖춘 해외 사업자들의 참여도 받아들이겠다는 것으로 풀이된다.
정부는 국가 AI 컴퓨팅센터를 구축함으로써 AI 3대 강국(AI G3) 도약에 속도를 낼 계획이다. SPC 설립을 통해 올해 서비스 조기 개시와 2027년 센터 개소를 목표로 하고 있다. 경영은 민간기업이 담당하고, 국가인공지능위원회 산하 ‘AI컴퓨팅 인프라 특별위원회’에서 정책적 지원 방안을 모색하는 데 집중한다.
국가 AI 컴퓨팅센터는 최종적으로 2030년까지 1엑사플롭스(EF)급 성능을 내는 규모로 구축될 예정이다. 이를 위해 정부는 내년 상반기까지 엔비디아 등 첨단 GPU를 1만 8,000장 확보한다는 목표다. 해당 사업에는 국내외 클라우드 기업과 통신사, AI 기업 등 다수 기업들이 관심을 보였고, 그룹사 프로젝트를 통해 기술력을 보유한 시스템 통합(SI) 기업들도 컨소시엄 형성에 발 빠르게 대응한 것으로 알려졌다. 또한 센터 설립 부지가 비수도권으로 한정되면서 대구시와 포항시 등 각 지자체들도 사업 유치에 적극 나서고 있다.
이 같은 사업을 통해 정부는 국내 AI 산업 육성 행보를 가속화한다는 방침이다. 국가 AI 컴퓨팅센터 구축을 지원할 뿐만 아니라 인재 양성과 기타 역량 강화 방안도 수립해 발표할 계획으로, 다양한 기업과 연구계의 AI 컴퓨팅 파워 공급을 목표로 하고 있다.
“생성형 AI 뒷받침하는 클라우드 산업도 관심 기울여야”
업계 일각에서는 국가 AI 경쟁력을 높이겠다는 정부 취지에는 공감하나, 국내 클라우드 산업 성장에도 더 관심을 기울여야 한다는 목소리를 내고 있다. 기반이 탄탄한 클라우드 산업 없이는 국가의 AI 경쟁력도 안정적일 수 없다는 우려에서다. 실제 미국과 중국 등에서 전 세계적인 파급력을 지닌 ‘챗GPT’와 ‘딥시크(DeepSeek)’ 등의 생성형 AI가 등장하는 것도, 이들 국가의 CSP 인프라가 있기 때문이라는 설명이다.
이를 두고 IT 업계 한 실무자는 “정부의 AI 산업 육성 계획 발표를 보면 대부분 AI에 몰두된 느낌이 든다. 클라우드 산업은 어느 순간부터 상대적으로 뒷전이 돼가고 있는 것 같다”며 “물론 AI 관련 예산에 클라우드 산업 지원도 포함돼 있겠지만, AI 경쟁력만큼 뒤처진 클라우드 경쟁력을 강화하기 위한 지원도 확충해야 한다”고 토로했다.
또 클라우드 업계 한 관계자는 “생성형 AI는 콘텐츠 창작부터 코딩, 간단한 문서 작업까지 많은 영역에서 혁신을 일으키고 있다. 하지만 이러한 생성형 AI 기술을 뒷받침하는 것이 클라우드다. 클라우드가 있어 생성형 AI가 존재할 수 있고, 성장할 가능성이 커지고 있다”면서 “우리 정부가 새로운 AI 모델과 고도화되는 서비스 등에만 주목하기보다는, 국내 클라우드 산업 육성에도 지금보다 더 관심을 기울여 주길 바란다”고 강조했다.