가트너 하산 엔나치리(Hassan Ennaciri) 시니어 디렉터 애널리스트

가트너 하산 엔나치리(Hassan Ennaciri) 시니어 디렉터 애널리스트
가트너 하산 엔나치리(Hassan Ennaciri) 시니어 디렉터 애널리스트

[컴퓨터월드] 경제가 어려워지면서 인프라&운영(I&O) 리더는 비용 최적화에 대한 압박을 받고 있다. 2022년 가트너 I&O 리더 주요 역할 설문조사(Gartner Signature I&O Role Survey)에 따르면, 비용 절감을 최우선 목표로 설정한 조직의 응답자 중 70%가 향후 12개월간 클라우드 도입을 가속화할 것이라고 답했다. IT 비용 절감을 위해 클라우드를 도입하겠다는 것이다.

클라우드 공급업체 역시 빠른 리프트 앤 시프트(Lift-and-Shift) 클라우드 마이그레이션을 통해 1~2년 내에 IT 운영 비용을 크게 절감할 수 있다고 말한다. 그러나 공급업체의 이러한 주장은 지나치게 낙관적이라는 사실이 드러났다. 퍼블릭 클라우드로 급히 마이그레이션하는 I&O 조직들은 오히려 이전보다 비용이 증가하기도 한다는 것이다.

일부 마이그레이션 경로는 장기적으로 비용을 절감하지만 이는 초기 투자 비용이 많이 들고 투자 회수가 빠르지 않다는 단점이 있다. 반대로 비용이 저렴한 리프트 앤 시프트 옵션은 워크로드를 빠르게 이동시키지만 IT 운영 비용을 낮추지는 못한다.

적절한 계획 없이 빠르게 클라우드 마이그레이션에 나선 I&O 리더는 종종 비용 급증에 직면하게 되면서 무엇을 잘못했는지, 이제 무엇을 해야 하는지에 대한 고민에 빠지게 된다.

대규모 클라우드 마이그레이션 프로젝트를 진행하면서 효율적으로 비용을 관리하고 긍정적인 ROI(투자수익률)를 창출하고자 하는 I&O 리더는 다음 4단계 접근 방식을 살펴봐야 한다.


1단계: 마이그레이션 접근 방식 식별 및 락인(Lock-in) 위험 해결

서비스형 인프라(IaaS, Infrastructure as a Service)로의 마이그레이션 적합성은 애플리케이션 중심으로 평가돼야 한다. 가트너의 TIME(Tolerate, Invest, Migrate, Eliminate) 분석 프레임워크는 평가 과정의 핵심 분석 도구로 다양한 비즈니스, 기술 및 비용 적합성 지표에 따라 애플리케이션에 점수를 부여한다. 이러한 지표에 따라 애플리케이션을 다음과 같이 분류할 수 있다.

● 용인(Tolerate): 애플리케이션이 기술적으로 양호하지만 비즈니스 지원이 부족한 상태. IT는 적합성 개선을 위한 비즈니스 투자가 있을 때까지 포트폴리오에서 이를 용인해야 한다.

● 투자(Invest): 애플리케이션의 상태가 양호하다. 따라서 기능을 추가하거나 패키지 애플리케이션의 새로운 기능을 설정하라는 요청을 받으면 상태를 유지하며 투자해야 한다.

● 마이그레이션/현대화(Migrate): 애플리케이션은 비즈니스 부서가 원하는 기능을 수행하지만 IT 부서는 기반 기술의 노후화 및 취약성을 우려한다. 비즈니스에서 기능 개선을 원하는 경우 IT는 기술 스택 또는 패키지 애플리케이션을 최신 지원 기술로 마이그레이션해 이러한 기술 부채를 동시에 해결해야 한다.

● 제거/교체(Eliminate): 애플리케이션의 상태가 너무 나빠서 투자할 가치가 없을 가능성이 있다. 해당 애플리케이션이 불필요하거나 더 나은 애플리케이션에서 기능을 사용할 수 있다면 제거한다. 기능이 여전히 필요하다면 교체 가능성이 있다.

클라우드 IaaS로의 대량 마이그레이션에 가장 적합한 후보는 ‘용인’ 애플리케이션인 반면, ‘투자’ 애플리케이션은 리프트 앤 옵티마이즈(Lift-and-Optimize) 접근 방식에 적합한 후보가 될 수 있다.


리프트 앤 시프트 방식과 리프트 앤 옵티마이즈 방식

애플리케이션을 클라우드로 마이그레이션하기 위해서는 5가지 전략이 있다. 가트너에서는 이를 클라우드 전환의 ‘5R(Rehost, Revise, Rearchitect, Rebuild, Replace)’이라 부른다.

리프트 앤 시프트의 일환인 리호스팅(Rehost) 전략은 오로지 인프라 주도로 이뤄지는 반면, 리프트 앤 옵티마이즈에 해당하는 수정(Revise) 전략은 인프라와 애플리케이션 모두 주도한다. 다른 전략들은 장기적인 ROI는 좋지만, 단기적인 실행이 어렵고 다른 비즈니스 그룹의 동의와 지원이 지나치게 많이 필요하다.

때문에 대량 클라우드 마이그레이션 프로젝트에는 대체적으로 두 가지 옵션이 주어진다. 리프트 앤 시프트는 보다 빠르고 쉬운 마이그레이션 경로를 지원하지만, 클라우드 환경이 제공하는 모든 이점을 확보하기 위해서는 이후 최적화가 필요하다. 리프트 앤 옵티마이즈는 일반적으로 더 많은 시간과 노력이 들지만, 마이그레이션과 최적화를 단일 작업으로 압축하여 더 나은 ROI를 제공할 수 있다. [그림 1]은 두 접근 방식의 주요 차이점을 보여준다.

[그림 1] 리프트 앤 시프트(Lift-and-Shift) vs 리프트 앤 옵티마이즈(Lift-and-Optimize) 방식
[그림 1] 리프트 앤 시프트(Lift-and-Shift) vs 리프트 앤 옵티마이즈(Lift-and-Optimize) 방식

IaaS로의 대량 인프라 마이그레이션은 일반적으로 비용이 많이 들지만, 기업들은 기본 IaaS를 서비스형 플랫폼(PaaS) 서비스로 발전시켜 비즈니스 가치 상승을 경험했다. 또한 IaaS/PaaS에서 호스팅되는 데이터를 특정 비즈니스 라인 혹은 산업 전용 클라우드 솔루션과 통합하면 장기적으로 더 높은 가치를 얻을 수 있다.


공급업체 락인(Lock-in) 위험 해결

클라우드 기반 솔루션 및 제품으로 이전함에 따라 많은 조직들이 기술 락인 위험을 우려하고 있다. 리프트 앤 시프트 마이그레이션은 클라우드 네이티브 기능을 활용하지 않아 클라우드 공급업체에서 쉽게 애플리케이션을 마이그레이션 할 수 있으나, 리프트 앤 옵티마이즈 마이그레이션은 가능한 경우 클라우드 네이티브 기능을 적극 활용해 높은 가치와 동시에 심한 락인을 초래한다.

I&O 리더는 특정 클라우드 네이티브 서비스를 활용할 경우 락인은 불가피한 결과라는 점을 이해해야 한다. 따라서 공급업체의 기능을 통해 얻을 수 있는 비즈니스 가치와 락인 위험의 균형을 맞춰야 한다.


2단계: 프로젝트 가치 설명 및 비즈니스 사례 구축

I&O 리더는 대규모 마이그레이션의 장점 및 주의 사항을 비교하여 향후 프로젝트의 비즈니스 가치를 적절히 설명함으로써 비즈니스 이해관계자의 기대치를 설정해야 한다. 클라우드 IaaS 도입을 통해 달성하고자 하는 가치는 조직마다 다를 수 있고 대규모 클라우드 마이그레이션을 통해 얻을 수 있는 주요 이점은 다음과 같다.

● 복잡한 애플리케이션 전환 없이 데이터센터 폐쇄

● 온프레미스 하드웨어 교체 주기에 따른 과다 지출 방지

● 클라우드 공급업체의 마이그레이션 인센티브에 액세스해 ROI 증진

● 인프라 지출을 자본 지출(Capex)에서 운영 지출(Opex)로 신속하게 전환

● 하이퍼스케일러가 제공하는 규모의 경제와 새로운 가능성 활용

● 클라우드 공급업체의 네이티브 데이터 사이언스, 머신러닝 등 다양한 소스의 데이터를 빠르게 통합 및 작업

한편 초기 계획 단계에서는 다음과 같은 일반적인 실패 패턴을 적절히 해결해야 한다.

● 비용 거버넌스를 포함한 효과적인 클라우드 거버넌스 부재

● 규제 요건에 대한 고려 부족

● 온프레미스와 클라우드의 차이점을 다룰 인력 재교육 프로그램의 부재

I&O 리더는 이니셔티브의 경제적 타당성을 보장하고 예산을 확보하기 위해 비즈니스 사례를 구축해야 한다. 비즈니스 사례에는 대상 공급업체에 시스템을 마이그레이션하고 안정화하는 모든 프로젝트 관련 비용과 운영 비용이 포함돼야 하며, 총소유비용(TCO, Total Cost of Ownership)을 낮추는 데 필요한 최적화 활동에 대한 투자도 고려해야 한다. 새로운 수익원 창출, KPI 개선 등 클라우드의 역량을 측정할 수도 있어야 한다. I&O 리더는 이를 바탕으로 클라우드 플랫폼의 비즈니스 영향력을 측정하는 주요 결과 및 KPI를 설정하도록 비즈니스 리더와 소통해야 한다.


3단계: 장기적인 프로젝트 성공 보장 및 잠재적 장애 요소 방지

비즈니스 사례 구축을 완료했다면, 이제 장기적인 프로젝트 진행을 고려해야 한다. 대표적인 방안 중 하나가 클라우드 혁신 센터(CCoE, Cloud Center of Excellence) 구축이다. CCoE는 클라우드 컴퓨팅 도입을 주도 및 관리하는 중앙 집중식 엔터프라이즈 아키텍처 기능으로, I&O 팀의 적절한 준비를 돕고 일반적인 마이그레이션 장애 요소를 피하도록 지원하여 비즈니스 성과를 높이는 데 도움을 줄 수 있다.


대량 마이그레이션을 위한 클라우드 환경 및 운영 팀 마련

일부 전제 조건이 갖춰지지 않은 상태에서 대량으로 클라우드 마이그레이션을 시작하는 조직은 ROI 감소, 마이그레이션 기간 연장, 거버넌스 및 운영 문제 또는 복합적인 이유로 인해 기대한 성과를 거두지 못한 경우가 많다. 이런 문제를 해결하기 위해 아래 사항을 기억해야 한다.

● 마이그레이션 파트너와 협력: 마이그레이션 파트너와 협력하고, 파트너의 워크플로에 통합된 도구를 활용하는 조직은 더욱 만족스러운 결과를 얻는다. 마이그레이션 파트너는 경험, 지적 재산 및 산업적 접근 방식을 제공해 위험과 비용을 줄여줄 수 있다.

● 클라우드 운영 모델 정의: 클라우드 리소스 및 워크로드 지원을 위한 운영 팀을 구성해야 한다. 이 단계를 놓친 I&O 리더는 서비스 연속성 측면에서 여러 문제를 경험할 수 있고 클라우드 전환 성공에 대한 조직 내 인식 역시 저하될 수 있다.

● 클라우드 랜딩 존 아키텍처 정의: 면밀하게 설계된 클라우드 랜딩 존 아키텍처는 성공적인 대량 클라우드 배포의 기반이 된다. 프로젝트를 시작할 때 클라우드 랜딩 존 아키텍처와 공용 서비스(허브 리소스)는 이미 갖춰져 있어야 하며, 코드형 인프라(IaC, Infrastructure as Code) 템플릿을 통한 자동화되고 표준화된 ‘스포크(Spokes)’ 생성도 준비돼 있어야 한다.

● 클라우드 아키텍처 모범 사례 이해: 클라우드 공급업체의 인프라 및 업체에서 제공하는 기능은 기존 온프레미스 환경과 다르다. 따라서 잘 설계된 공급업체의 프레임워크를 채택해 애플리케이션의 안정성, 보안, 비용 최적화 및 확장성을 보장해야 한다. 클라우드 서비스에서 발생하는 장애 역시 온프레미스 환경과는 방식이 다르기에 회복탄력성을 중시해야 한다.


잠재적 장애물 평가 및 극복을 위한 계획 조정

잠재적인 장애물을 평가하고 클라우드 도입 전략을 조정하는 데 실패한 조직은 프로젝트에서 최적의 결과를 얻지 못하는 경우가 많다. ROI를 달성하는 데 방해가 되는 주요 장애물은 다음과 같다.

● 클라우드 공급업체의 부가 서비스 도입 부족: 워크로드를 분리해 퍼블릭 클라우드 공급업체로 이전할 수는 있지만, 클라우드 플랫폼 서비스가 제공하는 이점을 활용하려면 주변 환경 또한 조정돼야 한다. 조직이 하이퍼스케일러(클라우드 서비스 공급업체)가 ‘다른 누군가의 데이터센터’가 아니라는 걸 이해하지 못한다면 클라우드에서 도달할 수 있는 민첩성 향상의 기회를 놓치고 TCO에도 부정적인 영향을 받을 수 있다.

● 클라우드에 적합하지 않은 애플리케이션: 하이퍼스케일러는 제품을 계속 업그레이드하고 더 많은 케이스를 지원하고 있으나, 독립 소프트웨어 공급업체의 클라우드 지원이 제한적이어서 일부 상용 애플리케이션이 클라우드에 적합하지 않을 수 있다. 또한 고성능 컴퓨팅 클러스터와 같은 일부 워크로드는 클라우드에서 TCO가 좋지 않은 것으로 나타났다.

● 리호스트를 위한 애플리케이션 지원: 일부 복잡한 상용 애플리케이션이 규범 가이드라인을 개발했지만, 이는 현실적으로 따르기 어려울 수 있다. 또한 일부 사용자 지정 애플리케이션의 경우 선택한 클라우드 공급업체에서 제공되지 않는 기능이나 프로세서 아키텍처에 의존할 수 있으므로 다른 마이그레이션 접근 방식이 필요할 수 있다.

● 소프트웨어 라이선스: 기존의 모든 소프트웨어 라이선스가 클라우드에서 배포를 허용하는 것은 아니다. 마이그레이션 착수 전 최소한 가장 많이 사용하는 소프트웨어에 하이퍼스케일러 배포를 지원하는 라이선스가 있는지 확인하는 것이 좋다.


4단계: 클라우드 네이티브 서비스 도입으로 더 높은 가치 실현

조직은 통합 툴, 데이터베이스, 애플리케이션 및 미들웨어 플랫폼을 포함해 클라우드 공급업체의 전체 서비스 제품군을 고려해야 하며, I&O 기술 팀은 선택한 업체를 활용해 비용을 최적화하고 운영 효율성을 높임으로써 TCO를 절감할 방법을 찾아야 한다.

일반적인 최적화 사용 사례 중 I&O 리더가 고려해야 할 사항은 다음과 같다.

● PaaS 전환: 하이퍼스케일러는 사내에서 반복 작업을 수행하는 데 따르는 부담과 비용을 줄여줄 여러 PaaS 서비스를 제공한다. 일반적으로 이러한 서비스 도입에는 애플리케이션 수준 변경이 거의 필요하지 않으며, 대표적인 예로 관리형 데이터베이스, 관리형 DNS 서비스 등을 들 수 있다.

● 클라우드 네이티브 재해 복구(DR) 및 백업 기술 채택: 각 하이퍼스케일러는 고속 네트워크로 연결된 전 세계 여러 클라우드 영역에서 서비스를 제공할 수 있다. 조직은 이를 통해 내장된 DR 오케스트레이터 및 백업 서비스를 활용하면서 원거리 간 데이터 복제를 구현할 수 있다. 구성 요소를 PaaS로 이전하는 조직은 PaaS 서비스에서 제공하는 기본 백업 및 DR 기능 활용을 고려해야 한다.

● 자동화 수준 향상: 마이그레이션 후에는 클라우드 네이티브 툴링의 일부 기본 기능만 사용되지만, I&O 리더는 자동화 수준 향상을 위해 툴링의 활용도를 높여야 한다. 클라우드 IaaS가 여전히 많은 수동 작업에 의존하고 있지만, 클라우드 제공 툴을 사용해 적극적으로 자동화를 추진하면 사람의 개입 수준을 줄일 수 있다.

● 리소스 가용성 스케줄링: 근무 시간에만 필요한 개발, 테스트 리소스와 같이 일부 환경은 특정 시간대에만 사용되므로 해당 시간대에만 리소스의 가용성을 설정해 컴퓨팅 사용량에 대한 비용을 지불할 수 있다.

● 라이트사이징(Rightsizing): 퍼블릭 클라우드의 리소스는 사용량에 따라 요금이 청구되며 이 기준은 대개 매우 세분화돼 있어 조직은 사용량을 적절히 모니터링, 평가 및 라이트사이징 해야 한다는 압박을 받는다.

● 클라우드 탄력성 활용: 가변적인 부하의 애플리케이션에 클라우드 자동 확장 기능을 활용할 수 있다. 그렇게 하면 시스템 활용도가 낮을 때 비용을 최적화할 수 있을 뿐만 아니라 수요가 많을 때 용량을 빠르게 늘릴 수도 있다.


제언

클라우드 마이그레이션과 IT 운영 비용 절감은 동시에 달성하기 어려운 목표다. 지출을 줄이기 위해 무작정 대량 마이그레이션을 추진하면 예상치 못한 비용 증가와 운영상의 어려움에 직면하게 될 것이다. 결국 해답은 신중한 계획이다. 대량 클라우드 마이그레이션 프로젝트를 추진하는 모든 I&O 리더는 이 4단계 접근 방식을 채택해 시행착오를 피하고 최적의 솔루션을 찾을 수 있다.

저작권자 © 컴퓨터월드 무단전재 및 재배포 금지