운영‧관리의 필수 설계도 ‘랜딩존’ 구성 필수

[컴퓨터월드] 클라우드가 모든 산업군으로 확산되면서 클라우드를 효율적으로 운영하는 방법에 대한 관심이 높아지고 있다. 또한 온프레미스 운영에 익숙한 많은 기업들은 새롭게 도입한 클라우드를 운영하는데 어려움을 겪고 있다. 클라우드 서비스 제공사(CSP), 클라우드 매니지드 서비스 제공사(MSP)들은 이러한 문제를 해결하기 위해 솔루션부터 아키텍처, 컨설팅 서비스 지원에 적극 나서고 있다. 효율적인 클라우드 운영을 위해 각 기업들이 제안하는 방안에 대해 알아봤다.


전문성과 규모에 적합한 운영 방법 고민해야

그동안 클라우드 도입을 고민했던 기업들은 클라우드를 도입한 후 이제 비용 최적화, 보안 및 컴플라이언스에 대해 관심을 보이고 있다. 그동안 자체적으로 시스템을 운영하면서 HW 측면에서의 보안과 정책 등에 집중해온 기업들이 클라우드를 도입하면서 자연스럽게 생겨난 고민이다.

클라우드의 경우 기존 HW에 해당하는 부분은 CSP가 담당한다. 기존 HW 단에 집중하던 운영 포인트를 클라우드 환경에서는 SW 및 서비스에 맞춰 비용 최적화와 보안 및 컴플라이언스 전략을 수립해야 운영 효율성을 높일 수 있다는 얘기다.

클라우드 서비스 제공사(CSP), 클라우드 매니지드 서비스 제공사(MSP)들 역시 기업들의 이러한 고민에 주목하고 있다. 클라우드 구축, 운영, 관리 서비스 제공사인 MSP들은 서비스 지원을 위해 클라우드를 도입한 기업을 클라우드 전문성과 규모에 따라 분류하고 있다. 자체 운영 인력이 없어 운영‧관리를 클라우드 MSP에게 일임하는 경우와, 비교적 클라우드에 친숙하며 기술 성숙도를 토대로 직접 사용하고, 운영하며 가이드를 요청하는 경우 등으로 구분하고 있다.

클라우드에 대한 전문성이 부족해 MSP에게 그 운영과 관리를 위임하는 경우, MSP는 고객에게 클라우드 구축 및 도입 컨설팅 서비스를 제공할 때부터 운영에 역점을 두고 고객의 상황에 맞게 아키텍처를 구성해준다. 반면 클라우드에 친숙하며 성숙도가 있는 고객들에게는 ‘가이드’를 제시해 클라우드 운영 역량을 기를 수 있도록 지원하고 있다.

하지만 클라우드에 친화적인 기업일 지라도 비용 최적화, 보안 및 컴플라이언스 등의 측면에서 많은 고민이 뛰따를 수밖에 없다는 것이 MSP 관계자들의 공통된 설명이다. 전문성을 갖춘 기업마저도 운영에 대해 고민하는 이유에 대해 이강수 클루커스 부사장은 “기업들은 단순히 클라우드를 사용해봤다는 것만으로 효율적으로 운영할 수 있는 전문성을 갖췄다고 생각하는 경향이 있다”며, “이로 인해 예상치 못한 비용 폭탄을 맞거나, 아예 다시금 온프레미스로 회귀하는 기업들도 있다. 비용 최적화, 보안 및 컴플라이언스 등에 대한 전문성을 갖추는 것은 쉬운 일이 아니다”라고 말했다.

클라우드 기업들 역시 이런 점을 감안, 비용 최적화와 보안 및 컴플라이언스 등의 지원에 적극 나서고 있다. 특히, 효율적인 클라우드 운영 방안에 대해 고민하는 기업들은 기업의 규모에 맞는 운영 방법을 가져가야 한다는 점을 강조한다.

김기완 AWS 시니어 솔루션즈 아키텍트는 “실제 현장에 나가보면 기업 규모에 따라 고민하는 부분이 다르다. 스타트업의 경우 탄력적인 아키텍처를 구성해 서비스 확장에 따른 비즈니스 유연성도 갖춰야 한다”면서, “대기업의 경우에는 클라우드로 전환하기 위한 변화 관리가 필요하다. 가령 인력을 어디에 재투자하고, 재교육은 어떻게 할지, 또 클라우드 보안 전략은 어떻게 수립해야 할지 고민해야 한다”고 강조했다.


리소스 가시성 확보가 비용최적화 이끈다

많은 기업들이 효율적인 클라우드 운영 방안에 대해 고민하지만, 그중에서도 특히 비용 최적화에 가장 관심을 보이고 있다. 실제 기업들의 클라우드를 운영‧관리해주는 MSP들 역시 한 목소리로 고객의 1순위 관심은 바로 비용을 최적화하는 데 있다고 말한다.

클라우드 전문 기업들은 클라우드 비용을 효율적으로 관리하기 위해서는 자원 활용에 대한 가시성을 확보하는 것과 불필요한 리소스를 완전하게 삭제하는 것 2가지가 중요하다고 입을 모았다.

먼저 클라우드 비용을 최적화하기 위해서는 가시성을 확보하는 것이 중요하다. 클라우드는 컴퓨팅 자원을 사용한 만큼 요금을 지불하는 종량제를 채택하고 있다. 이는 클라우드의 고유 특성이자 클라우드가 내세우는 강점이기도 하다. 하지만 자칫 제대로 관리하지 못하면 엄청난 비용 폭탄을 맞을 수 있다. 클라우드의 장점이 오히려 독이될 수 있다는 것이다.

클라우드 상에서 사용되는 리소스가 서비스 별로 얼마나 할당돼 구동되는지, 개발과 관련해 어느 정도 리소스 사용을 계획하고 있는지 등에 대한 구체적인 전략이 없다면, 클라우드 사용 요금을 체계적으로 관리할 수 없게 된다. 한 마디로 클라우드 사용량에 대한 가시성을 확보해 구체적인 전략을 수립해야 비용을 최소화 할 수 있다는 얘기다.

이에 대해 이수형 메가존 CTO는 “클라우드를 활용하고 있는 기업들은 HW 윗단의 SW에 집중하고 있다. 하지만 이 때 애플리케이션 개발에 사용되는 컴퓨팅 자원을 현업에서는 불필요하게 많이 사용하곤 한다”면서, “시장기관 플렉세라에 따르면, 클라우드 서비스 비용의 30% 이상이 현재 낭비되고 있는 것으로 나타났다. 그만큼 클라우드 비용을 관리할 수 있는 가시성 확보 솔루션을 포함해, 구체적인 계획이 필수적”이라고 설명했다.

이어 그는 “클라우드 비용 최적화를 위해서는 필요한 만큼만 사용이 가능하도록 오토스케일링과 같은 자동화 방법을 사용하는 방법, 혹은 자사의 운영환경을 이해하고 그에 맞는 리소스의 규모를 계산해 계약방식으로 비용을 낮추는 방법 등 여러 가지가 있다”면서, “하지만 이러한 방법을 수행하기 위해선 내부 인력들의 클라우드 관련 경험치를 늘리는 것이 중요하다. 이 경험치를 기반으로 운영 능력을 향상시켜야 한다. 탄탄한 인적 자원을 토대로 클라우드를 운영해야만 비용 최적화와 더불어 서비스 품질 향상도 가능하다”고 운영 인력에 대한 중요성을 강조했다.

클라우드 비용을 최적화하기 위한 또 다른 방법은 불필요한 리소스를 완전히 삭제하는 것이다. 비용 최적화의 핵심으로 꼽히는 모니터링 역시 불필요한 리소스를 만드는 것 중 하나다.

클라우드에서 특정 영역을 모니터링할 경우 로그 데이터가 클라우드 스토리지에 지속적으로 쌓이게 된다. 기업의 입장에서는 눈에 보이는 기능을 그저 켰을 뿐인데, 불필요한 로그 데이터가 남아있게 되는 것이다. 이는 결국 클라우드 리소스를 차지하게 되고 사용료 증가로 이어진다.

이강수 클루커스 부사장은 VM을 만들어 모니터링 서비스를 사용한 후 비용을 최적화하겠다고 한 고객 사례를 예로 들었다. 그는 “서버에서만 모니터링 리소스가 삭제될 뿐 디스크에는 여전히 남아있다. 심지어 공인 IP도 지워지지 않고 남아있다”면서, “로그 데이터가 계속 축적될 경우 기본적으로 스토리지 비용이 높아지게 된다. 물론 중요한 로그 데이터의 경우 남겨두지만, 쳐다볼 필요도 없는 로그들이 쌓이는 것을 지워야만 비용 최적화가 가능해진다”고 설명했다.

이강수 부사장은 이어 “클라우드는 리소스로 구성돼있다. 이에 익숙하지 못한 사용자의 경우 VM만 지우면 해결된다고 오판하곤 한다”면서, “클루커스는 이처럼 불필요한 자원들을 모니터링으로 발견하고, 비용 최적화도 지원할 수 있는 역량을 갖췄다”고 덧붙였다.

[인터뷰] “‘칵테일 클라우드’로 멀티 클라우드 운영 효율 향상 가능”
정철 나무기술 대표 
정철 나무기술 대표 

Q. 멀티‧하이브리드 클라우드를 사용하는 기업이 늘고 있는데, 효율적으로 운영하기 위한 솔루션을 선택하기 위한 고려사항은.
A. 효율적으로 멀티·하이브리드 클라우드를 운영하기 위해선, 비즈니스 변화에 대응 가능한 관리 솔루션을 사용해야 한다. 멀티‧하이브리드 클라우드는 단일한 환경만을 운영하는 것이 아니다. 복수개의 퍼블릭 클라우드 혹은 온프레미스를 동시에 운영해야 하기 때문에 각각 가시성을 확보, 한 곳에서 리소스의 배치, 사용량을 확인할 수 있는 솔루션이 필요하다. 특히, 솔루션을 선택했으면 서비스 유형과 리소스 배치, 통합 환경을 고려해 조직을 재구성하고 최적의 컴플라이언스 계획을 수립해야 한다.

Q. 멀티‧하이브리드 클라우드 환경에서 비용 최적화를 하기 위한 방법은.
A. 비용을 최적화하기 위한 프로세스는 사전에 사용할 리소스 계획 수립, 가시성 높은 리소스 통합 모니터링, 낭비되는 리소스 파악 및 비용 최적화, 지속적인 개선 등의 절차로 진행된다. 이 중 모니터링 가시성은 분산된 멀티·하이브리드 클라우드 환경에 있어 다양한 클라우드 플랫폼 정보와 애플리케이션 현황 정보를 한눈에 파악하고 통합적으로 관리·분석하는 것이 핵심이다. 클라우드 도입 시 클라우드 플랫폼 제품에서 관련 기능 지원 범주 검토나 전문 솔루션 활용 검토를 통해 이를 충족할 수 있다.

Q. 아키텍처와 보안 및 컴플라이언스도 중요한데, 어떠한 전략을 수립해야 하는지.
A. 3가지다. 먼저, 복합 플랫폼 환경에 유연한 확장 가능한 높은 이식성을 제공하는데 중점을 두고 표준화 된 아키텍처를 기반으로 한 제품을 도입해야 한다. 다음으로는 멀티·하이브리드 플랫폼의 모든 서비스는 계정 정보를 통해 접근 및 제어를 해야 한다. 때문에 멀티·하이브리드 클라우드 플랫폼 측면에서 콘솔 로그인 정책, 관리자 계정 관리, 계정 활동 감사 등 철저한 계정 관리가 필요하다. 또한, 별도의 사용자 계정 싱글 사인 온 구성 시 2채널 다중 인증 방식 채택도 고려돼야 한다.

마지막으로 멀티·하이브리드 클라우드 컴플라이언스는 환경 변화에 따른 비즈니스 및 데이터 위험을 줄이기 위해 일관성을 유지하는 것이 중요하다. 클라우드 도입 시 정책 및 거버넌스를 해당 환경에 맞게 수립해 아키텍처가 바뀌더라도 시스템, SW, 사용자의 컴플라이언스가 보장될 수 있도록 준비해야 한다.

Q. 멀티‧하이브리드 클라우드 운영을 효율적으로 할 수 있는 솔루션에 대해 소개해달라.
A. 우리 제품인 ‘칵테일 클라우드’는 기업의 비즈니스 환경에 따라 맞춤형태의 표준화 클라우드 구축 환경을 지원한다. 멀티 클러스터와 하이브리드 클라우드 환경을 제공하는 클라우드 네이티브 플랫폼으로, 단일한 제어 포인트 화면에서 멀티 클러스터에 배포된 모든 애플리케이션과 물리 서버 및 클라우드 인프라를 통합 운영‧관리할 수 있다.

최근 클라우드 애플리케이션 개발과 운영 효율화는 빠르게 변화하는 IT 서비스 구현의 핵심 요소로 떠올랐다. 이 제품은 업무 자동화, 마이크로서비스, 통합 모니터링을 통해 애플리케이션의 높은 확장성과 개발‧운영의 효율성을 높일 수 있다. 클러스터 감사로그 추적 및 컨테이너 이미지 리스크 검사, 보안 정책 중앙 관리, 계정발급‧회수, 유효기간 설정기술을 적용해 컨테이너 위험요소를 차단하고 클러스터 자원 사용 계정을 통합 관리를 통해 클러스터 보안성도 높다. 아울러, 애플리케이션 운영을 위한 인프라 자원, 현황의 통합관리와 보안, 모니터링을 위해 멀티 태넌시, 멀티 클러스터 관리, 보안의 관리 환경을 제공한다. 현재 삼성전자, 질병관리청, 신한은행, 현대카드, 두산, LS 등 대형 레퍼런스를 보유하고 있다.


유기적인 보안 정책과 ‘랜딩존’이 핵심

“클라우드 환경에서는 보안과 운영을 별개로 보기보다 하나로 봐야 한다. 마치 자전거의 앞바퀴와 뒷바퀴와 같은 개념이다. 속도를 내는 역할을 하는 뒷바퀴는 기업의 성장을 위해 비즈니스에 동력을 제공하는 ‘운영’과 같고, 마주칠 수 있는 위험을 피하고 길의 방향을 설정하는 앞바퀴는 ‘보안’과 같다. 자전거를 탈 때 앞바퀴와 뒷바퀴를 분리하지 않는 것처럼 운영과 보안이 함께 유기적으로 관리 되고 움직인다면 효율성을 극대화 할 수 있고, 그에 맞춰 보안성도 높아질 것이다.”

이수형 메가존 CTO는 클라우드를 운영할 때 보안을 높일 수 있는 방안에 대해 이 같이 말했다. 보안과 운영을 별개로 나누지 말고 하나의 유기적인 관리 계체로 봐야 한다는 것이다.

기존 온프레미스 환경에서의 보안은 방화벽으로 침해 요소를 막고, 정책을 적용하는데 집중했다. 하지만 클라우드 환경에서는 인프라에 대한 보안 정책에 신경 쓰기보다, 서비스가 확장될 때에도 언제든지 적용할 수 있는 보안 정책 스크립트를 구성하는 것이 중요하다. 클라우드 환경에서는 CSP들이 직접 HW에 대한 보안, 방화벽 등을 적용하기 때문에, 고객은 이 부분에 신경 쓸 필요가 없다. 사고가 발생했을 때 어떻게 대응해야 하는지에 집중해야 한다는 얘기다.

최근 클라우드 환경에서 운영과 보안, 개발을 유기적으로 해줄 수 있는 설계도를 그리고 있는 고객들이 늘어나기 시작했다. 바로 AWS와 MS에서 얘기하는 ‘랜딩존(Landing Zone)’이다.

 클루커스가 제시하는 ‘MS 애저 랜딩존’ (출처: 클루커스)
클루커스가 제시하는 ‘MS 애저 랜딩존’ (출처: 클루커스)

랜딩존에서는 보안 로그 저장 위치, 관리 정책, 서버, 패치, 보안 취약성 관리방법, API에 대한 보안 거버넌스와 접근통제 방안, 개발 등을 지정한다.

김기완 AWS 시니어 솔루션즈 아키텍트는 랜딩존에 대해 “흔히 집을 짓는 것과 비유한다. 고객이 요구하는 시스템을 운영하기 위한 기본적인 근간이 되는 요소를 형식화해 만든 도구”라면서, “이를 통해 보안 전략, 운영 거버넌스 전략을 포함한 껍데기가 만들어지게 되고, 그 틀 안에서 고객들의 워크로드가 돌아가게 된다. 집 짓는 것과 비슷한데, IDC를 짓고 거기에 대한 물리적인 보안 가이드라인도 만들고 프로세스, 서버 간 방화벽, 네트워크를 어떻게 통제할 지 모든 것을 수립해야 한다”고 말했다.

이어 그는 “랜딩존을 완성한 후 수정 작업과 커스터마이징하는 기업도 많다. 가령, 집도 살아가는 형식과 가정의 형태에 설계도에 TV받침대, 에어컨 위치, 침대 위치 등을 바꾸는 것처럼 랜딩존도 기업의 클라우드 활용 형태, 운영 방식, 보안 정책 등에 따라 수정하는 작업을 할 수 있다”고 덧붙였다.

랜딩존은 기업의 규모에 따라서도 구성 방식이 달라진다. 스타트업의 랜딩존 구성과 달리 엔터프라이즈의 워크로드는 대규모의 서비스 및 리소스를 잘 통제하고, 모니터링할 수 있는 환경이 필요하다. 향후 스타트업도 어느 정도 규모가 커지면 랜딩존 수정 작업을 진행해야 하며, 이때 CSP, MSP 등에게 도움을 받을 수 있다.


기업들이 제시하는 효율적인 클라우드 운영 방안

디지털 전환이 가속화되면서 CSP, MSP 등은 기존 클라우드를 사용하는 고객들에게 클라우드를 효율적으로 운영할 수 있도록 지원하기 위해 적극 나서고 있다. 아마존웹서비스(AWS), 마이크로소프트(MS), 메가존, 베스핀글로벌, 클루커스 등 5개 클라우드 전문 기업들이 제안하는 효율적인 클라우드 운영 방안에 대해 알아봤다.

 

‘웰 아키텍티드 프레임워크’ 활용과 랜딩존 구현이 핵심

AWS는 ‘웰-아키텍티드 프레임워크(Well Architected Framework)’를 통해 클라우드를 효율적으로 운영할 수 있다고 주장한다. ‘웰 아키텍티드 프레임워크’는 고객과 파트너가 아키텍처를 평가할 수 있도록 일관된 접근 방식을 제공한다. 클라우드 운영 백서인 셈이다.

이 프레임워크는 기업의 클라우드 아키텍처 관리 책임자인 클라우드 아키텍트가 사용 중인 애플리케이션을 위해 안전하면서도 성능이 뛰어난 인프라를 구축할 수 있도록 도움을 주기 위해 개발됐다. ▲운영 우수성 ▲보안 ▲안정성 ▲성능 효율성 ▲비용 최적화 등 5가지 측면에서 어떤 방법으로 클라우드 서비스를 운영해야 효율적으로 사용할 수 있는지에 대한 방법을 제공한다.

 AWS의 ‘웰-아키텍티드 프레임워크’ (출처: AWS)
AWS의 ‘웰-아키텍티드 프레임워크’ (출처: AWS)

김기완 AWS 시니어 솔루션즈 아키텍트는 “‘웰-아키텍티드 프레임워크’는 하나의 공통된 틀과 같다. 그 안에 고객이 상황에 맞는 워크로드를 넣을 수 있게 돼 있다”면서, “로그 수집과 분석을 수행하기 위한 아키텍처를 이 프레임워크에 넣게 될 경우 스스로 평가해보고 개선할 점들을 리포트 형태로 받아볼 수 있다. 이 같은 ‘웰-아키텍티드 프레임워크’ 마저도 어려운 고객의 경우 AWS의 컨설턴트들이 직접 현장으로 가 지원해준다”고 설명했다.

이와 함께 AWS는 랜딩존에 대한 개념도 강조했다. AWS에서 강조하는 랜딩존은 클라우드 이용 규모나 보안, 거버넌스, 네트워킹, 계정 등을 AWS 환경에 맞춰 확장이 가능한 모듈 형태로 접근하는 방식이다. 주로 보안 로그 위치, 개발 환경, 스테이징, 운영 환경, 프로세스 적용방법 등을 설계한다. 건물을 건설하는 것에 비유할 수 있다. 건물에서 기초 설계가 중요한 것처럼, 클라우드 역시 클라우드를 보다 쉽게 구성하고, 운영, 관리하기 위한 기초 작업이 필요하다. 이때 클라우드를 설계할 수 있는 설계도 역할을 하는 것이다.

랜딩존은 도입 초기 설계된 만큼, 후에 서비스 포트폴리오가 확장되거나 비즈니스 방향이 바뀜에 따라 변경이 필요할 때 수정할 수 있다. 이 랜딩존은 공통적인 설계도다. 그렇기에 고객은 각각의 비즈니스 및 클라우드 환경에 적합한 정책을 대입해야 한다.

가령, 엔터프라이즈의 워크로드는 잘 통제되고 모니터링 돼야 하는 환경이 필요할 경우가 있다. 이 경우 랜딩존을 설계할 때 ‘워크로드 통제’와 ‘모니터링 환경’에 초점을 맞추면 된다. 또 다른 예로 스타트업의 경우 처음 클라우드 서비스의 규모가 작다. 하지만 이를 설계할 때에는 장기적으로 보고 비즈니스가 성장할 것으로 예상되는 만큼 여유를 두고 설계해야 한다.

[인터뷰] “비용 최적화로 절감한 비용, 새로운 인사이트 창출에 투자해야”
김기완 AWS 시니어 솔루션즈 아키텍트
김기완 AWS 시니어 솔루션즈 아키텍트

Q. 비용 최적화 사례와 그 후 절감된 비용에 대한 활용 방안은.
A. 우아한 형제들이 클라우드를 효율적으로 운영하고 있다. 우아한 형제들은 우리 AWS의 많은 아키텍트들이 협업한 기업 중 한 곳이다. 처음에는 자체 IDC를 활용했었다. 하지만 점진적으로 AWS로 옮겨 지난해 말 마지막 서버를 셧다운했다. 이 과정에서 우아한 형제들의 경우 구체적인 숫자를 얘기할 수 없지만, 비용을 최적화하기 위해 수없이 노력했다. 주기적으로 AWS 컨설턴트 팀과 소통하고, ‘웰-아키텍티드 프레임워크’와 ‘랜딩존’을 적극 활용했다.

특히, 우아한 형제들의 경우 처음 AWS를 사용할 때 몇 주의 기간 동안 쌓인 사용량 데이터를 기반으로 평균적인 리소스 사용량을 측정했다. 또 이렇게 측정된 리소스 사용량을 토대로 스팟 인스턴스와 예약 인스턴스(RI)라는 클라우드 요금 약정 할인 프로그램을 사용하고 있다. 이처럼 절감된 비용을 단순히 이익으로 생각하는 것이 아닌, 새로운 AWS의 클라우드 서비스를 활용해 다양한 기능과 서비스를 출시했다.

그 대표적인 사례가 바로 ‘AWS 로보메이커’를 활용해 개발한 배달로봇이다. 절약된 비용을 토대로 배달로봇에 대한 원천기술을 개발하기보다 AWS에서 제공하는 기능을 바로 사용해 구현해냈다. 이를 통해 우아한 형제들은 사용자와 소통할 수 있고, 사용자가 원하는 기능과 서비스를 빠르게 만들어낼 수 있게 됐다. 절감된 비용을 단순히 이익으로만 생각하는 것이 아닌 새로운 비즈니스 인사이트를 창출할 수 있도록 전략을 수립하거나, 서비스 개발에 다시금 투자해야 한다.

Q. 요금 할인 프로그램에 대해 설명해달라.
A. AWS의 요금할인 프로그램은 RI(Reserved Instance)와 스팟 인스턴스(Spot Instance)로 구성돼있다. 먼저 RI는 AWS의 고객들이 가장 많이 활용하는 방법이다. 보통 사용 기간을 약정하는 방식인데, 기간은 1년~3년 중 선택하면 된다. RI를 계약하기 위해 자원 사용량의 평균 수치를 확인해야 한다.

워크로드를 운영하는 고객의 경우 평균적으로 인스턴스를 사용하는 기본 수치가 있다. 이를 대략적으로 알기 위해 몇 주간 클라우드 서비스를 사용하고 그 통계를 산출하게 되면 나오게 된다. 이때 산출된 수치를 기본으로 설정하고 거기에 맞도록 약정할인을 한다.

‘스팟 인스턴스’는 사전 약정 없이 최대 90% 할인 받을 수 있는 ‘EC2 인스턴스’에 대한 요금 할인 모델이다. 주로 개발이나 테스트 또는 저장하지 않는 웹 서비스, 이미지 렌더링, 빅데이터 분석에 적합하다. 이는 얼마만큼의 기간을 두고 약정하는 것이 아닌, 사용량을 두고 약정하는 방식이다. 테스트나 렌더링, 빅데이터 분석 등 대규모 인스턴스를 활용하는 곳에 적합하다. RI와 스팟 인스턴스는 중복해서 사용할 수 있으며, 도입 시 요금 할인 프로그램을 신청하지 못한 고객의 경우, 클라우드를 활용하고 있다면 언제든 신청할 수 있다.

Q. 클라우드를 효율적으로 활용하기 위해 고민하고 있는 고객에게 조언을 한다면.
A. 클라우드 환경은 과거 데이터센터의 운영과는 다르다. 그렇기에 클라우드 서비스가 어떻게 운영되는지, 랜딩존이나 ‘웰-아키텍티드 프레임워크’ 등을 통해 명확하게 이해하고, 거기에 맞는 전략을 수립해야 한다. 클라우드를 과거 온프레미스에서 운영하던 전략과 거버넌스 틀 안에 가두려고 한다면 많은 시행착오를 겪게 된다. 클라우드 환경과 거기에서 제공되는 비즈니스 가치를 이해하고, 새로운 정책이나 가이드라인을 수립해 나가는 것이 핵심이다.

 

‘클라우드 채택 프레임워크’로 운영 가이드 제공

마이크로소프트(MS)는 효율적인 클라우드 운영을 고민하는 기업들에게 ‘애저 클라우드 채택 프레임워크(Azure Cloud Adoption Framework)’를 제안하고 있다. 함성원 MS 매니저는 “클라우드를 도입한 고객에게 효율적인 클라우드 운영 성공 사례에 대한 내용부터, 조직이 클라우드를 통해 비즈니스를 성공으로 이끌기 위해 필요한 전략, 가이드, 지침 등을 포함하고 있다”면서, “일반 기업들도 쉽게 접근할 수 있도록 인터넷 문서로도 제공하고 있다”고 설명했다.

 MS의 ‘클라우드 채택 프레임워크’ 지침 (출처: MS)
MS의 ‘클라우드 채택 프레임워크’ 지침 (출처: MS)

MS에 따르면 최근 기업들은 ▲고객 수요의 빠른 변화에 대응 ▲비용 절감 ▲보안 관리 등 3가지 측면에서 클라우드 운영에 대한 고민을 갖고 있다. 먼저 고객의 수요를 담은 서비스를 시장에 빠르게 제공하려는 고객들이 늘었다. 또한 비즈니스를 글로벌로 확장하기 위해 클라우드를 활용해야 하는 필요성도 늘어나기 시작했다. 이에 MS는 처음 클라우드 사용을 고민하는 고객들을 위해 ‘애저 스타터 오퍼(Azure Strater Offer)’라는 프로그램을 제안하고 있다.

이 프로그램은 직원 스킬 향상과 클라우드 운영에 대한 내용에 대해, 고객이 원하는 결과물이 무엇인지에 따라 고객사의 환경을 평가하거나 파일럿 테스트를 진행해준다. 주로 전략 및 기술 목적에 대한 평가를 위해 특화된 파트너가 개최하는 워크숍을 진행하기도 한다. 특히, 클라우드로 마이그레이션하기 위해 필요한 준비 작업들을 돕는데, 클라우드 성숙도 점검, 현황 파악 및 로드맵 고민 및 비용 분석과 보안 점검을 실시해 리포트도 제공한다.

다음으로 비용 절감도 고민하고 있다. 비용 절감은 곧 수익 향상으로 이어지기 때문에 기업들이 가장 큰 관심을 갖는 주제이면서 코로나19 장기화로 인해 더욱 화두가 되고 있다. 하지만 온프레미스를 운영하는 고객의 경우 유연하게 리소스를 변경할 수 없기 때문에 스펙을 높여 설계하게 되며, 매몰비용이 발생한다.

비용 절감 방안에 대해 함성원 매니저는 “정확한 VM 사이징(VM 리소스 설정)을 통해 자원 낭비 요소를 차단하고, 불필요한 유휴 리소스를 삭제해 탄력적으로 운영하는 것이 1차적으로 비용을 절감할 수 있는 방안”이라며, “MS는 동일한 리소스를 지속적으로 사용할 경우 1년 혹은 3년의 예약을 통해서 할인을 받는다든지(RI 프로그램), 미사용 컴퓨팅 리소스를 할인된 가격으로 할당받아 사용하는 옵션인 ‘애저 스폿 VM’ 프로그램을 통해 요금을 할인 받을 수 있다”고 강조했다. 함 매니저가 설명한 클라우드 요금 할인 프로그램은 사업의 특성과 상황에 맞춰 선택해 사용할 수 있다.

마지막으로 기업들은 보안 관리에 고민하고 있다. MS는 ‘애저 폴리시(Azure Policy)’를 활용할 것을 제안했다. 이 같은 MS의 보안 역량을 토대로 ‘애저 폴리시’를 통해 보안 정책과 규정을 준수하고 있는 지에 대한 정보를 확인할 수 있다. 특히, 기존에 기업에서 활용하던 서드파티 서비스를 클라우드에서 사용해도 될 지에 대한 우려도 ‘애저 폴리시’를 통해 해소할 수 있다.

한편, 함성원 MS 매니저는 최근 고객들의 보안 우려에 대해 “현금을 금고에 넣을지 은행 예금에 넣을지 선택할 수 있는 것과 같다. 예전에는 현금을 금고에 보관하는 것이 안전하다고 생각됐지만, 지금은 10명 중 9명 이상이 은행 예금에 보관할 것”이라면서, “클라우드도 마찬가지다. 아직까지 클라우드 보안에 대해 걱정하는 부분들은 언젠가 데이터를 믿고 맡기게 될 것”이라고 설명했다.

[인터뷰] “클라우드 환경에 적합한 아키텍처 선택해야 효율성 향상”
함성원 MS 매니저

Q. 클라우드 도입을 결정할 때에도 운영을 염두에 둬야 할텐데.
A. 클라우드를 도입할 때 운영에 반드시 무게를 둬야 한다. 또 도입 단계에서 운영을 효율적으로 수행하도록 하기 위해서는 아키텍처가 상당히 중요하다. 클라우드에는 고객이 원하는 인프라와 네트워크를 직접 설계해 구축하는 것이 가능하므로, 클라우드 환경에 가장 적합한 아키텍처를 선택하는 것이 핵심이다.

사실 모든 리소스를 클라우드로 옮긴다고 해서 바로 클라우드의 장점을 누릴 수 있는 것은 아니다. 가령, 온프레미스의 아키텍처를 그대로 클라우드로 옮긴다면 경우에 따라 클라우드의 장점 중의 하나인 오토스케일링을 이용하지 못하게 될 수도 있고, 리소스 추가가 필요할 때 중복된 리소스를 만들어야 하는 경우가 생길 수도 있다. 애저에는 가상머신의 크기를 조정하는 ‘가상 컴퓨터 크기 집합(VMSS, Virtual Machine Scale Sets) 솔루션’이 있는데, 온프레미스 아키텍처를 그대로 옮긴다면 해당 솔루션을 사용할 수 없다.

특히, 클라우드를 사용하는 고객이 추구하는 비즈니스 및 다양한 규정, 보안 이슈, 개발 상황 및 비용에 대한 고려 사항들에 따라 아키텍처가 달라질 수 있다. 따라서 클라우드의 장점을 최대한 이용할 수 있는 애플리케이션과 워크플로우를 개발할 수 있도록 하는 방법론인 클라우드 네이티브를 적용해야 한다.

클라우드 네이티브 애플리케이션은 처음부터 클라우드 규모의 크기 조정 및 성능에 최적화되도록 만들어지며, 이는 마이크로서비스 아키텍처(MSA)를 기반으로 한다. 관리되는 서비스를 사용하고, 지속적인 업데이트를 활용해 안정성을 확보하고 출시 시간을 단축할 수 있게 된다.

Q. 클라우드 환경에 맞는 아키텍처를 설계하면, 자연스레 운영 인력은 줄 텐데, 효율적인 인력 관리 방법은.
A. 클라우드를 운영할 때는 필수적이지 않은 업무는 아웃소싱(MSP에게 위탁)하고 애플리케이션 레벨에 집중하게끔 인력을 분배해야 한다. 다만 전체적인 시스템을 살펴볼 수 있는 숙련된 인력은 반드시 필요하다.

하지만 현실적으로 이 같은 인력을 채용하기 힘들다. 이에 MS를 비롯해 CSP들은 클라우드 운영 관련 교육을 다양하게 진행하고 있다. 이를 활용해 기존 운영 인력을 클라우드 전문 인력으로 탈바꿈하는 것도 중요하다. 클라우드를 활용할 때에는 온프레미스와 다르게 빠르게 활용하고 있는 리소스의 변경이 가능하기 때문에 고객의 빠른 수요 변화에 발맞춰야 하는 기업 입장에서 유리한 측면이 있고, 운영 인력의 숙련도가 필요한 이유도 여기에 있다.

Q. MS 애저를 효율적으로 활용하고 있는 고객 사례에 대해 소개해달라.
A. 최근 진행된 ‘애저 에브리웨어(Azure Everywhere)’에서 다수의 고객 사례가 소개됐다. 여러 고객사 가운데, 매일유업의 경우 SAP를 포함한 전체 업무 시스템을 클라우드로 전환하고 있다. 매일유업은 모든 업무가 연계된 기업형 업무시스템을 지향하는 플랫폼을 확보하기 위해 애저를 활용하고 있다.

서비스형 플랫폼(PaaS) 지향성, SAP 운용을 고려한 기술 플랫폼, M365와의 통합성 등을 초기 클라우드 전환 단계에서부터 고려했고, ‘애저 하이브리드 베네핏(Azure Hybrid Benefit)’을 활용해 ‘윈도우‧SQL 서버 라이선스’ 비용도 절감했다.

 

SW 기반 접근과 중‧장기적인 계획 수립 필수

메가존은 효율적인 클라우드 운영을 위해 SW에 초점을 맞춰 전략을 세워야 한다는 점을 강조한다. 클라우드를 운영하는 기업은 HW가 아닌 SW에 집중해야 한다는 것이다. 이 같은 양상은 지난 5년간 직종별 수요를 보면 가늠할 수 있다. 실제로 기존 네트워크 엔지니어나 서버 엔지니어를 채용하는 곳이 현저히 줄었지만, 클라우드 엔지니어, 데브옵스 엔지니어와 같은 SW 기반의 변화된 엔지니어들의 수요는 늘어나고 있다.

보안 담당자 역시도 마찬가지다. AWS 상에서 보안을 담당해본 경험이 있는지를 우대사항이 아닌 필수사항으로 넣고 있다. 이처럼 기업들은 외부에서 검증된 인력을 확보하면서, SW 기술에 집중하고 있다.

박세진 메가존클라우드 MSC 센터장은 “서버리스, 쿠버네티스 기반 혹은 멀티 클라우드를 운영하는 측면에서도 이와 같은 API 연동, 관련 개발 경험이 중요하다. 많은 회사들은 외부에서 유사 경력 인재들을 확보하는 동시에 내부적으로 인력들의 SW 능력 향상에 초점을 맞추고 있다”면서, “물론 여기서 말하는 SW 능력향상은 전통적인 개발자 보다는 필요에 의한 솔루션 연동이나 업무 프로세스와 운영 자동화에 포커스 둔 새로운 운영 패러다임”이라고 덧붙였다. SW 기반의 클라우드 운영 기반은 업무 프로세스와 운영을 자동화하는데 있다는 설명이다.

박세진 MSC 센터장은 이를 위해서는 중‧장기적인 클라우드 운영 계획을 수립해야 한다고 강조했다. 중‧장기적인 운영 계획을 수립하기 위해선 단순히 운영하는 방법과 기술 프레임워크에 집중하는 것이 아닌, 현재 기업의 서비스와 비즈니스를 이해해야 한다. 이 같은 이해가 선행된 후 기술 프레임워크를 선택해야 한다는 것이다.

또한, 중‧장기적인 계획을 만들기 위해 비즈니스를 이해하는 것도 중요하다. 이에 대해 박 센터장은 “한 고객사의 사례를 예로 들면, 인프라팀은 마케팅팀의 계획을 2주전에 알지 못한다. 이 같은 상황에서 인프라 팀은 마케팅 팀이 이벤트 진행 며칠 전 긴급한 요청을 받고, 개발 코드를 수정하며 워크로드를 올리고, 인프라를 구성하게 된다”면서, “온프레미스에서는 오늘 말 한다고 되는 게 아니다. 신규 서버를 구매해야 할 수도 있으며, 이를 위한 품의서도 올려야 한다“고 말했다.

아울러, 메가존클라우드는 중‧장기적인 클라우드 운영 계획을 수립하기 위해서는 복잡한 운영 환경을 일정부분 먼저 정리하는 작업이 필요하다고 강조했다. 일정부분 얽혀있는 운영 환경을 정리한다는 것은 담당하고 있는 임무, 환경 등을 정의하고 역할과 책임을 재분배하는 것이다. 또한 이때 확장된 운영 정책에 대한 정의와 부서, 파트너 역할정의, 서비스 플로우와 프로세스, 업그레이드 등을 새롭게 정책화해야 한다.

 메가존클라우드의 ‘하이퍼 빌링’ 및 ‘하이퍼 와치’ 대시보드 (출처: 메가존클라우드)
메가존클라우드의 ‘하이퍼 빌링’ 및 ‘하이퍼 와치’ 대시보드 (출처: 메가존클라우드)

박 센터장은 “최근 고객들을 만나본 결과 중‧장기적인 운영 계획을 수립하고 있는 곳은 많지 않았다. 메가존클라우드는 이 같은 고객들을 지원할 수 있도록 고객에게 먼저 중‧장기적인 계획을 제안한다”면서, “비용 절감과 개발에 대한 품질 보증, 이를 지원하기 위한 모니터링 툴, 보안 툴 등 여러 솔루션도 함께 제공해 가시성을 확보할 수 있도록 돕고 있다”고 강조했다.

[인터뷰] “클라우드 리소스 가시성 확보에 ‘하이퍼’시리즈가 제격”
이수형 메가존 CTO(좌측), 박세진 메가존클라우드 MSC 센터장

Q. 클라우드를 효율적으로 운영하기 위해 꼭 필요한 것이 있다면.
A. 리소스를 얼마나 사용하고 있고, 불필요한 리소스는 무엇이 있는지 등을 확인할 수 있는 솔루션이 반드시 필요하다. 실제로 현장에서 마주한 고객들 가운데, 불필요한 유휴 리소스 때문에 많은 비용을 지불하는 고객이 있었다. 그 고객에게 메가존클라우드의 ‘하이퍼’ 시리즈를 공급했다. 고객은 ‘하이퍼 빌링(Hyper Billing)’을 통해 자원 가시성을 확보했고, 비용을 최적화할 수 있게 됐다.

아울러, 신기술 프로젝트를 진행할 때부터 클라우드 운영 및 보안, 개발에 대한 전략도 함께 수립해야 한다. 예를 들면, 최근 빅데이터 분석을 위해 클라우드를 사용하는 고객들이 많은데, 이 고객들은 빅데이터 프로젝트를 기획할 단계에서부터 운영과 보안에 대한 정책과 방향성을 함께 고려해야 한다. 또한, 클라우드 운영을 기획할 단계에서부터 보안과 개발 전략도 함께 포함시켜야 실제로 개발에 들어갔을 때 효율성을 높일 수 있다.

Q. ‘하이퍼’ 시리즈에 대해 소개해달라.
A. ‘하이퍼 솔루션’은 메가존클라우드가 직접 개발한 운영‧관리 솔루션이다. ‘하이퍼 솔루션’은 클라우드 도입 및 운영 시 발생하는 시행착오를 최소화 하고 운영 효율성을 획기적으로 개선하기 위해 지난 9년간 클라우드 운영 노하우를 담아 자체 개발한 솔루션이다.

‘하이퍼 빌링’은 언블렌디드 가격 정책을 반영해 원화 세금계산서의 발행이 가능하며, 회사 내의 다양한 인스턴스에 계층적 접근이 가능하다. 또한 피벗테이블을 지원해 태그를 통해 비용을 관리할 수 있다.

‘하이퍼 와치(Hyper Watch)’ 및 ‘하이퍼 체커(Hyper Checker)’는 현재 클라우드를 운영하고 있거나, 계획 중인 서비스에 대한 비교 분석을 통해 인터넷 비즈니스 퍼포먼스의 효율적인 관리가 가능하다. 특히 ‘하이퍼 와치’의 경우 리전 및 인스턴스 단위로 ‘클라우드와치 매트릭스’ 히스토리를 확인할 수 있고 그 결과를 멀티그래프를 통해 관리자가 파악할 수 있다. ‘하이퍼 체커’의 경우 국가와 리전 간 네트워크 지연 정도를 원클릭으로 측정할 수 있고, 설정된 네트워크 속도를 데이터와 그래프를 통해 확인할 수 있다.

Q. 클라우드를 효율적으로 운영하고 있는 고객 사례에 대해 소개해달라.
A. 인터넷 쇼핑몰을 운영하고 있는 M사가 비용최적화 측면에서 대표 사례다. M사는 기존 온프레미스 형태로 쇼핑 서비스를 공급해왔다. 하지만 고객이 지속적으로 늘어남에 따라 트래픽을 감당하기 위해 추가적으로 인프라를 확장해야 했고, 애플리케이션 개발자들이 유기적으로 배포할 수 있는 환경이 필요해 AWS 클라우드를 도입했다. M사는 AWS에서 제공하는 머신러닝 서비스 ‘세이지메이커’와 ‘AWS 스케줄러’를 활용하고 있다. 여기에 메가존클라우드의 ‘하이퍼’ 시리즈를 사용해 주 3~4회 리소스 수량을 자동으로 조절, 절감하면서 비용 최적화와 안정성을 확보했다. 또 여기서 절감된 비용을 통해 AWS의 다른 서비스에 투자해 새로운 서비스를 개발하는데 주력하고 있다.

보안 측면에서 효율적으로 운영하고 있는 고객으로는 B사가 있다. 이곳은 AWS의 ‘보안 점검 도구’를 사용해 50가지 점검 항목에 대입해 보안에 대한 이슈가 있는지 확인했다. 특히, 그 안에서 발생한 유해요소를 실시간으로 추적하고 조치하면서, 클라우드를 더욱 안전하게 운영하고 있다.

Q. 고객들에게 효율적인 클라우드 운영에 대해 제언 한다면.
A. 지금 클라우드에 대한 고민을 하고 있다면 혼자해서는 안 된다. 이미 수많은 회사들이 그 고민을 했었고, 메가존은 그러한 고민들을 해결해 나가고 있다. 또 그 기업들은 클라우드라는 플랫폼을 기반으로 획기적인 변화를 이뤄내기도 했다. 메가존은 고객이 클라우드를 조금 더 편하게, 효율적으로 운영할 수 있도록 ‘하이퍼빌링’, ‘하이퍼CDN’ 등과 같은 ‘하이퍼’ 시리즈 솔루션을 제공하며 멀티클라우드 고객을 위한 멀티클라우드 관리 플랫폼도 개발 제공하고 있다.

이 외에도 파트너사들의 솔루션을 통해 쿠버네티스 환경을 포함한 여러 환경에 대한 운영 효율성을 최대화하기 위해 많은 국내외 솔루션 제공사와 협업을 하고 있다. 우리 메가존에게 도움을 요청할 경우, 운영을 비롯해 구축, 관리까지 클라우드 전주기를 지원할 것이다.

 

코드 관리‧배포 및 모니터링으로 고객 클라우드 운영 돕는다

클루커스는 마이크로소프트(MS)의 클라우드 서비스 ‘애저(Azure)’에 대한 운영‧관리 서비스를 제공하고 있다. 클루커스에서 제안하는 효율적인 클라우드 운영 방안으로는 코드 관리‧배포 자동화와 모니터링, 랜딩존을 구성해야 한다는 것 등 3가지다.

클루커스는 코드를 쉽게 관리‧배포하기 위해 ‘테라폼(Terraform)’이라는 오픈소스를 제공한다. ‘테라폼’은 하시코프(Hashicorp)에서 오픈소스로 개발한 ‘코드형 인프라(IaC, Infrastructure as Code)’를 위한 도구로, 인프라 자동화를 목표로 설계됐다. 서버 등과 같은 기본적인 인프라 배포에 최적화돼 있다. 이 솔루션을 통해 클라우드를 운영할 때 고객이 고민하는 서버 관리를 쉽게 할 수 있다.

한 예로 클라우드를 운영하는 고객이 애플리케이션 개발과 운영에 필요한 인프라를 코드로 작성해 자동으로 생성·배치·관리할 수 있다. 인프라에 대한 정보가 담긴 코드들을 하나의 스크립트에 작성하면, 테라폼과 같은 IaC 툴이 스크립트에 맞춰 CSP의 클라우드 서비스와 연동해 인프라를 생성한다. 고객이 클라우드 콘솔에 접속해 하나하나 인프라를 생성하는 작업을 없애줄 수 있다는 얘기다. 이를 통해 개발에 필요한 인프라를 팀에 보다 빠르고 신속하게 제공해 개발팀과 운영팀의 운영 효율성을 높일 수 있다.

 클루커스의 ‘클루옵스 모니터링 서비스’ (출처: 클루커스)
클루커스의 ‘클루옵스 모니터링 서비스’ (출처: 클루커스)

다음은 클라우드 환경에 특화된 모니터링 서비스를 사용해야 한다는 것이다. 클루커스의 경우 ‘클루옵스(ClooOps)’라는 솔루션으로 모니터링 서비스를 제공하고 있다. 클루커스는 그라파나(Grafana)’라는 오픈소스로 이뤄진 모니터링 서비스를 제공하고 있다. 흔히 CSP에서 제공하는 모니터링 솔루션을 사용하고 있지만, 클루커스는 ‘그라파나’라는 오픈소스를 사용하고 있다.

이에 대해 이강수 클루커스 부사장은 “MS에서 제공하는 포털을 통해 모니터링을 하게 되면, 실시간 데이터의 사이즈가 크기 때문에 지연시간이 존재한다. 실제로 CPU 리소스, 메모리 리소스 등을 모니터링하더라도 그걸 보고 데이터를 판단하기까지 적게는 몇 십초에서 5분정도가 소요된다”면서, “하지만 클루커스가 제공하는 모니터링 서비스는 그라파나를 기반으로 하고 있다. 이는 리소스에 대한 정보를 API로 쉽게 불러올 수 있어 실시간 데이터를 확인하는데 지연이 발생하지 않는다”고 설명했다.

클루커스는 그라파나를 사용하면서, 모니터링하고자 하는 서버에 ‘텔레그라프’라는 모니터링 에이전트를 설치한다. 이 에이전트는 CPU, 메모리 등 고객이 지정한 부분을 모니터링하며, 리소스에 대한 정보를 서버에 보내게 된다. 서버는 리소스에 대한 데이터를 받은 후 대시보드를 구성해 모니터링 에이전트가 설치된 서버의 CPU, 메모리 등에 대한 정보가 담긴 화면을 그래픽화해 보여주게 된다. 클루커스는 이 같이 오픈소스를 활용해 모니터링을 함으로써 고객이 운영하는 곳 혹은 리소스 사용량을 확인하고자 하는 곳에 설치해 고객이 원하는 종류로 설치해 서비스를 제공하고 있다.

한편, 클루커스는 효율적인 클라우드 운영 방안을 고민하는 기업들을 위해 ‘랜딩존’ 설계에도 집중하고 있다.

박항서 클루커스 컨설턴트는 “집을 처음 지을 때 자재, 높이, 방의 개수, 크기 등 기본 설정을 하듯, 클라우드에도 이러한 기초 설정 작업이 필요한데 이를 랜딩존 설계라고 한다”면서, “크게 운영 정책, 보안 정책, 로그 관리 등을 설정할 수 있다. 구체적으로는 계정 권한 관리, 보안 관리, 운영 정책, 블루 프린트, 로그관리 등이 있다. 무엇보다 국제 표준에 맞는 정책에 대한 모음집을 받을 수 있고, 이러한 정책들이 제대로 지켜지고 있는지 자동으로 점검된다. 클루커스에서 제공하는 ‘랜딩존’을 선택할 경우, 한 달 이내 구성이 가능하다”고 설명했다.

[인터뷰] “3가지 차별점 토대로 고객 운영 지원 선봉장 될 것”
이강수 클루커스 부사장(좌측), 박항서 클루커스 컨설턴트
이강수 클루커스 부사장(좌측), 박항서 클루커스 컨설턴트

Q. 효율적인 클라우드 운영을 위해 갖춰야 할 것은 무엇인지.
A. 클라우드를 효율적으로 운영하기 위해서는 구축단계에서부터 클라우드 운영을 염두에 두고 정확한 평가가 이뤄져야 하며, 모니터링을 반드시 구축해야 한다. 온프레미스 환경에서 사용되던 인프라의 크기, 성능 분석 등을 통해 클라우드 환경에서 원활히 운영되도록 크기와 성능을 맞춰야 한다. 이렇게 제대로 된 사이징이 이뤄지면 어느 정도 비용이 최적화되기 시작하지만, 여기에 클라우드 환경에 적합한 모니터링을 구성해야 한다.

실제로 한 곳에서는 8대 규모를 생각하고 클라우드를 운영했다. 하지만 모니터링을 통해 2대만 필요하고, 6대는 특정 이벤트시 확장하면 된다는 것을 알게 됐다. 그렇게 비용을 최적화 하게 된다. 보통 우리 고객들은 주로 모니터링 구축하고 2주 뒤에 큰 폭으로 비용을 절감할 수 있으며 이 비용절감은 계속된다.

아울러 랜딩존도 설계해야 한다. 랜딩존을 구성한다는 것은 하나의 기초 샘플이 되는 기본 거푸집을 제공받는 것이다. 단순히 이렇게 끝나는 것이 아닌, 기업 자체 환경과 비즈니스를 대입시켜, 최적화된 아키텍처를 만드는 것이다. 한 사례로 랜딩존에는 네트워크 관리에 대한 내용도 설계된다. 네트워크 관리가 정말 잘 설계된 랜딩존의 경우 온프레미스에서 수행하던 네트워크 보안 정책을 비슷하게 만들 수 있다.

Q. 타 클라우드 업체와의 차별점은 무엇인지.
A. 우리가 생각하는 차별 요소는 3가지다. 먼저, 애저 영역에서는 ‘애저 익스퍼트 인증’부터 ‘리눅스 및 오픈소스 DB 마이그레이션’ 고급 전문자격 등 MS에게 부여받은 인증의 수가 세계적인 톱 레벨의 회사와 동일한 수준이다. 그만큼 우리가 보유한 애저 기술력이 뛰어나다는 얘기다.

다음으로는 운영‧관리 서비스를 제공하는 데 있어서 MSP 전문 팀을 보유하고 있다는 점이다. 꽤 많은 기업들이 운영‧관리 서비스를 제공한다고 하지만, 실제로 보면 별도로 구성이 돼있지 않은 곳도 많고, 컨설턴트가 운영‧관리를 담당하는 곳도 많다. 하지만 저희는 전문 MSP 팀을 구성했다. 또 그 팀원들은 애저 인증 자격증을 여러 개 보유하고 있다. 마지막으로는 국내에서 애저 레퍼런스를 가장 많이 보유하고 있다는 점이다. 이 같은 3가지 차별점을 토대로 고객의 프로세스와 우리의 프로세스를 일치시켜, 고객에게 어울리고 잘 맞는 서비스를 계속 제공해 나갈 것이다.

Q. 효율적으로 클라우드를 운영하고 있는 기업의 사례를 소개해달라.
A. 효율적으로 클라우드를 운영하고 있는 고객 중 대표사례로 TJ미디어가 있다. TJ미디어는 온프레미스에서 시작했다가 리호스트라고 하는 방법으로 클라우드로 VM을 그대로 옮겼다. 그 다음 PaaS를 사용한다는 목표로 랜딩존을 구성했고, 모니터링 서비스도 사용하고 있다. 최근에는 PaaS를 통해 빅데이터 분석 PoC도 수행했다.

TJ미디어가 잘 운영하고 있다고 판단한 근거는 바로 2종의 모니터링을 사용해 비용을 절감시키고 있기 때문이다. 모니터링과 관련해 고객사 담당자가 먼저 우리에게 제안했다. 보통 클라우드 모니터링은 운영과 서비스 사이에서 사용되는 리소스에 대한 모니터링이 주를 이룬다. 하지만 TJ미디어는 클라우드 플랫폼(VM, CPU, 서비스의 활성화 유무)에 대한 모니터링을 진행했고, 이후 OS 로그, 리눅스 로그 등 OS 리소스에 대한 모니터링도 진행했다.

독특하게 TJ미디어는 오픈소스보다는 MS 애저에서 제공하는 모니터링 툴을 사용하고 싶다고 제안했다. 이에 클루커스에서 ‘커스텀 모니터링’이라고 하는 맞춤형 모니터링을 제공했다. 현재 모니터링에 대한 결과 알람도 제공하고 있다.

 

클라우드 특화 솔루션으로 운영 자동화 돕는다

베스핀글로벌은 자동화 및 AI를 자사의 운영‧관리 서비스에 적용해 저렴한 비용으로 높은 수준의 서비스를 제공하고 있다. 이를 위해 ‘AI옵스(AI Operation)’팀과 내부 ‘SRE(Site Reliability Engineering)’팀이 매니지드 서비스 자동화 플랫폼을 지속적으로 고도화하고 있다.

베스핀글로벌이 제시하는 효율적인 클라우드 운영 방안의 핵심은 온프레미스에 맞춰진 기술 경영론을 탈피하고, 클라우드 네이티브 경영론을 도입하는 것이다. 이에 대해 김성수 베스핀글로벌 CTO는 “많은 기업들은 이미 클라우드와 온프레미스가 운영‧관리‧개발‧비용‧보안 등 모든 측면에서 다르다는 것을 알고 있다. 그럼에도 실질적으로 클라우드 네이티브로 운영 및 개발을 하고 있는 기업은 많지 않다”면서, “클라우드의 이해에서 출발하는 클라우드 네이티브 경영론을 기업 내 모든 부서가 개념과 방식을 인지하고 있어야 효율적으로 클라우드를 운영할 수 있다”고 밝혔다.

이어 그는 “구체적으로 클라우드 상에서의 자원 활용, 데이터 분석, 비용 최적화, 보안 측면에서 가시성을 확보하고 사용 경험을 점진적으로 확대해 나갈 경우 전사 차원에서 클라우드에 대한 이해도도 향상시킬 수 있을 것”이라고 덧붙였다.

 베스핀글로벌의 ‘옵스나우’ (출처: 베스핀글로벌)
베스핀글로벌의 ‘옵스나우’ (출처: 베스핀글로벌)

베스핀글로벌은 고객이 클라우드 네이티브 경영론을 지원할 수 있는 솔루션도 함께 제공하고 있다. 바로 ‘옵스나우(OpsNow)’다. 이 솔루션은 ‘라이트 사이징(Right Sizing)’을 통해 최적의 사용 추세를 알아볼 수 있으며, 저렴한 방식으로 높은 효과를 낼 수 있는 방법을 모색해준다. 또한, 멀티 클라우드의 다양한 자원을 운영할 때, 통합 평가 및 비용 관리를 할 수 있도록 기능을 제공해 복잡한 멀티 클라우드 운영을 보다 손쉽게 할 수 있게 해준다는 것이다.

‘옵스나우’의 특징은 하이브리드 클라우드 환경을 효율적으로 운영할 수 있다는 점이다. 고객들은 ‘옵스나우’를 통해 IDC 뿐만 아니라 AWS, 애저 등과 같은 멀티 클라우드 플랫폼들을 관리할 수 있다. 또한, 각기 다른 고객의 클라우드 환경에서 규칙을 설정 및 적용해야 하는 수고를 피하고, 다양한 클라우드 환경에서 운영되고 있는 애플리케이션과 자원을 단일 플랫폼에서 관리할 수 있도록 해준다.

아울러, ‘어드밴스드(Advanced) 모니터링’도 지원한다. 모니터링은 클라우드를 효율적으로 사용하기 위해 필수적인 기능이다. ‘옵스나우’는 고객이 원하는 성능 기준에 맞춰 CSP보다 많은 인프라와 시스템을 모니터링하기 때문에, 클라우드 공급자가 제공하는 기본적인 모니터링 데이터와 비교해 자원 사용량을 최적화할 수 있다. 시계열별로 트렌트 차트를 통해 이상 비용 및 이상 자원에 대한 현황을 파악할 수 있다.

‘옵스나우’에는 클라우드 비용과 자원을 집중적으로 관리하는 ‘핀옵스(FinOps)’, 클라우드 환경에서 개발과 운영 자동화를 지원하는 ‘데브(Dev) OS’ , IT 운영에서 발생하는 인시던트를 담당 및 관련자에게 체계적으로 전달하는 ‘얼럿나우(AlertNow)’, ‘챗옵스(ChatOps)’를 바로 생성하여 운영할 수 있는 ‘헬프나우 AI(HelpNow AI)’, 클라우드 인프라와 애플리케이션의 종합적인 보안을 제공하는 ‘섹옵스(SecOps)’ 등이 포함돼 있다.

특히, 이 가운데 ‘AWS CMT(Cloud Management Tool) 컴피턴시’를 획득한 ‘핀옵스’는 클라우드 자원 및 비용 가시화, 기업의 조직과 과제에 대한 자원과 비용 분배, 미사용 자원 검출, 자원 적정 용량 설정(Right Sizing), AWS의 각종 할인정책 등에 대한 사용현황 분석과 구매 추천 등으로 이루어진 비용 최적화 기능을 제공해준다.

베스핀글로벌은 ‘옵스나우’에는 자사 및 AWS의 고객사례를 기반으로 만들어진 200개 이상의 클라우드 보안, 자원 및 비용관리 정책이 포함괘 있다며 자동 검사와 리포팅을 제공하는 거버넌스, AI 및 룰 기반 이상비용 탐지, 실시간 리소스 이상생성 탐지 등의 기능으로 기업이 안전하게 클라우드 운영할 수 있도록 지원하고 있다고 주장했다.

김 CTO는 “‘옵스나우’의 클라우드 가시화, 분배, 최적화, 거버넌스, 이상탐지 기능들을 통해 기업의 클라우드 비용을 최소 10%에서 최대 50%까지 절감할 수 있다. 실제로 국내‧외 약 1,500개 고객사가 ‘옵스나우’를 통해 클라우드 관리를 자동화하고 있다”고 설명했다.

저작권자 © 컴퓨터월드 무단전재 및 재배포 금지