안준필 윈드리버코리아 부장

▲ 안준필 윈드리버코리아 부장

[컴퓨터월드] 네트워크의 고가용성을 뜻하는 ‘캐리어급(Carrier Grade)’은 자주 사용되는 용어이지만, 그만큼 잘못 사용되고 있는 경우가 많다. 파이브-나인 (99.999%) 수준의 가용성 혹은 50ms(밀리세컨드) 이하의 페일오버(Failover) 등의 의미로 사용되기도 하지만, 사실은 장비의 품질, 신뢰성, 가용성, 유지보수의 편의성을 비롯해 장비 관리, 과금, 보안, 트래픽 성능, 패키징, 전력 관리 그리고 더 나아가 개발 및 운영, 기술 지원을 위한 전반적인 부문을 포괄하는 광범위한 의미를 지니고 있다.

최신 기술의 흐름에 따라 ‘캐리어급’으로 규정되는 범위는 여전히 변화되어가는 과정에 있다. 캐리어 네트워크는 더 이상 특정 업체의 장비에 국한되지 않는다. 최근 네트워크 장비 업체들(NEP, Network Equipment Provider)은 더 이상 자체적으로 시스템을 설계하지 않는 대신, 표준 멀티 코어 하드웨어 플랫폼 기반의 상용 소프트웨어 시스템상에서 네트워크 애플리케이션을 개발함으로써, 내부 리소스를 고부가가치 애플리케이션 설계에 투입해 제품을 보다 차별화시키는데 집중하고 있다.

▲ 네트워크 기능 가상화(NFV)

또한 네트워크 기능 가상화(NFV, Network Functions Virtualization)는 네트워크의 구축, 프로비저닝, 관리 방안에 있어서 혁신적인 전환을 이뤄나가고 있다. 가상화를 통해 여러 가상 머신에서 네트워크 기능을 운영함으로써 하드웨어 및 소프트웨어 자원 풀을 공유할 수 있게 되기 때문이다.


새로운 서비스 창출을 위해 VNF(Virtualized network functions)를 서로 연결시키고, 네트워크를 효율적으로 구축해 비용을 절감하게 된다. NFV는 TCO 절감을 보장하지만 구축의 성패는 캐리어급의 요건을 충족시키는지에 달려있다. 즉 NFV인프라(NFVI, NFV Infrastructure)는 캐리어급 기능을 구현하기 위한 혁신적인 가상 플랫폼으로 네트워크 장비 업체들이 캐리어급 요건을 충족하면서도, 새로운 NFV 장비를 보다 신속하게 시장에 출시하도록 해주는 핵심 기반이 된다.


통신 사업자들이 NFV를 통해 시스템 중단을 최소화하고 유지보수 및 전력 비용을 절감하기 위해서는 반드시 캐리어급 인프라가 뒷받침되어야 하며, 캐리어급 NFV 인프라로서의 효용을 보장하기 위해서는 몇 가지 조건이 충족되어야 한다.

- ‘식스-나인(99.9999%)’의 가용성을 만족하는 Fault-Tolerant 옵션
- In-Service Upgrade의 여부
- OAM&P(운영, 관리, 유지보수, 프로비저닝) 지원
- 안전한 NFV환경을 위한 고급 보안 기능
- 예측 가능한 성능과 애플리케이션 지원 범위
- 확장성이 보장되는 아키텍처
- 제공업체의 플랫폼 개발 및 지원 역량

 

NFV 인프라가 ‘식스-나인(99.9999%)’의 가용성을 달성하기 위해 광범위한 Fault-Tolerant 옵션을 지원하는가?

퍼블릭 네트워크의 경우 비즈니스 크리티컬 서비스(Business-Critical Services) 뿐만 아니라 라이프 크리티컬 서비스(Life-Critical Services)를 제공하고 있기 때문에, 장애 발생에 대한 복원력(Resiliency)은 NFV 시스템의 필수 요소 중 하나이다.


OPEX 및 CAPEX를 낮추는 동시에 고가용성을 구현하기 위한 엄격한 SLA(Stringent Service Level Agreements)를 준수해야 한다. 이를 위해서는 시스템의 ‘Fault Tolerance’가 다른 여러 VNF의 유형 및 규모에 따라 최적화될 수 있도록 NFV 인프라가 반드시 광범위한 Fault-Tolerant 옵션을 지원해야 한다.


특히 N-way 로드 공유, N:1, N:M 등 다양한 리던던시(Redundancy) 모델을 제공하고 있으며, VM 보호 그룹 및 VM 헬스 체크 모니터링, 밀리세컨드 수준의 서버 신호 체크 등을 지원하는 높은 수준의 캐리어급 NFV 인프라를 적용해 이러한 요건을 충족시킬 수 있다. 또한 결함 탐지 및 복구 기능들을 통해 높은 고장 검출률(Fault Coverage)과 무손실 페일오버(Hitless Failover)가 보장되는지, 데이터 및 관리 플레인 모두에 리던던시 옵션을 적용해, 서비스뿐만 아니라 관리 가용성 매트릭스에 대해서도 99.9999% 이상의 가용성을 달성할 수 있는지 확인해 보아야 한다.

▲ 고장 감출률(Fault Coverage)의 영향

 

운영 효율성 극대화를 위한 OAM&P (운영, 관리, 유지보수, 프로비저닝)를 지원하는가?

원격/로컬 장비에 장애가 발생했을 때, 또는 효율적인 프로비저닝, 모니터링, 유지보수를 위해서는 운영 비용을 절감할 수 있는 방안과 함께, 캐리어급 요건을 완벽하게 준수하고 있는지 확인해 봐야 한다. OAM&P(Operations, Administration, Maintenance & Provisioning) 자동화는 프로비저닝 및 유지 보수 비용을 절감하고 절차상의 오류를 줄여, 서비스 중단에 대한 비용을 최소화할 수 있게 해준다.


캐리어급 NFV가 보장되기 위해서는 통신사업자의 OSS(운영 지원 시스템, Operations Support Systems)와 안정적이고 유연한 통합을 위한, 표준에 맞춘 광범위한 네트워크 관리 소프트웨어와 툴이 제공되어야 한다.
 

예를 들어 실로미터(Ceilometer) 서브시스템의 경우, 향상된 성능 지표를 수집하고, 유연한 VM 정의 및 생성을 지원하며, SNMPv2C OSS/BSS 인터페이스를 지원한다. 또한 동적 경고 대시보드 및 지속적인 알람 스트리밍 등을 통해 신속하고 정확하게 장애를 진단하고 격리시킨다.

 

NFV인프라 단에서 ISU(In-Service Upgrades)를 제공하는가?

사람들의 실생활, 또는 중요한 비즈니스에 직결되는 핵심 서비스들을 구현하기 위해서는 퍼블릭 네트워크가 반드시 24/7의 고가용성에 대한 요구를 충족시켜야만 한다. 그러므로 통신 서비스 사업자(Communications Service Providers, CSPs)는 전원이 꺼지거나 서비스 삭제없이 업데이트가 가능한 시스템을 필요로 한다. 즉 서버 업그레이드 및 검증 시 다운타임 없이 자동 소프트웨어 업그레이드가 가능해야 하며, 또한 새로운 소프트웨어 로딩 및 업데이트에 문제가 발생하는 경우 이전 버전으로의 자동 장애 복구, 페일백(Failback)이 수행되어야 한다.

 

NFV 인프라가 고급 보안 기능을 제공하는가?

사이버 공격이 점점 더 정교해지면서, NFV인프라 시스템 보안 기능에 대한 중요성이 높아지고 있다. 권한없는 접근 시도를 탐지하고 이러한 접근이 시스템에 영향을 미치지 않도록 효과적으로 방어할 수 있어야 한다.


게스트 네트워크 분리, 프로그램 저장 및 하이퍼바이저 보호, AAA(인증, 권한 부여, 계정 접근 제어), 네트워크 속도 제한, 스테이틀리스 방화벽(Stateless Firewall) 등의 고급 보안 기능이 반드시 제공되어야 하는 것도 바로 이러한 이유 때문이다. 또한, 인프라 데이터베이스 프라이버시, 오픈스택 스푸핑 보호, 테넌트 데이터 접근 프라이버시 및 암호화, 보안 패스워드 관리 등의 데이터 보호 기능을 통해 안전한 NFV 환경을 구현해야 한다.

 

NFV인프라가 모든 종류의 애플리케이션에 대한 예측 가능한 강력한 성능을 제공하는가?

높은 대역폭, 멀티미디어 비디오 애플리케이션 등으로 인해 NFV 인프라의 트래픽 용량, 처리량(Throughput), 지연율에 대한 요구는 갈수록 높아지고 있으며, 광통신 및 4G 무선 통신 등의 고용량 액세스 기술을 통해 이러한 과제를 해결할 수 있다. 따라서 시스템도 반드시 최대한 효율적으로 성능에 대한 요구를 만족시킬 수 있어야만 한다.


애플리케이션마다 우선 순위가 다르고 요구되는 실시간 요건의 폭이 다양하므로 표준에 맞춘 서비스 품질(QoS, Quality-of-Service)을 구현해 최종 사용자들의 체감 품질(QoE, Quality-of-Experience)에 대한 기대 수준을 충족시킬 수 있는 NFV 인프라 시스템이 요구된다.


이를 위해서는 저지연 인터럽트(Low Latency Interrupt), VM 타이머 서비스, VM 할당 자원 제한, 고성능 VM간 통신 등을 제공해 예측 가능한 성능을 구현하는 방법이 있다. 또한 커널 선점(Preemption)을 통해 컴퓨팅 리소스에 요구되는 실시간 기능을 제공함으로써 인터럽트를 최소화하거나, 스케줄러를 사용하여 다른 기능으로부터의 격리를 통해 컴퓨팅 리소스를 공평하게 분배하고 지연율을 최소화할 수 있다.


이외에 정책 기반의 오버로드 제어 및 메모리 상태를 체크하는 등의 리소스 모니터링과 더불어, 범위 이외의 요청이나 유효하지 않은 요청을 보호함으로써 시스템의 성능을 강화할 수 있다.

 

NFV인프라가 높은 확장성을 보장하는가?

용량에 대한 요구가 높아지면서, NFV인프라 시스템에 VM 및 프로세싱 파워를 효율적으로 추가할 수 있어야 하며, 비용 대비 고용량의 가치를 확보해야 한다.


이를 위해서는 모듈형 하드웨어와 설계에 따른 제약이 없는 소프트웨어 아키텍처가 요구된다. 또한 명확하게 정의된 인터페이스를 통해 시스템 확장 및 상호운용성(Interoperability)을 제공하는 모듈형 시스템이 제공되어야 하며, 이를 기반으로 수백 혹은 그 이상의 VNF를 효율적인 비용으로 추가할 수 있도록 VM을 추가로 생성할 수 있어야 한다.
 

저작권자 © 컴퓨터월드 무단전재 및 재배포 금지