인텔 ‘제온 파이’ 역사 속으로, GPU 가속기 입지 굳혀…“클라우드 HPC 수요 주목”

[컴퓨터월드] 국가 주도의 연구 과제 수행이나 기상청 날씨 예측 프로그램의 하드웨어(HW) 인프라로 쓰이던 슈퍼컴퓨터, 즉 고성능 컴퓨팅(High Performance Computing, HPC) 관련 기술이 주목받고 있다. 인공지능(AI)과 빅데이터 분석이 대세가 되면서 일반적인 컴퓨팅 자원으로는 방대한 양의 데이터를 더욱 빠르게 처리하기를 요구하는 현재의 추세를 맞춰나가기 어려워졌기 때문이다.

수많은 고성능의 컴퓨팅 자원을 병렬 구조로 연결해 더욱 빠른 처리 속도를 내는 HPC 기술은 이제 점점 더 많은 기업에서 도입을 검토하고, 온프레미스부터 클라우드에 이르기까지 다양한 방식으로 도입이 이뤄지고 있다. 실시간 데이터 분석 및 예측모델 계산, AI, 위험분석, 제품 모델링, 유체역학, 시뮬레이션 등 많은 분야에서 사용되는 HPC는 기존 일반 시스템 대비 연산 속도를 크게 단축시킬 수 있다는 이점이 있다.

▲ 엔비디아 T4 서버

최근 AI 분야가 크게 발달한 데는 연산 시간을 크게 줄여주는 ‘가속기(Accelerator)’가 큰 역할을 했으며, 관련 시장에 많은 관심이 쏠렸다. 특히 GPU(그래픽 처리 장치)를 활용하는 GPGPU(General-Purpose computing on Graphics Processing Units, GPU를 이용한 범용 계산) 기술이 등장하면서 딥러닝 기술이 본격적으로 발달했고, 이 분야에서 GPU 제조기업인 엔비디아가 각광받으며 크게 성장했다. 엔비디아의 GPU 가속기를 활용하면 기존 HW 대비 매우 저렴한 비용으로 고성능의 HPC 시스템을 구성할 수 있기 때문에, 국가 연구기관이나 거대 기업뿐만 아니라 대학 연구실이나 중소규모 기업들까지 손쉽게 딥러닝을 활용한 각종 연구 및 모델 개발이 가능해졌다.


가속기 시장 승자는 GPU…FPGA·ASIC 2차전 예고

엔비디아는 그간 ‘테슬라(Tesla) P100’ GPU에 이어 차세대 ‘V100’ GPU 가속기를 선보이며 성능을 향상시켜왔고, 최근에는 최신 ‘T4’ GPU를 출시하며 앞선 기술력을 선보이고 있다.

▲ 엔비디아 T4

최신 ‘T4’를 장착해 데이터 사이언스 가속 소프트웨어(SW) 구동에 최적화된 ‘엔비디아 T4 서버’는 현재 시스코(Cisco), 델EMC(Dell EMC), 후지쯔(Fujitsu), HPE, 인스퍼(Inspur), 레노버(Lenovo) 및 수곤(Sugon) 등의 업체를 통해 ▲시스코 UCS C240 M5 ▲델EMC 파워엣지(PowerEdge) R740/R740xd ▲후지쯔 프라이머지(PRIMERGY) RX2540 M5 ▲HPE 프로라이언트(ProLiant) DL380 Gen10 ▲인스퍼 NF5280M5 ▲레노버 씽크시스템(ThinkSystem) SR650 ▲수곤 W760-G30 등 다양한 모델이 제공되고 있으며, NGC-레디(NGC-Ready) 인증을 거쳐 AI, 데이터 분석, 머신러닝(ML) 및 딥러닝(DL) 등 HPC 워크로드 전반에서의 성능을 보장한다.

한편 인텔은 2010년대 초 엔비디아의 GPU에 맞서 CPU를 보조하는 보조프로세서(co-processor)인 ‘제온 파이(Xeon Phi)’를 내놓으며 엔비디아와 가속기 시장 주도권을 노렸으나, 이미 대세가 된 GPU 기반의 가속기 시장을 결국 탈환하지 못했다. 인텔은 최근 차세대 ‘제온 파이’ 개발을 중단한 것으로 알려졌으며, FPGA(프로그래밍이 가능한 비메모리 반도체) 기업인 알테라(Altera)를 인수, FPGA 기반의 가속기에 집중하고 있다.

[관련기사]

인텔, 10나노 기반 ‘애질렉스(Agilex) FPGA’ 출하 개시
네트워킹, 5G 및 가속화된 데이터 분석에 적용

 

▲ 인텔 애질렉스

인텔은 9월 초 ‘애질렉스 FPGA’ 비메모리 반도체를 초기 액세스 프로그램 고객에게 출하하기 시작했다고 밝혔다.

인텔의 ‘애질렉스’ 제품군은 인텔의 10nm(나노미터) 공정을 기반으로 ‘2세대 하이퍼플렉스 FPGA 패브릭(second-generation HyperFlex FPGA fabric)’과 인텔의 검증된 ‘임베디드 멀티-다이 인터커넥트 브릿지(EMIB)’ 기술 기반의 ‘실리콘-인-패키지 (silicon-in-package)’ 기술과 함께 여러 혁신적인 인텔 기술을 결합했다.

인텔 ‘애질렉스 FPGA’의 특장점은 인텔 제온 스케일러블 프로세서(Intel Xeon Scalable processors)와의 캐시 및 메모리 일관성 인터커넥트인 CXL(Compute Express Link)을 지원할 수 있으며, 2세대 하이퍼플렉스 아키텍처를 탑재해 인텔 스트라틱스 10 FPGA(Intel Stratix 10 FPGAs)에 비해 최대 40% 더 높은 성능을 발휘하거나 최대 40% 더 낮은 전력을 자랑한다.

데이터 송수신 속도 또한 400GE 이상의 고속 네트워킹 요구 사항에 대해 최대 112Gbps의 데이터 속도를 지원하며 첨단 메모리인 현 DDR4 및 향후 DDR5, HBM 및 인텔 옵테인 DC 퍼시스턴트 메모리 지원이 가능하다.

댄 맥나마라(Dan McNamara) 인텔 수석 부사장 겸 네트워킹 및 커스텀 로직 그룹의 총괄 매니저는 “인텔 ‘애질렉스 FPGA’ 제품군은 아키텍처, 패키징, 공정 기술, 개발자 툴 및 eASIC 기술로 전력을 절감하는 등 광범위한 인텔 혁신 및 기술 리더십을 활용했다”며 “이러한 탁월한 자산은 새로운 수준의 이기종 컴퓨팅, 시스템 통합 및 프로세서 연결성을 제공하며, 곧 출시될 컴퓨트 익스프레스 링크(Compute Express Link)를 통해 인텔 제온 프로세서(Intel Xeon processors)에 캐시-일관성 및 저지연 연결성을 제공하는 최초의 10나노 FPGA가 될 것”이라고 밝혔다.

이밖에 FPGA 부문 시장 1위 기업 자일링스(XILINX)는 얼마 전 새롭게 ACAP(Adaptive Compute Acceleration Platform)이라는 이름으로 기존 FPGA보다 발전된 개념의 가속 플랫폼을 출시했다.

 

▲ 자일링스의 신개념 가속 플랫폼 ‘버설’

AI 및 ML에 최적화된 새로운 개념의 컴퓨팅 가속화 플랫폼이라고 소개된 자일링스의 ‘버설(Versal)’은 TSMC의 7나노미터(nm) 핀펫(FinFET) 공정 기술을 기반으로 스칼라 프로세싱 엔진, 적응형 HW 엔진 및 지능형 엔진을 최첨단 메모리 및 인터페이스 기술과 결합해, 모든 애플리케이션에 강력한 이종 가속 기능을 제공한다. 특히 ‘버설’ ACAP의 HW 및 SW가 SW개발자, 데이터과학자 및 HW개발자 등에 의해 프로그래밍 및 최적화될 수 있으며 다양한 툴, SW, 라이브러리, IP, 미들웨어 및 프레임워크로 활성화돼 이를 통해 업계 표준 설계가 가능하다.

자일링스에 따르면 포트폴리오에는 ‘버설 프라임(Versal Prime) 시리즈’, ‘버설 프리미엄(Premium) 시리즈’ 및 HBM 시리즈가 포함돼 있다. 요구 조건이 가장 까다로운 애플리케이션을 위해 업계 최고의 성능, 커넥티비티, 대역폭 및 통합성을 제공하도록 설계됐다. 포트폴리오에는 AI 코어(Core) 시리즈, AI 에지(Edge) 시리즈 및 AI RF 시리즈도 포함되며, 모두 탁월한 AI 엔진 사양을 구비하고 있다.

AI 엔진은 다양한 애플리케이션에서 저지연 AI 추론 기능에 대한 새로운 필요성을 해결하고자 고안된 새로운 하드웨어 블록이며, 무선 및 레이더와 같은 애플리케이션을 위해 향상된 DSP 구현을 지원한다. 이는 버설(Versal) 적응형 하드웨어 엔진(Versal Adaptable Hardware Engines) 제품군과 밀접하게 연동돼 애플리케이션 전체의 가속화를 가능하게 한다. 즉, 하드웨어와 소프트웨어 모두를 조율해 성능과 효율성을 모두 극대화할 수 있다.

자일링스는 이 포트폴리오가 ‘버설 프라임(Versal Prime)’ 시리즈로 데뷔해 다양한 시장에 폭넓게 적용 가능하며, 버설(Versal) AI 코어(Core) 시리즈는 업계 선두의 GPU 대비 약 8배의 AI 추론 성능을 제공한다고 설명했다.

빅터 펭(Victor Peng) 자일링스 CEO는 “AI 및 빅데이터의 폭발과 무어의 법칙의 쇠퇴로 업계는 중요한 변곡점에 도달했다. 실리콘의 설계 주기는 더 이상 혁신의 속도를 따라갈 수 없다”면서, “4년에 걸친 개발 기간 끝에 발표된 ‘버설’은 업계 최초의 ACAP이다. 자일링스는 모든 유형의 개발자들이 최적화된 하드웨어와 소프트웨어를 사용해 애플리케이션 전체를 가속화하고, 빠르게 진화하는 기술에 발 맞춰 이들 모두를 즉시 적응시키도록 독보적인 설계를 구현했다. 업계가 필요로 하는 바로 그 순간에 안성맞춤인 플랫폼”이라고 말했다.

이처럼 가속기 시장은 GPU와 코프로세서의 경쟁에서 GPU가 살아남아, 이제는 FPGA 혹은 ASIC과 같이 맞춤 설계된 반도체 기반의 가속기와의 본격적인 2차 경쟁 시대를 맞고 있다.


HPC, 온프레미스 넘어 클라우드로

HPC는 최근 추세에 맞춰 온프레미스를 넘어 클라우드로 영역을 확장하고 있다. 국내 에너지 솔루션 공급업체인 현대일렉트릭은 최근 HPC 인프라를 구축하기 위해 HPC 플랫폼 제공사인 리스케일(Rescale)의 ‘스케일X(ScaleX)’ 플랫폼을 AWS 기반으로 구축한다고 발표했다. 해당 HPC 환경은 제품 시뮬레이션을 수행하는 CAE(Computer Aided Engineering) 분야에서 쓰이며 열유동 해석, 구조 해석, 진동 해석, 전자기 해석 등 다양한 분야의 시뮬레이션 업무에 활용된다.

현대일렉트릭은 기존 32코어 환경의 장비에서는 해석 업무가 최대 한 달가량 소요되는 경우도 있었으며, 128코어 이상을 활용한 해석이 불가능했다. 또한 2D 모델 기반 시뮬레이션 작업 시 겪었던 제약으로 인해 풀 스케일(Full scale) 모델 해석에 한계가 있었다.

그러나 이번에 AWS와 리스케일에서 운영되는 HPC 환경을 구축함으로써 대규모 시뮬레이션 및 해석 작업을 손쉽게 수행할 수 있게 됐고, 이를 통해 제품 개발 기간 단축 및 제품개발 범위를 대폭 확장할 수 있게 됐다. 실제로 한 달 가량 소요되던 해석 업무를 6시간으로 단축했으며, 512 코어 이상이 필요한 여러 개의 해석 업무를 동시에 수행함으로써 운영 효율성을 높일 수 있었다. 또한 새로운 3D 모델 기반 시뮬레이션 시스템을 통해 풀 스케일(Full scale) 해석까지 가능하다.

현대일렉트릭은 신규 HPC 인프라를 기반으로 제품 설계와 분석 작업 속도를 가속화할 수 있게 돼 제품 성능 향상에도 성과를 거두고 있다고 밝혔다. 특히, 클라우드 환경이라는 특성에 따라 HPC 설비를 직접 증설하는 경우와 비교해 라이선스 비용, 유지 보수 관리비, 해석용 워크스테이션 자본투자 비용 등 연간 20% 정도의 비용이 절감될 것으로 기대하고 있다는 설명이다. 이로써 회사는 신제품 개발에 박차를 가하고, 더 나아가 혁신 기술을 기반으로 하는 에너지 솔루션기업으로 거듭난다는 계획이다.

현대일렉트릭의 사례와 같이 다양한 분야에서 기업의 HPC 수요가 확대됨에 따라, 최근 삼성SDS가 HPC 데이터센터를 설립할 것으로 알려졌다. 2021년 완공을 목표로 약 230억 원을 투자해 부지를 마련하고, 관련 인력을 충원한다는 소식이다.

국내 클라우드 서비스 공급업체인 NBP의 경우 ‘네이버 클라우드 플랫폼’을 기반으로 HPC 서비스를 제공하고 있다. NBP에 따르면 최근 국내에서는 시장 리스크에 따라 예상치 못한 변화가 많은 금융 산업에서 HPC 클라우드 서비스에 대한 니즈가 점차 늘어나고 있다고 한다. 클라우드 HPC는 탄력적인 대응이 가능하면서 사용한 만큼만 비용을 지불하면 되기 때문이다. NBP의 클라우드 HPC는 이미 지난해 미래에셋대우에 공급됐다.

▲ ‘네이버 클라우드 플랫폼’의 고사양 서버를 운영하는 고전력 서버실

클라우드 컴퓨팅 전문 업체인 이노그리드도 최근 클라우드 기반의 HPC 기술 개발에 나선다고 발표했다. ‘CA클라우드잇(Ctrl+A Cloudit)’이라는 이름의 해당 소프트웨어 정의 서버(Software-Defined Server) HPC는 ▲소프트웨어 정의 서버 기반으로 HPC처럼 고성능 컴퓨팅 파워를 슈퍼가상머신(Super-VM)으로 제공 ▲다양한 물리적 x86서버들을 하나의 서버로 묶어 병렬서비스 제공 ▲x86서버의 다양한 자원들 CPU, GPU, 메모리, 스토리지 등을 하나의 단일 시스템처럼 클라우드로 제공 등 3가지 장점이 있다고 소개됐다.

가상화와 클라우드 서비스가 물리 서버 한대를 나눠 쓰는 방식이었다면, 이노그리드의 HPC서비스 ‘CA클라우드잇’은 물리서버 여러 대를 병렬 처리해 하나의 서버로 묶어 강력한 컴퓨팅파워를 클라우드로 서비스한다는 설명이다.

특히, 클라우드 내 다수 물리서버 자원통합을 역가상화를 통해 단일 가상화로 묶는 ‘하이퍼체인(Hyper chain)’ 기술이 핵심이라고 이노그리드 측은 설명했다. 이는 기존 가상화 서비스의 반대 개념으로, 창업 초기 HPC 사업을 위해 슈퍼컴 병렬화 및 최적화 사업과 그리드 기술 기반 CDN사업을 통해 HPC 분야 기술을 내재화시켜 왔다는 점을 이노그리드는 강조하고 있다.

김명진 이노그리드 대표는 “기업에서 필요한 강력한 컴퓨팅자원을 클라우드 서비스로 전재적소에 공급할 수 있는 차별화된 HPC 서비스를 통해 클라우드 영토확장은 물론 향후SDx(Software Defined Everything)를 통해 클라우드의 한계를 뛰어 넘을 것”이라고 말했다.

또한 이노그리드 관계자는 “기존에 슈퍼컴퓨터를 설치해 운영하던 전통적인 방식에서 탈피해 기업이 필요로 하는 시점에 다양한 고성능 컴퓨팅자원을 골라 쓸 수 있는 동시에 클라우드로 간편하게 제공받을 수 있게 된다”면서, “기업들이 설치운영 및 유지보수 등 비용절감은 물론 개발 및 엔지니어들에게 연구개발(R&D)에 더욱 집중할 수 있도록 HPC 문턱을 대폭 낮추는 신개념 서비스를 제공해 나갈 것”이라고 말했다.

저작권자 © 컴퓨터월드 무단전재 및 재배포 금지