변재근 델 테크놀로지스 UDS 사업부 전무

[컴퓨터월드] 델 테크놀로지스가 기하급수적으로 늘어나는 비정형데이터를 비용효율적으로 저장 및 활용할 수 있는 스토리지 솔루션을 선보이며 국내 시장 입지 굳히기에 나선다. 회사는 비정형데이터를 담당하는 UDS(Unstructured Data Solution) 사업부를 필두로 스케일 아웃 NAS 베스트셀러 ‘아이실론(Isilon)’을 업그레이드해 ‘파워스케일(PowerScale)’이라는 이름으로 새롭게 선보였다. 기존의 IT업무, 특히 정형 데이터에 맞춰진 기존 스토리지로는 빅데이터 시대에 대응이 어렵기에 ‘데이터 레이크’ 구현에 가장 적합한 스토리지 솔루션으로 시장에 어필하고 있다. 델 테크놀로지스의 UDS 사업부를 맡고 있는 변재근 전무와의 화상 인터뷰를 통해 비정형데이터와 ‘데이터 레이크’, 그리고 ‘파워스케일’ 솔루션의 활용 사례 등에 대해 들어봤다.

변재근 델 테크놀로지스 UDS 사업부 전무
변재근 델 테크놀로지스 UDS 사업부 전무

비정형데이터 분석 위한 ‘데이터 레이크’ 구축 필요성 높아져

폭증하는 데이터를 비즈니스 관점에서 어떻게 활용할 것인가? 하는 문제는 오늘날 기업의 생존을 좌우할 정도로 중요한 과제가 됐다. 그간 기업들은 비즈니스 인텔리전스(BI)부터 빅데이터 분석을 위한 하둡(Hadoop) 등까지 다양한 도구(tool)를 사용해 데이터를 분석·활용해왔으나, 이러한 환경 아래에서 나타나는 데이터의 사일로(silo)화는 IT 담당자들이 해결해야 하는 고민이기도 했다. 즉 수많은 포인트에서 기하급수적으로 생성되는 빅데이터를 실시간으로 분석해 유용한 비즈니스 통찰력(insight)을 얻고자 한다면, 보다 전체적인 관점에서 한층 더 효율적으로 데이터를 활용할 수 있는 아키텍처가 필요하다. 이러한 고민에 대한 해답으로 최근 주목받고 있는 것이 ‘데이터 레이크(Data Lake)’다.

‘데이터 레이크’는 정형데이터뿐만 아니라 소셜 텍스트, 센서 데이터, 이미지, 동영상 등 다양한 비정형데이터까지 모든 형태의 데이터를 담는 하나의 대규모 저장소(repository)다. IDC 조사에 따르면 2025년이 되면 전 세계적으로 한해 총 163ZB의 데이터가 생성될 것으로 예상되며, 생성되는 데이터의 80%가 비정형데이터로 분류된다. 여기에 기존 온프레미스는 물론 멀티 클라우드 환경, 나아가 사물인터넷(IoT)까지 확산되면서 기업의 데이터센터 밖에서 만들어지는 데이터가 50% 이상일 것으로 예측되고 있다.

변재근 델 테크놀로지스 UDS 사업부 전무는 “전통적인 IT 워크로드에서는 데이터베이스(DB)나 이메일, 아카이빙, 홈디렉토리 등 기업 내 활동을 통해 생성되는 정형 데이터, 즉 블록(block) 형태의 데이터가 대부분이었다. 그러나 최근에는 4차 산업혁명이라는 이름 아래 인공지능(AI), 데이터 분석, 첨단운전자지원시스템(ADAS), 사물인터넷(IoT) 등이 떠오르고 이에 따라 다양한 기기(device)에서 많은 데이터가 발생하고 있다”면서, “전통적으로 데이터를 많이 사용하던 금융권이나 제조업을 넘어 에너지, 미디어&엔터테인먼트, 헬스케어, 전자설계자동화(EDA) 등 다양한 워크로드에서 비정형데이터들이 생성 및 사용되고 있다”고 설명했다.

이어 “데이터 형태, 즉 프로토콜 역시 다양해졌다. 과거에는 비정형데이터라고 하면 NAS를 떠올렸고, NAS에서는 NFS, SMB, HTTP나 FTP 등의 프로토콜이 다였지만, 최근에는 하둡파일시스템(HDFS)이나 S3를 비롯해 REST API까지 다양한 프로토콜들이 생성된다. 이처럼 다양한 디바이스나 데이터 형태를 어떻게 관리하느냐가 오늘날 기업들이 맞닥뜨리는 도전이라고 할 수 있다”고 덧붙였다.


‘파워스케일’로 비정형데이터 시장 공략

이러한 배경에 따라 다양한 곳에 위치한 데이터를 단일 볼륨에서 관리하면서 비정형데이터와 정형데이터를 모두 아우를 수 있는 ‘데이터 레이크’의 필요성이 점차 높아지고 있다. 즉 기업이 디지털 트랜스포메이션(Digital Transformation)을 통해 경쟁력을 높이고자 한다면 모든 유형의 데이터를 한 곳에 모아 손쉽게 관리하고, 필요할 때 손쉽게 데이터를 찾아 분석하며, 공유까지 편리하게 할 수 있는 ‘데이터 레이크’를 마련해 효율성을 극대화해야 한다는 것이다.

데이터의 실질적인 저장과 보관을 담당하는 스토리지 업계는 데이터 레이크를 구축하기 위해 가장 적합한 플랫폼으로 분산파일시스템 기반의 파일 및 오브젝트 스토리지를 제시한다. 특히 업계 리더 기업인 델 테크놀로지스는 비정형데이터 전문 조직인 UDS 사업부를 필두로 신제품 ‘파워스케일(PowerScale)’을 선보이며 시장 공략에 나서고 있다. 올해 3분기까지 국내 스케일 아웃(Scale-out) NAS(Network-Attached Storage) 시장에서 IDC 조사 기준 59%의 점유율을 기록한 델 테크놀로지스는 ‘델 EMC 아이실론(Isilon)’으로 비정형데이터 부문의 기술력을 입증해왔으며, 여기에 ‘델 EMC 파워엣지(PowerEdge) ’ 서버와 단일 파일 시스템인 ‘델 EMC 원FS(Dell EMC OneFS)’를 결합해 최근 새롭게 ‘파워스케일’을 출시했다.

델EMC 파워스케일
델EMC 파워스케일

진정한 ‘스케일 아웃’이 가능한 솔루션

일반적으로 고객들은 스토리지 장비를 여러 대 구매하고, 들어간 비용만큼 성능 역시 함께 향상되기를 원한다. 그러나 기존 스토리지 아키텍처에서는 컨트롤러 성능의 한계에 부딪히면 일정 수준 이상의 성능 향상을 기대하기 어려운 게 사실이다. 특히 비용 대비 성능 향상을 예측하기 쉽지 않다는 점이 문제다. 그러나 ‘파워스케일’은 스케일 아웃과 스케일 업 아키텍처를 모두 지원하는 스토리지로, 특히 스케일 아웃 시에 진정한 선형적 성능 향상이 가능하다는 점이 특징이다.

또한 ‘파워스케일’은 스케일 아웃 시에 오토밸런스(AutoBalance) 기능을 제공해, 관리자가 개입하지 않아도 노드를 증설하면 데이터를 전체 노드로 균등하게 분산해 전체 스토리지 자원을 최적화해준다. 스토리지 노드를 추가하거나 제거해도 데이터의 이관 없이 자동으로 재구성되며, 전체 노드 변경까지도 가능하다.

단일 볼륨으로 사용할 수 있다는 것도 장점이다. 꽉 찬 볼륨이나 빈 볼륨을 관리해야 하는 작업이 없어지고, 전체적인 자원 관리 차원에서 쉽게 사용할 수 있다. 즉 불필요한 작업으로 인한 리스크가 줄어드는 것은 물론, 운영에 필요한 자원 역시 감소돼 효율적으로 예산을 집행할 수 있다.

자동 티어링(Auto-Tiering)을 통해 경제적 측면에서의 요구도 충족시킨다. 플래시, 하이브리드, 아카이브 스토리지를 모두 단일 파일시스템 아래 단일 볼륨으로 구성하고, 정책 기반으로 데이터를 계층화(tiering)해 관리할 수 있어 효율적인 사용이 가능하다. 마지막으로 멀티 프로토콜을 지원해 접근성이 뛰어나다는 것도 강점이다. 오브젝트 프로토콜인 S3를 통해 저장된 데이터를 별도 변환 없이도 하둡을 통해 분석하는 등 간편한 사용이 가능해지는 것이다.

변재근 전무는 “노드 단위로 쌓아 올리면서 확장해나갈 수 있는 ‘파워스케일’의 진정한 스케일 아웃 구조는 ‘원FS’를 기반으로 가능하다. 특히 CIO 입장에서 투자의 불확실성을 많이 걱정하는데, ‘파워스케일’의 진정한 스케일 아웃 구조는 작은 규모에서 시작해 비즈니스가 커짐에 따라 민첩하게 대응할 수 있도록 차별성을 제공한다”고 강조했다.

변재근 델 테크놀로지스 UDS 사업부 전무
변재근 델 테크놀로지스 UDS 사업부 전무

다양한 비정형데이터 관련 수요 대응

변재근 전무는 현재 국내에서 비정형데이터에 대한 수요가 많은 영역으로 방송을 포함하는 미디어&엔터테인먼트, 스트리밍, 헬스케어, 빅데이터 분석, AI 등이 있다고 설명했다.

먼저 방송 부문의 경우 과거에는 영상의 용량의 크지 않았지만, HD 방송으로 넘어오면서 파일 용량이 커졌고, 편집 역시 복잡해졌다. 수십 대의 카메라를 통해 찍힌 영상을 짧은 시간에 협업해야 하기 때문이다. 변재근 전무는 “편집과 같이 고성능이 필요한 부분과 방송 송출 등에는 SSD 기반의 올플래시 스토리지를 활용하도록 하고, 송출 후 재방송 영상 등은 저렴한 매체에 아카이빙하는 ‘파워스케일’의 티어링 기능이 방송 분야에서 매우 잘 활용되고 있다”고 설명했다.

스트리밍 시장에서도 많은 기회가 있었다. 올해 코로나19로 인해 넷플릭스와 같은 플랫폼이 급성장했음은 물론이고, 특히 원격학습을 본격적으로 시작하는 사례가 많았다. 변재근 전무는 “갑작스런 팬데믹으로 인해 초기 원격학습에 대한 수요 파악이 힘들었고, 향후 얼마나 많은 콘텐츠가 저장될 것이며 코로나19 사태가 얼마나 이어질지 등이 불확실했기 때문에 ‘파워스케일’의 스케일 아웃 및 계층화 기능이 잘 부합돼 시장에 어필했다”고 설명했다.

병원 등 헬스케어 분야에서도 ‘디지털 병리 솔루션’ 관련 수요가 높은 상황이다. 기존 PACS(의료영상저장전송시스템)를 넘어 3차원 사진을 AI가 분석하고, 병을 진단 및 추적하는 등 고용량의 데이터 처리가 필요한 영역이 됐기 때문이다. 마찬가지로 데이터 티어링과 멀티-프로로콜 데이터 가져오기(Ingestion) 등의 기능을 얼마나 잘 갖춰져 있느냐가 중요하다는 게 변 전무의 설명이다.

이외에 데이터 분석도 델 테크놀로지스가 주목하는 시장이다. ADAS 또는 자율주행차량 관련 AI/머신러닝(ML) 프로젝트에서도 ‘데이터 레이크’가 중요한 토대가 되기 때문이다. 델 테크놀로지스는 국내외에서 유수의 자동차 업체, ADAS 솔루션 업체와 협력해 구축 사례를 다수 확보하고 있으며, ADAS 기술 진보에 기여하고 있다고 밝혔다. 특히 빅데이터 분석 부문에서는 클라우데라와 긴밀하게 협력하며, AI와 머신러닝 부문은 엔비디아와의 파트너십을 통해 대응하고 있다.

변재근 전무는 “국내에서 활동하는 많은 IT인프라 공급사 가운데 비정형데이터사업부를 독립적으로 운용하는 것은 델 테크놀로지스 뿐이다. 그만큼 이 시장을 중요하게 보고 있다. 앞으로 ‘데이터 레이크’를 통해 데이터를 잘 활용하는 것이 기업 생존을 좌우할 수 있기 때문이다”라고 강조하고, “파워스케일 F200의 경우 최소 7TB 단위로 구성할 수 있어, 소용량이지만 고성능을 필요로 하는 중견중소기업까지 내년에는 타깃 시장을 확대해나갈 것”이라고 덧붙였다.

저작권자 © 컴퓨터월드 무단전재 및 재배포 금지