가트너 멍린 차오(Menglin Cao) 디렉터 애널리스트
[컴퓨터월드] 생성형 AI(GenAI)와 대규모언어모델(LLM)의 급속한 확산으로 데이터센터 운영에 경고등이 켜지고 있다. AI로 인해 기존과는 다른 컴퓨팅 성능이 요구되면서, 데이터센터는 막대한 에너지를 소모하고 있다. AI 모델이 복잡해지고 고도화되면서 이를 뒷받침하기 위한 에너지 소모가 증가하고 있어 데이터센터 운영에 상당한 부담을 주고 있는 것이다.
2027년, AI 데이터센터의 40%가 전력 부족 문제 예상
가트너에 따르면, 2027년에는 AI 최적화 서버를 추가적으로 운용하는 데 필요한 데이터센터 전력이 연간 500테라와트시(TWh)에 달할 것으로 전망된다. 이는 2023년 대비 두 배 이상으로 증가한 수치다. 이처럼 생성형 AI의 전력 수요가 가파르게 증가하면서 전기 요금 상승, 냉각 시스템 과부하로 인한 성능 저하, 화석 연료 의존도 증가에 의한 지속가능성 약화 등 데이터센터 운영에 심각한 문제가 발생하고 있다.
또한 가트너는 2027년까지 기존 AI 데이터센터의 약 40%가 전력 부족 문제를 겪을 것으로 전망했다. 이는 단지 데이터센터 운영에 국한된 문제가 아니라 서비스 제공에도 영향을 미쳐, 결국 고객과 최종 사용자에게 비용 상승 및 성능 저하와 같은 연쇄작용을 불러일으킬 수 있다. 이는 IT 조직의 생성형 AI 기술 역량 자체를 제한하는 요인으로 작용해, 관련 제품 및 애플리케이션의 실제 배포를 어렵게 만들고 있다.
데이터센터의 전력 소비가 증가하면서 이에 따른 운영 리스크를 더 이상 무시할 수 없게 됐다. 이제 관련 기업들은 이를 해결하기 위한 전략을 본격적으로 수립해야 한다. 생성형 AI 애플리케이션을 개발할 때 최소한의 컴퓨팅 성능으로 제품을 운영할 수 있도록 설계하고, 엣지 컴퓨팅과 소규모언어모델(SLM) 같은 대안을 적극적으로 검토해야 한다.
AI 추론 작업 일부를 엔드포인트 기기로 이전하는 방식이 주요 대안이 될 수 있다. 온디바이스 기반 생성형 AI는 네트워크나 서버 연결 없이 기기 자체에서 AI 모델을 실행할 수 있어, 높은 응답성과 데이터 프라이버시라는 강력한 이점을 갖고 있다. 데이터센터의 전력 제한 압박이 커지면서 온디바이스 AI는 더욱 매력적인 솔루션으로 부상하고 있다. 가트너는 2026년까지 클라우드보다 온디바이스에서 처리되는 생성형 AI 쿼리가 더 많아질 것으로 예상했으며, 이는 AI 전략에서 중대한 변화가 일어나고 있음을 의미한다.
이러한 흐름에 맞춰 기업들은 AI 전략을 재검토해야 하며, 특히 생성형 AI 처리 작업을 온디바이스로 분산하기 위한 최적의 추론 방식을 신중하게 고려해야 할 것이다. 이러한 전략적 전환을 통해 기업은 데이터센터 전력 제약으로 인한 위험을 완화하고, 전반적인 사용자 경험을 개선하며, 급변하는 AI 환경 속에서 미래 수요에 효과적으로 대응해 기업의 경쟁력을 강화할 수 있다.
통합적이고 획기적인 기술 혁신 필요
데이터 프라이버시 강화, 지연 시간 및 응답 시간 단축과 같은 향상된 사용자 경험에 대한 요구가 증가하면 스마트폰, PC, 태블릿, 확장현실(XR) 헤드셋, 웨어러블 기기, 차량, 로봇, 사물인터넷(IoT) 기기 등 엔드포인트 기기에서 생성형 AI를 처리하는 추세가 가속화될 것이다.
그러나 온디바이스 생성형 AI 처리는 엔드포인트 기기의 제한적인 폼팩터(Form Factor)로 인해 고도의 에너지 효율을 요구하며, 생성형 AI 기능이 기기의 작동 시간 또는 배터리 수명을 단축하지 않아야 한다는 과제를 안고 있다. 따라서 온디바이스 생성형 AI 처리가 성공적으로 자리 잡기 위해서는 반도체, 배터리, AI 모델 전반에 걸친 통합적이고 획기적인 기술 혁신이 필수적이다.
먼저 실시간 처리와 짧은 지연 시간을 위한 에너지 효율이 높은 칩이 필요하다. AI 전용 프로세서, 저전력 메모리, 신경망처리장치(NPU)와 더불어 애플리케이션 프로세서와 마이크로컨트롤러 유닛(MCU)을 통합한 설계가 온디바이스 생성형 AI 구현의 핵심이며, 특히 질화갈륨(GaN) 기반 와이드밴드갭 반도체는 고속 충전기의 전력 변환에 중요한 역할을 해 사용자 경험을 크게 향상시킨다. 로컬 생성형 AI 처리는 배터리 수명을 빠르게 소모할 수 있기에, 배터리로 구동되는 스마트폰, PC와 같은 엔드포인트 기기에서 고속 충전 지원은 생성형 AI 사용자 경험을 좌우하는 핵심 요소다.
배터리 기술의 중요성 또한 간과할 수 없다. 스마트폰, PC, XR 헤드셋, 웨어러블 기기 등 대부분의 엔드포인트 기기는 배터리로 작동하며, 온디바이스 생성형 AI 처리는 이러한 기기의 에너지 소비를 증가시킨다. 따라서 더 긴 작동 시간을 확보하기 위해서는 고체 리튬이온 배터리와 같이 에너지 밀도가 향상된 배터리가 필수적이다.
AI 모델 경량화가 중요
마지막으로 AI 모델 경량화가 핵심 과제다. 엔드포인트 기기에서 로컬 처리를 효과적으로 구현하려면 더 적은 매개변수 세트를 가진 맞춤형 AI 모델이 필요하다. 이러한 경량 LLM은 특정 작업과 분야에 최적화됨으로써 연산 요구 사항을 줄여, 기존의 거대 LLM으로는 실행하기 어려웠던 엔드포인트 기기에도 적합하다.
생성형 AI의 지속적인 발전은 전력 수요 급증을 야기할 것이며, 이에 따라 AI 배포 전략의 근본적인 전환이 불가피할 것이다. 온디바이스 처리로의 전환은 단순한 필요를 넘어 효율성 제고, 지연 시간 감소, 데이터 프라이버시 강화의 기회로 작용한다. 이 기회를 최대한으로 활용하기 위해서는 에너지 효율을 저해하지 않으면서 최적의 성능을 구현할 수 있는 반도체, 배터리, AI 모델 설계의 혁신이 필수적이다. 이러한 변화에 선제적으로 대응하는 기업만이 전력 부족 현상이 심화되는 상황 속에서도 혁신과 지속가능성의 균형을 유지하며, AI 시대에서 경쟁 우위를 확보할 수 있을 것이다.


