조나단 포레스트(Jonathan Forest) 가트너 시니어 디렉터 애널리스트

[컴퓨터월드] 

조나단 포레스트 가트너 시니어 디렉터 애널리스트
조나단 포레스트 가트너 시니어 디렉터 애널리스트

소개

인공지능(AI) 네트워킹은 네트워크 가용성과 성능 향상 그리고 운영 효율성을 약속한다. 그러나 기업의 인공지능 네트워킹 도입은 아직 초기 단계이다. 인프라 및 운영(I&O) 담당자는 AI 네트워킹의 구성 요소, 이점, 리스크 및 대안을 파악하여 향후 적용이 가능한지 판단해야 한다.

AI 네트워킹은 AI옵스(Ops)의 하위 범주로, Day 2 네트워크 운영을 보다 효율적으로 관리하기 위해 고려해 볼 수 있다. 광범위한 I&O 수준을 의미하는 AI옵스 중에서도 AI 네트워킹은 ‘네트워킹’에 특화된 개념이다.

AI 네트워킹과 관련된 다른 용어로는 자율 네트워킹, 자율 주행 네트워크, 자가 치유 네트워크 등이 있다. 이러한 용어들은 구체적인 정의가 없는 마케팅 용어로, 보통 AI 네트워킹을 설명하기 위해 사용되며(그림1 참조), 데이터센터 스위칭과 유무선 랜(LAN), 소프트웨어-정의 광역통신망(SD-WAN), 관리형 네트워크 서비스(MNS) 및 멀티클라우드 네트워킹 소프트웨어와 같은 네트워킹 도메인 전반에 적용된다. 일부 기능은 특정 도메인에서 다른 도메인보다 더 성숙한 수준을 보이지만, 데이터 수집 노력, 데이터 레이크 저장, 알고리즘, 데이터 사이언스, 그리고 네트워크 문제에 대한 자동화된 대응은 모든 영역에서 중요하다.

 같은 것을 의미하는 여러 용어
같은 것을 의미하는 여러 용어

AI 네트워킹에 대한 정의, 사용 사례 및 성숙도와 관련해서는 여전히 모호한 부분이 존재한다. 공급업체들은 효율적인 Day 2 네트워크 운영 관리를 위한 AI 네트워킹의 기능을 강조하고, 기업들은 가용성과 효율성, 성능 개선 그리고 적은 리소스로 더 많은 작업을 수행할 수 있느냐에 주목하고 있다.

챗GPT가 생성형 AI를 전면에 내세우기 전에는 AI 네트워킹 기술에 대한 과대 광고가 넘쳐났었다. 그러나 챗GPT가 초기의 제한된 챗봇 기능을 넘어 네트워킹 환경을 생성하고 문제를 해결하는 능력을 시연하면서, 이제 챗GPT는 새로운 차원의 과대광고를 일으키고 있다.

IT 운영 담당자는 AI 네트워킹에 대한 전반적인 기술을 이해하고 구매 결정을 내릴 수 있어야 한다.


설명

AI 네트워킹은 AI와 머신러닝(ML)을 사용해 세부적이고 구체적인 실행 가능한 네트워크 인사이트를 제공하는 기술이다. 네트워크 공급업체의 관리 플랫폼을 비롯해 여러 네트워크 공급업체를 지원하는 독립형 멀티 벤더 플랫폼과 AI옵스 플랫폼 또는 관리형 네트워크 서비스의 일부로 제공될 수 있다. 주로 Day 2 네트워크 인사이트를 제공하며, 문제 해결을 가속화하고 중단 및 문제 티켓(Trouble ticket)을 예방하는 권장 사항을 제공한다. 네트워크 설계 및 설정 측면에서는 Day 0 및 Day 1 기능과 네트워크 성능 최적화를 위한 동적인 권장 사항을 지원하기도 한다.

AI 네트워킹과 관련해 자주 사용되는 용어는 ‘예측 분석’이다. 예측 분석은 네트워크의 설계 목표와 정책을 이해하고, 사전 정의된 지표, 트래픽 흐름, 추세 및 패턴을 고려해 네트워크 기준선과 비교해 문제나 이슈가 발생하기 전에 해결하는 것을 목표로 한다. 그러나 가트너에 따르면 실질적인 예방 사례는 거의 없었던 것으로 평가되며, 주로 구성 오류 식별, 하드웨어 장애 예측, 성능 최적화 방법 추천과 같은 기능을 제공하는 것으로 나타났다.


AI 네트워킹은 일반적으로 다음과 같은 시나리오에서 사용된다.

● 신속한 문제 해결: 장애나 문제 발생 시 사용자가 이를 발견하기 전에 미리 대응한다. 이는 문제를 예방하는 예측 분석 및 해결과는 다른 개념이다.
● 여러 데이터 소스를 상호 연결해 문제 식별 중앙 집중화: 네트워크의 일부를 모니터링하고 이에 대응하기 위해서는 하나의 도구가 필요하다. 여기에는 토폴로지 생성 및 상황별 네트워크 관계 이해 등이 포함된다.
● 문제 티켓 긍정오류 최소화: 고급 분석을 통해 운영 인력 개입 없이 문제 티켓을 확인하거나 거부할 수 있다. 이를 통해 실제 문제가 아닌 티켓 추적에 소요되는 리소스를 절약할 수 있다.
● 레벨 1/레벨 2 지원 문제 해결: 현재 일부 레벨 1, 2 문제는 챗봇을 통해 최종 사용자와 자연어로 상호작용해 해결할 수 있다.
● 복잡한 문제에 대한 자동화된 권장 및 대응: 적절한 해결책이 있는지 판단하고, 추가적인 조사에 필요한 동적 패킷 캡처 및 데이터 흐름을 생성할 수 있다.


AI 네트워킹의 주요 구성 요소는 다음과 같다.

● 실시간 및 과거 데이터의 트렌드 분석 및 패턴 인식: AI 네트워킹 솔루션은 이벤트 및 원격 측정 데이터를 처리해 중요한 이벤트 또는 사고를 감지 및 예측한다. 플랫폼은 과거 데이터를 초기 기준으로 삼아 과거 데이터, 실시간 스트리밍 데이터, 운영자 입력 및 강화 메커니즘을 기반으로 중요한 이벤트의 개별 패턴을 지속적으로 학습하고 개선한다.
● 이상 탐지 및 이벤트 상관관계: AI 네트워킹 솔루션은 원격 분석 도메인 또는 소스 전반에서 이벤트를 자동으로 상호 연관 및 압축시켜 불필요한 인간 개입을 줄인다.
● 폐쇄 루프 문제 해결 및 자동화: AI 네트워킹 솔루션은 중요 이벤트와 운영 응답 사이의 연관성을 지속적으로 학습 및 개선한다. 이 솔루션은 권장 사항을 제공하거나 응답을 자동화하거나 외부 자동화 시스템을 트리거 할 수 있다.
● 생성형 AI: AI 네트워킹에는 명시적인 템플릿 없이도 사람의 입력을 기반으로 세부 구성과 문제 해결 절차를 생성할 수 있는 생성형 AI가 점점 더 많이 포함될 것이다. 예를 들어 엔지니어가 반복적인 프로세스를 통해 생성형 AI에 공급업체 A를 사용해 400개의 물리적 서버를 지원하는 리프-스파인(Leaf-Spine) 네트워크를 설계하도록 요청하면 플랫폼은 필요한 모든 구성을 생성한다. 현재는 챗봇이 자연어 처리를 통해 Day 2 운영에서 제한된 서비스 데스크 유형의 기능을 수행하고 있으나, 앞으로는 Day 0 및 Day 1까지 기능이 확장될 것으로 예상된다.
● 디지털트윈: AI 네트워킹이 디지털트윈을 포함하는 경우가 점점 더 많아지고 있다. 디지털트윈은 프로덕션 환경에 배포되기 전에 문제를 해결하기 위해 시뮬레이션된 비(非)프로덕션 환경에서 네트워크 및 네트워크 보안 변경의 영향을 검증하는 기능을 제공한다. 이를 통해 네트워크 테스트와 시범 운영 방식이 변화할 수 있다. 디지털트윈은 네트워크가 예상대로 작동하는지 확인하는 지속적인 통합 또는 배포(CI/CD) 파이프라인의 일부로 구현될 수 있다.


이점 및 용도

AI 네트워킹은 지원 요청을 줄이고 문제 해결을 개선하며 네트워크 가용성을 향상해 수동 리소스를 확장하는 것만으로는 현실적으로 달성할 수 없는 최종 사용자 경험을 최적화함으로써 오늘날 운영 관리 비용을 최대 25%까지 절감할 수 있을 것으로 보인다. 네트워크 관리의 간소화로 인해 담당자들에게는 환경 설정이나 문제 해결 기술이 요구되지 않을 것이다.

그러나 AI 네트워킹의 결과를 활용해 보다 전략적인 네트워킹 결정을 내리기 위해서는 새로운 데이터 사이언스 기술이 필요할 수 있다. 비즈니스 성숙여부에 따라 공급업체의 투자와 시장 채택이 증가할 것으로 예상되나, 캠퍼스 네트워크의 도입 속도가 WAN과 같은 다른 네트워킹 도메인보다 빠를 것으로 기대된다.


가트너가 예측하는 이점은 다음과 같다.

● 네트워크 가용성을 최대 25%까지 향상하고 애플리케이션 성능을 개선해 더 나은 최종 사용자 경험을 제공한다.
● 네트워킹이 간소화되고 네트워킹 팀의 심층 기술 의존도가 감소한다. 사내에서 네트워크를 관리할 직원을 구하기 어려운 조직은 MNS 공급업체에 아웃소싱할 수 있으나 비용이 들어간다. AI 네트워킹은 상대적으로 네트워킹 기술을 갖추지 못한 조직이 네트워크를 운영할 수 있는 대안을 제공한다.
● 네트워크 관리에 들어가는 인력의 감소로 네트워크 운영 관리 비용을 절감할 수 있다. 일부 사례에서는 문제 해결 시간, 설치 시간, 현장 방문 생략 등으로 비용을 최대 50% 절감한 것으로 나타났다. 네트워크 문제 해결을 위해 많은 권장 사항이 만들어져 인시던트 수와 인시던트 해결 시간의 감소로 필요한 리소스 또한 줄어든다.
●AI 네트워킹은 멀티 클라우드, 데이터센터, 코로케이션 등과 같은 이기종 환경과 컨테이너, 쿠버네티스 등의 추상화 계층으로 인해 복잡해지는 네트워크, 보안, 애플리케이션 인프라의 관리를 간소화하는 데 도움이 된다.
● 오탐 최소화로 비생산적인 활동에 걸리는 리소스와 시간을 줄인다.
● 디지털트윈을 활용해 네트워크 변경 및 소프트웨어 업데이트의 위험을 최소화한다.
● 민첩성을 높여 디지털 기업의 역동적인 요구 사항을 지원하고, 빠른 변경을 돕는다.
● 네트워크 담당자의 전문적인 지식 없이도 작업을 완전히 자동화할 수 있다. 기업은 정의된 워크플로우를 자동화하고 사람이 수동으로 설정해야 했던 템플릿을 자동화하는 것 이상의 진전을 이룰 것이다. 챗GPT와 같은 생성형 AI를 활용하면 AI 네트워킹은 사람이 초기 작업을 수행할 필요 없이 자동화되며, 단순 작업 자동화를 넘어 진정한 자동화로 나아갈 수 있다.


리스크

● AI 네트워킹 솔루션에서 제공하는 권장 사항의 실수나 오류는 잘못된 구성으로 이어져 서비스 중단이나 과도한 복잡성을 발생시킬 수 있다. 이는 툴을 학습하는 과정이 필요한 생성형 AI 플랫폼에 특히 문제가 된다.
● 네트워크 관리 담당자는 일반적으로 위험을 회피하려 하기에 아직 초기 단계의 검증되지 않은 AI 네트워킹 분석 혹은 네트워크 사고 해결을 위한 권장 조치를 신뢰하지 않을 수 있다. 따라서 솔루션이 채택되지 않거나 채택되더라도 매우 조심스러워 잠재적 이점이 희석되는 상황이 발생할 수 있다.
● AI 플랫폼이 문제를 해결하기 위해 필요한 만큼의 데이터를 가지고 있지 않을 수 있다.
● 솔루션의 실체에 비해 기대치가 높다. 표준화된 솔루션이 없고 공급업체마다 솔루션도 달라 자신들의 솔루션이 거의 모든 문제 티켓을 해결한다는 등 과대 광고가 많다.
● 서서히 증가하는 요구 사항들을 충족하는 정도의 발전으로는 미래 역량에 대한 기대를 실현할 수 없다. 이는 투자 낭비 및 기술 부채를 낳을 수 있다.
● 일부 솔루션은 고도의 기술력을 필요로 해 채택 및 사용이 제한될 수 있다.
● 많은 기업들은 이미 기존 툴 관리에 어려움을 겪고 있다. 여기에 또 툴을 추가하는 것은 현상을 악화시킬 수 있다.
● 일부 네트워크 담당자는 실직에 대한 두려움으로 AI 네트워킹을 수용하지 않을 수 있다.


도입률

현재 AI 네트워킹 도입률은 10% 미만으로 추정된다. 많은 조직들이 기술에 대해서는 열려 있지만, 배포 계약 전에 네트워크 공급업체가 제공하는 가치 제안을 이해할 필요가 있는 것이다.

대부분의 공급업체는 솔루션에 인간의 개입이 일부 및 최소한으로 필요한 레벨 1, 2 수준의 기능을 보유하고 있다(그림 2참조). 그러나 많은 기업들은 인간의 개입이 절대적으로 필요한 레벨 0에 머무르며 실제로 오늘날 네트워크 작업의 약 65%가 수작업으로 이루어지는 것으로 파악된다. 공급업체들의 역량이 아직 초기 단계일지라도 최종 조직의 기술 활용 능력보다는 높다는 것을 알 수 있다.

 상대적인 AI 네트워킹 성숙도
상대적인 AI 네트워킹 성숙도

AI 네트워킹은 캠퍼스 WLAN/LAN에서 가장 높은 도입률을 보이고, 데이터센터 스위칭 네트워크, SD-WAN가 그 뒤를 따르고 있는 것으로 예측된다. 향후 3년 동안 신뢰도 상승 및 네트워크 기능의 상용화, 공급업체의 역량 향상에 따라 AI 네트워킹 도입은 증가할 것이다. 궁극적인 목표는 문제 티켓을 방지하거나 적어도 최소화해 비용 절감 및 더 나은 최종 사용자 경험을 제공하는 것이다. 현재로서는 문제 티켓 제거가 주요한 목표이지만 시간이 지남에 따라 더 많은 기능이 시장에 제공될 것이다. 기업들은 공급업체드링 제공하는 이러한 가을을 계속해서 검증해야 할 것이다.


대안

AI 네트워킹 기능의 구현은 혁신적인 변화가 될 수 있다. 솔루션을 신뢰하지 않거나 현재 기능의 가치를 거의 느끼지 못하는 조직은 아래와 같이 점진적인 대안을 고려할 수 있다.

● 인적 자원 확장 및 고급 기술에 투자한다. 그러나 이것이 자연스러운 행동임에도 불구하고 장기적인 관점에서 문제를 해결해주지는 못할 것이다.
● AI 네트워킹 기능을 활용할 가능성이 높아지고 있는 MNS 제공업체를 활용한다. 이는 SLA가 확장되거나 비용이 절감되는 등 성과가 개선되는 상황에서 가치가 있다.
● 일부 네트워크 자동화 공급업체는 네트워크 구성이 정확한지, 네트워크 문제를 유발할 가능성이 있는지, 초기 설정에서 벗어났는지 등 여부를 확인함으로써 가치를 제공하며, 잘못된 구성을 수정할 솔루션을 제공하기도 한다.


제안

● 소규모로 시작하라. 그리고 프로덕션으로 전환하기 전, POC 기능 테스트를 통해 기능을 검증하는 방식으로 솔루션을 반복적으로 사용한다. 효율성과 신뢰도의 향상에 따라 무인 자동화를 단계적으로 도입한다.
● AI 네트워킹 솔루션으로 네트워크 운영이 어떻게 변화할지 예측한다. 네트워크 입력 및 구성 관리 부분에서 AI 네트워킹 솔루션이 제공하는 데이터를 소비하고 네트워크 아키텍처에 대한 전략적 권장 사항을 만드는 데 집중하도록 역할을 발전시킨다.
● 공급업체에 향후 1~2년 내 기능 설명 및 일정과 같은 세부사항을 포함한 로드맵을 요구한다.
● 멀티 벤더 네트워킹 환경이 구축된 경우 멀티 벤더 솔루션을 활용한다. 이는 사일로화 된 도구 및 더 많은 양의 도구가 무분별하게 늘어나는 것을 방지할 수 있다.
● 비용 절감, 리소스 효율, 네트워크 가용성 향상, 최종 사용자 성능 개선 등을 계산해 AI 네트워킹 솔루션 도입의 근거를 확인한다.
● 운영 모델이 DIY인지 MNS인지, 네트워킹 환경이 단일 공급업체인지 멀티 벤더인지 등을 통합해 AI 네트워킹 구매의 우선순위를 정한다.

저작권자 © 컴퓨터월드 무단전재 및 재배포 금지