아네트 점프(Annette Jump) 가트너 책임 연구원

[컴퓨터월드]

▲ 아네트 점프 가트너 책임 연구원

개인비서 로봇에 대한 가트너의 정의

가트너는 개인 비서 로봇(Personal Assistant Robots, 이하 PAR)을 다음과 같이 정의하고 있다.

“개인이 사용하도록 설계 및 제작된 로봇으로, 사용자의 일상 생활과 업무를 지원하고, 가정 생활을 도우며, 집안에서 이뤄지는 반복적 업무를 대신하고, 경우에 따라 동반자 역할을 수행하기도 한다. 또한 주어진 규칙이나 알고리즘에 기반에 자율적으로 업무를 수행한다.”

현재 PAR제조사들은 자사의 차세대 제품을 담을 새로운 기능을 개발하고 있으며, 일부 디바이스 및 가전제품 제조사들은 로봇 도입을 통해 그들의 제품 포트폴리오를 확장하고자 한다. 이들 기업들은 새로운 기능 개발과 제품 포트폴리오 확장을 위해 어떤 기술을 사용할 것이며 이들 기술을 어떻게 조합해 사용자 경험을 향상시킬 것인가 등의 문제를 두고 고민하고 있다.

이번 기고에서는 2020년PAR 구현에 필요한 10대 센싱 및 인공 지능(AI) 기술<그림 참조>을 짚어보고자 한다. 이들은 향후 2~3년간 진행될 PAR 개발에 핵심적 역할을 할 기술들이다.


▲ 2020년 개인 로봇에 사용될10대 센싱 및 인공지능 기술 (출처: 가트너, 2018년 4월)


1. 컴퓨터 비전

컴퓨터 비전(Computer Vision, CV)은 실제 세계의 이미지와 비디오를 캡처· 처리· 분석해 기계가 실제 세계로부터 의미있는 맥락적 정보를 추출하도록 하는 프로세스를 말한다. 지난 몇 년간 컴퓨터 비전의 개량에 딥러닝과 신경망, 대규모 데이터세트의 발전과 데이터 처리 기능 향상이 큰 역할을 했다.

CV에는 개인 로봇의 유형에 따라 달리 적용될 수 있는 다양한 영역이 있는데, 머신 비전, 안면 인식, 이미지 인식, 패턴 인식, 윤곽선 인식, 움직임 감지 등이 그 예이다. CV는3D 매핑 및 포지셔닝을 구현하는 기술로, 모바일 로봇이 복잡한 실내 환경을 탐색할 수 있도록 한다.


2. 생체 인식/인증

생체 인증을 사용하면 사용자마다 다른 고유의 생물학적 특징과 특성에 기반한 인증을 할 수 있다. 생체 인증 방식은 지문 인식 기술, 손가락 정맥 인식 기술, 얼굴·홍채 인식, 음성 인식 등 매우 다양하다. 이들 기술 중 지문 인식 등과 같은 일부 기술은 이미 상용화되어 있다.

생체 인증은 다른 인증 방식에 비해 보안성이 뛰어날뿐 아니라 인증 시간을 단축하고 사용자 경험을 향상시킨다. 또한 PAR이 가족구성원 개개인에게 맞춤형 서비스를 제공할 수 있도록 하는 기반 기술이기도 하다.


3. 대화형 사용자 인터페이스

대화형 사용자 인터페이스(Conversational User Interface, CUI)는 음성이나 글로 된 자연어를 기본 입력 정보로 사용해 인간과 기계 간의 상호작용이 이뤄지는 인터페이스를 말한다. 사람이 하는 질문을 포착하고, 언어적·의미적으로 분석하고, 적절한 응답을 제공하는 기능을 포함한다.

CUI는 사용자가 쉬운 자연어를 사용함으로써 PAR 학습 곡선을 최소화하도록 돕는다. 사용자의 언어나 발화를 통해 수집된 정보는 사용자가 원하는 바를 학습하거나 사용자의 감정을 감지하는 데에 사용될 수 있다.


4. 감성 AI

감성 AI는 스마트폰이나 웨어러블 등 일상적으로 사용되는 개인용 디바이스가 사람들의 감정 상태와 기분을 감지, 분석, 처리해 그 의도를 파악하고 대응할 수 있게 한다. 여기에는 지능형 시스템 개발이 포함되며 머신러닝에 기반하는 경우도 있다.

감정과 상태를 감지하는 것의 이점 중 하나는 인간에 더욱 공감하는 방식으로 행동할 수 있게 한다는 점이다. 이는 PAR에 의인화된 특징을 더함으로써 이들이 더욱 사람처럼 보이도록 만든다. 이러한 ‘감정적 기능’은 사용자와 PAR간의 의사소통과 상호작용을 향상시키는 중요한 요소이다.


5. 음향 배경 분석

음향 배경 분석(Acoustic Scenery Analysis)은 PAR이 오디오 분석을 통해 소음을 감지할 뿐만 아니라 소음 발생 방향과 양까지 파악하고, 나아가 이를 의사소통과 행동 시 고려한다는 개념에 기반하고 있다.

PAR은 하루 종일 돌아다니거나 다양한 상황 속에서 여러 사람과 상호작용 해야 하기 때문에 지속적으로 변화하는 환경에서 활동하게 된다. 때문에 의사소통과 작업의 수행을 위해서는 이러한 환경 변화가 고려돼야 하며, 환경 변화를 인식할 수 있는 PAR은 맥락에 따라 반응하기 때문에 더 나은 서비스를 제공할 수 있다. 음향 배경 분석은 PAR이 반응과 상호작용 기능을 지속적으로 다듬어 나갈 수 있도록 맥락 정보를 제공한다.


6. 촉각 센서

촉각 센서는 PAR이 특히 사람과 상호작용할 때 촉각적 데이터를 적용하고 조정할 수 있게 해주는 기능이다. 시각 센서만으로는 물체에 대한 충분한 정보를 생성할 수 없기 때문에 PAR가 물건을 잡거나 조작할 때 이 촉각 센서가 매우 중요한 역할을 한다.

촉각 센서의 유형은 용량식(capacitive), 저항식(resistive), 적외선식(infrared) 등 다양하며, PAR이 물체의 표면, 온도, 무게 등 여러가지 특성에 대한 정보를 얻을 수 있게 해준다는 점에서 각각의 장단점을 가지고 있다.


7. 위치 감지(사물 및 사람)

위치 감지 기술은 사람이나 사물의 위치를 추적해 디지털 물체를 물리적 세계와 연결함으로써 PAR이 다양한 애플리케이션에 사용될 수 있도록 한다. 개인용 모바일 로봇은 클라우드나 메모리에 지도가 사전 탑재된 환경은 물론 정보가 주어지지 않은 환경에서도 안전하게 이동하고 부여 받은 과제를 수행할 수 있어야 한다. 때문에 로봇은 주변 환경을 매핑하고 파악해 현재 위치와 방향을 가늠하고 목표 지점까지 이동할 수 있어야 한다. 매핑과 현지화, 탐색은 모바일 개인 로봇에 필요한 세 가지 표준 작업이다.


8. 자율 운동
자율적 운동은 운송, 제스처, 춤, 조작 등의 물리적 움직임을 포함한 PAR의 모든 동작을 수행, 제어, 결정하는 기능이다. 자율적 운동 방식에 의한 인간과의 물리적 접촉과 상호작용은 PAR이 갖는 중요한 고객 가치 중 하나이며, 이는 사람과 상호작용하지 않도록 설계된 자율주행차의 개념과 구분된다. 하지만 자율주행차에 사용되는 AI와 학습 방식은 PAR의 이동성에도 중요한 역할을 한다.


9. 에지 AI

PAR은 다양한 시스템과 상호작용으로부터 사용자 개인이나 가족의 취향에 대한 데이터를 수집하고 통합함으로써 개별화된 경험과 대응을 가능하게 해 주는 AI를 내장하고 있다. 최근까지 AI 기능과 분석은 클라우드 기반 프로세싱을 기반으로 했지만, 전적으로 클라우드 서버에서 실행되는 AI 프로세싱 모델이 모두 확장 가능한 것은 아닌 만큼 에지 디바이스(Edge Device)나 PAR 벤더들에게 중단기적 기회가 형성됐다.

최근에는 구성 요소와 프레임워크 분야에서 이뤄진 발전 덕분에 디바이스 AI의 사용이 가능하게 됐다. 이 새로운 에지 디바이스 AI 모델은 지연 시간으로 인해 발생하는 문제들을 해소해 보안을 향상시키고 개인정보보호 문제를 해결하며 고객 경험을 개선한다.


10. 멀티모달 입력 통합

인간은 시각, 청각, 촉각, 물리적 충격 등 복수의 감각을 활용해 외부 환경을 인식한다. 사람과 같이 다양한 유형의 데이터를 통합하는 멀티모달 입력은 PAR의 정확성과 효율성을 높이는데 기여하며, 인식과 인지에 있어서의 모호함을 줄여줄 뿐만 아니라, 행동, 반응, 대처를 위한 상황 처리나 의사 결정 시의 불확실성을 경감한다.


결론

향후 2~3년 내에 일상 생활에서 PAR을 흔히 볼 수 있게 될 것이다. 로봇 기업은 물론 디바이스와 소비가전 제조사들이 자체적인 PAR을 개발하는 사례도 더 많아질 것으로 보인다.

기술 제품 관리 책임자들은 앞서 소개한10대 AI 및 센싱 기술을 최적의 조합으로 통합해야 하며, 판매 비용 역시 고민해 보아야 한다. 초기 단계에서 많은 솔루션을 통합할수록 제품 가격은 올라가게 마련이다. 또한, 기술 통합은 타깃으로 하는 사용자 집단과 시장, 탑재하고자 하는 기능에 기반해 이뤄져야 한다.

PAR 센싱 및 AI 기술의 사용성은 기술의 성숙도와 구체적인 사용 사례, 그리고 기술의 통합된 사용을 주도할 적절한 기술 조합을 만들어 내는 능력에 달려 있다. 예를 들어, 잔디깎이 로봇에게 위치 감지와 자율 운동 기술은 필수적이겠지만, 대화형UI는 부가기능 또는 차기 제품의 업그레이드 사항으로 고려해 볼 수 있는 기술이다.

PAR은 아직 초기 도입 단계에 머무르고 있으며 기술적 도구로 인식될 수 있지만, 소비자가 직접 경험하게 되는 상용화 제품이라는 점을 향상 유념하고 개발이 이뤄져야 한다.

저작권자 © 컴퓨터월드 무단전재 및 재배포 금지