사물인터넷과 빅데이터 그리고 인공지능의 기술체인

[컴퓨터월드] 4차 산업혁명 시대가 본격 열리고 있다. 4차 산업혁명의 핵심 주체는 소프트웨어(SW)다. ▲인공지능(AI) ▲사물인터넷(IoT) ▲빅데이터(Bigdata) ▲클라우드(Cloud) ▲로봇(Robot) ▲3D프린팅 ▲자율주행자동차 등 소프트웨어를 기반으로 한 핵심 기술들과 응용 기술들이 산업과 사회의 경계를 허물게 된다. 다시 말해 소프트웨어를 바탕으로 한 융합의 산물들이 우리사회를 크게 변화시켜 나간다는 것이다.

이 혁명은 기존 1~3차 산업혁명들과는 다른 양상으로 전개될 것이다. 보다 더 빠르고, 더 다양하고 많은 분야에서, 사회 전체 시스템의 변화를 수반하며 사회를 탈바꿈시킬 것이다. 거부할 수 없는 변화의 흐름이자 진화이다. 본지는 이에 따라 4차 산업혁명의 핵심 주체들에 대한 보다 상세한 내용을 살펴보고자 소프트웨어정책연구소 안성원 신기술확산연구팀장이자 공학박사로부터 기고를 받아 10회에 걸쳐 전문가 강좌를 연재한다. <편집자 주>

▲ 안성원 소프트웨어정책연구소 신기술확산연구팀장
- 고려대학교 컴퓨터공학과 졸업 (컴퓨터공학박사)
- 연구분야: SW신기술/AI, IoT, 빅데이터 등 지능정보기술/자율주행자동차/지능정보기술인프라

1. (인공지능 배경 및 개론) 인간과 컴퓨터 그리고 다가온 인공지능 (’17.1월호)
2. (자동차) 빅데이터와 인공지능을 활용한 자율주행 자동차 어디까지 왔는가? (’17.2월호)
3. (IoT & Bigdata & AI) 사물인터넷과 빅데이터 그리고 인공지능으로 이어지는 기술체인 (이번호)
4. (IoT&AI) 사물인터넷의 기술수준과 사물지능의 실현 가능성
5. (자동차) 자율주행차를 가능하도록 하기 위한 기반 기술들
6. (자동차) 커넥티드 카의 실현과 지능형 교통시스템
7. (Cloud&AI) 클라우드 컴퓨팅과 인공지능의 만남
8. (BigData) 빅데이터를 제대로 활용하기 위한 조건 : 데이터의 확보
9. (AI&ComputingPower) 고성능 병렬 컴퓨팅 환경의 중요성과 현황
10. (OpenSource) 공유를 통한 발전 사례 비교와 우리의 현황

 

4차 산업혁명은 거부할 수 없는 변화의 흐름이다. 4차 산업혁명의 핵심 기술인 지능정보기술(AI, ICBM)은 모든 산업과 사회 전반에 영향을 끼치면서 서로 융합되고 있다. 이번 호에서는 사물인터넷(IoT, Internet of Things)과 빅데이터(BigData), 인공지능(AI) 간의 상관관계를 살펴본다.

사물인터넷은 모든 사물을 인터넷으로 연결하는 것을 의미한다. 광의로는 사물간의 센싱(Sensing), 네트워킹(Networking), 정보처리(Information Processing) 등을 인간의 개입 없이 상호 협력하여 지능적인 서비스를 제공해 주는 연결망이다.

이전 기고에서 설명한 것처럼 지능정보사회 실현의 토대가 되는 기술영역으로 유비쿼터스 센서 네트워크(Ubiquitous Sensor Network, USN: 필요한 모든 사물에 전자태그(RFID)를 부착하여 사물과 환경을 인식하고 네트워크를 통해 실시간으로 정보를 구축하는 통신망)로 통칭된 바 있다.

사물인터넷은 소형 칩(Chip)에 각종 정보를 저장하고 무선으로 데이터를 송신하는 장치인 RFID(Radio Frequency Identification) 태그를 활용하는 형태에서부터 기계와 기계간의 통신인 M2M(Machine to Machine)에 이르기까지 매우 다양한 형태를 보이고 있다. 오늘날에는 만물인터넷(Internet of Everything, IoE), 만물지능, 사물지능 등의 형태로까지 발전하고 있다. 이것은 사물간의 연결 뿐 아니라 사람과 데이터 및 프로세스에 이르기까지 세상 모든 것이 지능적으로 연결돼 새로운 가치와 비즈니스를 창출한다는 의미를 담고 있다.

사물인터넷의 궁극적인 목적은 앞서 기술한 바와 같이 우리 주변의 모든 사물이 연결돼 정보를 공유하고, 그 사물이 보다 지능적으로 동작할 수 있도록 하는 것이다. 이것은 자동화를 통해 인간의 개입을 최소화하고, 사물간의 정보교류 및 가공을 통해 인간에게 더 좋은 서비스를 제공하는 것을 의미한다.


3가지 기반 기술 필요

사물인터넷을 구현하기 위해서는 크게 세 가지 기반 기술이 필요하다. 첫째는 센싱 기술이다. 센서(Sensor)는 온습도, 조도, 열감지, 가스연기감지, 풍량풍향감지, 움직임감지, 초음파, 레이더, 위치(GPS), 영상(카메라) 등 그 종류가 매우 다양하며, 주변 환경으로부터 얻을 수 있는 다양한 물리적인 정보를 탐지한다.

현재 상용화 된 센서들 중에는 단순한 물리적 정보의 감지뿐만 아니라 수집한 정보를 처리할 수 있는 능력을 갖고 있는 제품들도 있다. 점차 스마트 센서로 진화해 나가고 있는 것이다. 스마트 센서들은 수집한 정보들 중 특정 정보를 추출하는 기능을 갖고 있으며, 기존의 개별 센서에 비해 보다 고차원적인 정보를 이용한 지능적 서비스를 가능케 한다.

두 번째는 유·무선 통신 및 네트워크 인프라 기술이다. 사물인터넷을 지원하는 통신 기술로는 Wi-Fi, Zigbee, Bluetooth를 비롯해 저전력 장거리 통신(LPWA : Low Power Wide-Area)인 SigFox, LoRa WAN 등이 있다. 이동통신표준화기구인 3GPP는 사물인터넷 전용통신 규격인 LTE-M(LTE-MTC)에 대한 표준화를 발전시켜 나가고 있다. 이 부분에 대한 내용은 다음호에서 보다 상세하게 살펴 볼 예정이다.

세 번째는 서비스 인터페이스 기술이다. 서비스 인터페이스는 수집한 정보(데이터, 이 글에서 정보와 데이터는 같은 의미로 혼용하여 사용한다)에 대한 저장과 추출, 가공, 처리, 상황인식과 판단, 보안과 인증, 미들웨어, 웹서비스, 소셜네트워크 등의 서비스를 제공하기 위한 방법과 수단 전반을 의미한다.

사물인터넷 환경에서 많은 사물과 기기들이 네트워크를 통해 연결된다고 해서 그것만으로 비즈니스 가치가 만들어지는 것은 아니다. 사물들로부터 얻은 데이터들을 분석하고, 분석한 정보는 사용자에게 효과적으로 전달될 수 있어야 한다. 이 과정에서 빅데이터 분석과 인공지능이 요소기술로써 필요하다.

빅데이터는 기존 데이터 분석역량을 넘어서는 분량의 방대한 데이터를 의미한다. 오늘날 디지털 기기와 센서 등이 널리 보급됨으로써 각종 산업분야 뿐만 아니라 실생활에서도 규모를 가늠하기 힘들 정도로 많은 데이터가 생성되고 있다. 이렇게 생성된 데이터는 지속 또는 비지속적으로 빠르게 생성되어 양이 방대할 뿐 아니라 그 종류와 속성이 매우 다양하다. 이러한 특징을 통칭해서 3V(Volume: 데이터의 양, Variety: 다양성, Velocity: 생성속도)라고도 하며, 최근에는 가치(Value), 진실성(Veracity)을 포함해 5V라고도 한다.

빅데이터의 궁극적인 목적은 생성된 방대한 양의 데이터를 필요한 목적에 맞게 가공하고 분석해 새로운 결론을 도출하는 등 최적의 답안을 제시하는 데 있다. 결국 빅데이터에서 얻을 수 있는 기존 패턴을 분석해 향후에 일어날 현상이나 상태를 예측하고 이에 대응하자는 것이다. 얼마 전 취임한 미 대통령 트럼프의 당선을 인공지능을 통해 예측할 수 있었던 것도 이러한 빅데이터의 분석에 기인한 것이다.

사물인터넷 환경은 필연적으로 빅데이터를 생성한다. 인간이 주변사물을 오감(시각, 청각, 후각, 미각, 촉각)을 통해 인지하듯 사물인터넷의 수많은 센서네트워크는 인간의 오감처럼 수많은 데이터를 수집한다. 사물인터넷 환경의 데이터‘들’은 빠르고 지속적으로 생성되며, 수집한 데이터는 방대한 양의 비정형 데이터들이다. 이 데이터들 역시 빅데이터의 특성(3V 또는 5V)을 갖고 있다.

사물인터넷이 적용되어 발생하는 빅데이터에 대한 간단한 예를 들어보자.

보잉사의 787 여객기는 비행할 때 마다 가속도계를 통해 500기가바이트(GB)의 난기류 대응을 위한 정보를 수집한다. 최근 SW기업으로의 전환을 선언한 GE는 비행기 엔진 제조로도 유명한데, 자사에서 제작한 제트엔진에 센서를 부착해 전 세계 비행기로부터 1500테라바이트의 데이터를 수집하고 분석한다.

이 밖에도 해저 유전을 탐사하기 위한 시추선은 매주 약 75테라바이트 이상의 데이터를 수집하고, 기상관측을 위한 전 세계의 인공위성 및 관측소의 각종 센서들은 시간당 22억 5천만 개 이상의 데이터를 생성한다. 이처럼 사물인터넷은 방대한 양의 빅데이터를 생성한다.


방대한 양의 데이터를 수집하는 사물인터넷

2015년 기준으로 약 1%의 사물만이 전 세계적으로 연결돼 있었고, 현재 그 연결되는 사물의 숫자가 가파르게 증가하고 있다. 2020년에는 500억대 이상의 장치가 인터넷을 비롯한 통신망으로 연결될 것으로 추정되고 있다. 사물인터넷 환경에서는 이처럼 엄청난 양의 데이터를 빠르게 분석하고 가공 및 추출하여 최적화된 결론을 얻기 위한 기술이 반드시 필요하다.

반대로, 빅데이터의 분석을 위해서는 대량의 데이터가 공급되는 구조가 필요하다. 사물인터넷 환경은 바로 이러한 데이터 분석을 위한 풍부한 양의 ‘재료’를 제공한다. 물론 빅데이터는 사물인터넷 뿐만 아니라 인터넷상에서 사용자가 직접 제작하는 콘텐츠들과 이들 콘텐츠가 SNS 등을 통해 재생산·가공되는 것도 포함된다.

사물인터넷이 생성하는 데이터의 양은 현재도 상상을 초월할 정도이다. 그런데 센서의 수가 많아지면서 보다 많은 사물들이 연결됨에 따라 늘어나는 데이터의 양은 더욱 가속화 되고 있다. 이처럼 분석할 데이터들은 점점 늘어날 것이고 이에 따라 효율적으로 분석할 수 있는 알고리즘 또한 필요하게 된다.

앞에서 언급했지만 사물인터넷 환경의 센서로부터 수집된 데이터들은 주로 비정형 데이터이고, 사물인터넷 환경이 목적에 맞게 제대로 동작하기 위해서는 빅데이터에 대한 분석과 가공이 필요하다. 빅데이터 처리 기술이 지향하는 모델은 인공지능 딥러닝(Deep Learning)이다. 딥러닝은 수많은 데이터를 학습하고 해당 데이터가 의미하는 바를 스스로 해독하여 목적에 맞는 최적의 답안을 찾는 것이다.

특히 정형화된 데이터 보다 영상이나 소리 같은 비정형화된 데이터는 특이점을 추출해내고 분석하는 것이 어렵다. 이때 필요한 것이 딥러닝이다. 딥러닝은 정밀한 데이터 인식을 위해 복잡한 수십에서 수백 개 이상의 학습 신경망 계층을 이용하기도 하는데, 이는 상당한 계산량을 요구한다.

최근에는 하드웨어의 성능이 향상되고 상대적으로 가격이 저렴해 지면서 비용등의 면에서 계산환경이 좋아지고 있다. 많은 계산을 필요로 하는 딥러닝 알고리즘이 그 성능을 입증하며 부각되고 있는 것도 이런 이유에서이다.

우리는 딥러닝을 이용해 방대한 양의 데이터로부터 목적에 맞는 최적의 답안을 찾을 수 있다. 예를 들면, 의료분야의 경우 수많은 임상실험 빅데이터와 환자 치료 빅데이터를 기반으로 학습해 의사보다 정확한 진단과 치료방안을 제시하는데, IBM 왓슨이 대표적이다.

자동차분야의 경우 스마트 카(자율주행차량)를 들 수 있다. 차량 비전시스템으로부터 수집된 영상 빅데이터와 위치, 거리 등을 탐지하는 GPS 및 레이더 센서로부터 습득한 빅데이터를 학습해 차량 주변을 판독하고 안전하고 정확하게 차량 움직임을 제어할 수 있다. 이 밖에도 천체 시뮬레이션, 기상예측, 유전체 돌연변이 연구 등의 분야에 인공지능 딥러닝이 활용된다.

정리하면, 완벽한 사물인터넷을 구현하기 위해서는 센서네트워크, 빅데이터, 인공지능이 모두 필요하다. 반대로 빅데이터 분석을 위해서는 데이터가 필요한데, 사물인터넷에서 필요한 센서네트워크들로부터 수집하는 데이터들이 여기에 해당된다고 할 수 있다.

인공지능 또한 보다 정확하고 최적화된 판단을 위해 지도학습과 강화학습을 거치는 과정에서 빅데이터가 필요하다. 즉, 사물인터넷과 빅데이터 그리고 인공지능은 상호 보완적이면서 서로의 요소기술로써 기술체인을 형성하고 있다. 이 세 가지의 상호관계와 범위를 다음 <그림>과 같이 나타낼 수 있다.

▲ <그림> 사물인터넷, 빅데이터, 인공지능의 상관관계

구글의 알파고를 비롯해 자율주행차, 스마트 가전 등 인공지능의 적용 범위와 발전은 이제 우리 실생활에서 나타나고 있다. 인공지능이 보다 정확하고 올바른 상황 인지 및 판단을 통해 서비스를 제공하기 위해서는 빅데이터를 통해 얼마나 많이 학습했는가가 중요하다.

인공지능은 이제 우리 주변의 모든 사물에 탑재되면서, 결국에는 만물인터넷을 넘어 사물지능의 형태로 진화할 것이다. 미래사회에는 거의 모든 사물에 센서가 부착되며, 여기서 생성되는 데이터를 어떻게 처리하느냐에 따라 해당 정보를 처리하는 기관 및 단체의 가치가 달라질 것이다.

저작권자 © 컴퓨터월드 무단전재 및 재배포 금지