본지 주관 ‘2015 빅데이터 컨퍼런스’ 열려

▲ 지난달 17일 본지가 주최한 2015 빅데이터 컨퍼런스가 서울 역삼동 포스코P&S타워 이벤트홀에서 개최됐다

[컴퓨터월드]  지난달 17일 본지가 주최한 2015 빅데이터 컨퍼런스가 서울 역삼동 포스코P&S타워 이벤트홀에서 개최됐다. 이번 빅데이터 컨퍼런스는 ‘구축성공사례를 통해 본 빅데이터’라는 주제로 마련돼 빅데이터의 비즈니스 이용에 관한 다양한 해법을 제시했다.

이번 컨퍼런스에는 300여명의 인파가 몰려, ‘빅데이터를 어떻게 비즈니스에 활용할 것인가’에 대한 각 기업 및 기관의 고민이 적지 않음을 짐작케 했다. 이러한 고민들에 대한 인사이트(Insight)를 제공하고자 이번 컨퍼런스는 빅데이터를 실제 산업에 적용한 성공 사례를 중심으로 진행됐다. 빅데이터가 현재 어떤 위치에 와 있으며, 또 어떻게 해야 성공할 수 있는지, 전문가들의 강의와 산업별 사례를 통해 제시됐다.

과연 기업들은 빅데이터를 활용해 어떤 성공을 거뒀는지, 그러기 위해서 어떤 조치를 취했는지 ‘2015 빅데이터 컨퍼런스’를 통해 확인해본다.

 

빅데이터 비즈니스 창출과 나아갈 방향
“빅데이터의 본질은 더 나은 의사결정”

▲ 조성준 서울대학교 산업공학과 교수

이번 행사의 기조강연에 나선 조성준 서울대학교 산업공학과 교수는 ‘빅데이터 비즈니스 창출과 나아갈 방향’이라는 주제로 발표를 진행했다. 조 교수는 “빅데이터를 통해 얻으려는 가치의 본질은 결국 의사결정”이라고 강조했다. 빅데이터를 활용하지 않았을 때보다 의사결정을 잘할 수 있도록 돕는 것이 빅데이터의 본질이라는 것이다.

조 교수는 “3V(Volume, Velocity, Variety)로 대변되는 빅데이터 정의는 IT만의 접근방식”이라며, 비즈니스를 이끌어가는 CEO의 입장에서 빅데이터를 다시 정의할 필요가 있다고 주장했다. 빅데이터는 ‘IT’만의 전유물이 아니라 비즈니스 의사결정에 적극 활용할 수 있는 도구라는 것이 조 교수의 설명이다.

조 교수는 “통찰(Insight), 예측(Foresight), 의사결정(Decision Making), 모니터링(Monitoring), 재탐색(Re-finding)의 사이클이 순환되도록 하는 것이 빅데이터”라며, “빅데이터는 그 자체로 뭔가 하는 것이 아닌, 의사결정에 도움 주는 재료”라고 강조했다. 빅데이터는 이런 프로세스를 만들어 낼 수 있는 ‘환상적인’ 재료라는 것이다.

이어 조 교수는 아마존, 넷플릭스, MLB의 오클랜드 애슬레틱스, 야후, 미국 민주당, 제록스 등 해외의 빅데이터를 활용사례를 소개했다. 조 교수는 상식처럼 여겨지던 ‘믿음’과 ‘감’을 ‘데이터’를 통해 효과적으로 보완할 수 있다고 설명했다.

그는 이어 “빅데이터를 통해 성공하기 위해서는 세 가지(데이터가 충분히 있는가, 비즈니스에 끼치는 영향은 어느 정도인가, 분석이 가능한 데이터인가)를 반드시 고려해야 한다”며, “감에 의존하던 기존의 사고방식에서 벗어나, 객관적 데이터를 통해 의사를 결정하는 사고방식으로 바꿔나가야 한다”고 말했다.

조 교수는 조직이 빅데이터를 잘 활용하기 위해서는 특히 다섯 가지 역량이 중요하다고 설명했다. 이 다섯가지는 ‘리더’, ‘의사결정자’, ‘분석가’, ‘프로세스’, ‘인프라’다. 조 교수는 많은 전문가가 분석가, 프로세스, 인프라에 집중하고 있다고 꼬집으면서 “가장 중요한 것은 리더”라고 주장했다. 리더가 빅데이터에 대한 확신이 없거나 현업에서 빅데이터를 시작하면 빅데이터를 통한 성공이 어렵다는 것이 조 교수의 설명이다.

특히 조 교수는 감과 경험에 의존해오던 기존의 의사결정에서 벗어날 필요가 있다고 강조했다. ‘감’과 ‘경험’을 백프로 버리라는 것이 아니라, 빅데이터라는 ‘도구’를 효과적으로 사용해 ‘경험’을 보완하라는 조언이다.


BIG DATA를 활용한 효과적인 기업경영사례소개
“앞으로의 BI는 능동적 예측까지 가능할 것”

▲ 배영근 비아이매트릭스 대표

다음 연사로 나선 배영근 비아이매트릭스 대표는 ‘빅데이터를 활용한 효과적인 기업경영사례 소개’를 주제로 발표했다. 배 대표는 발표를 통해 BI 시장의 개요와, 분석 방법의 진화, 빅데이터 구축 사례와 차세대 BI에 대해 소개했다. 배 대표는 “기술의 발달로 인해 DB에서 데이터를 출력하기만 하던 전통적인 BI가 점차 변화하고 있다”며, “DB에 데이터를 입, 출력할 수 있고, 영역또한 점차 통합·확대되고 있다”고 강조했다.

배 대표는 1980년대부터 다양한 BI기법이 소개되기 시작했다고 설명했다. ‘소맥(SoMAC; Social, Mobile, Analytics, Cloud)’으로 일컫어지는 네 가지 요소가 향후 트렌드를 선도해나갈 것이라 내다보았다.

전통적 BI가 DB에서 정보를 추출해오는 것에 가까웠다면, 현재의 BI는 데이터를 입력하고 출력하는 것이 가능하며, 향후에는 보다 예측 중심으로 발달해 나간다는 것이 배 대표의 설명이다.

배영근 대표는 “스마트폰과 태블릿이 발달하면서 많은 양의 데이터가 생산되기 시작했고, 트위터와 페이스북 등 소셜미디어가 등장하면서 이 데이터가 유통됐으며, 메모리 비용이 하락하고, 하둡 등 쉽고 싸게 이용할 수 있는 알고리즘이 나타나면서 빅데이터라는 개념이 출연했다”며, “하지만 빅데이터는 데이터를 수집하는 데 그치는 것이 아니라 수집된 데이터를 분석하고 활용하는것이 중요하다”고 강조했다.

이어, 소셜데이터를 활용해 마케팅에 적용한 제약회사의 사례와 날씨에 따라 주문량을 다르게 적용하는 프랜차이즈 빵집의 사례, 미국의 탈세방지 시스템 등의 빅데이터 분석 적용사례를 소개했다.

배 대표는 “비아이매트릭스는 다양한 빅데이터 플랫폼 구축 사례를 쌓고 있다”면서, “비아이매트릭스가 활동하는 영역은 스트럭처데이터다. 빅데이터 전문 기업들 굉장히 많다. 대부분 주 관심사는 ‘탐색’이다. 비아이매트릭스는 이 부분을 제외한 15%의 영역을 노리고 있다”고 강조했다. 단순히 검색해서 찾아내는 수준이 아니고 전체를 평균, 카운팅, 그룹단위별로 예측할 수 있다는 것이 배 대표의 설명이다.

이어 그는 “차세대 BI는 사람이 아닌 SW가 정리된 문서를 보여주는 것”이라며, 자사의 ‘G-매트릭스(G-Matrix)’를 시연해 보였다. ‘G-매트릭스’는 키워드를 입력해 회사가 가진 DB에서 실시간으로 키워드를 검색해 연관된 다른 키워드를 찾아낼 수 있었다. 배 대표는 “인공지능 기법의 도입으로 이러한 것들이 가능했다”며, “향후 BI의 미래 또한 이런 형식일 것”이라고 예측했다.


GEO meets Big Data: 공간으로 펼치는 빅데이터 이야기
“양질의 ‘딥데이터’ 확보 필요하다”

▲ 이은영 오픈메이트 대표

이어 세 번째 연사로 나선 이은영 오픈메이트 대표는 ‘GEO meets Big Data: 공간으로 펼치는 빅데이터 이야기’를 주제로 다뤘다. 공간정보산업의 변화와 IT트렌드에 대해 짚은 후, ‘딥데이터’ 활용의 필요성을 제기했다.

이은영 대표는 “빅데이터 시대에 들어서면서, 모든 데이터가 모인 ‘초연결사회’가 되고 있다. 모든 정보가 연결되고 저장된다”며, “2010년대 들어 빅데이터 또한 공간정보와 융합되고 있다”고 언급했다.

이 대표는 공간정보에 빅데이터를 더해 어떤 인사이트를 도출해낼 수 있는지를 홍대와 연남동의 비교를 통해 직접 설명했다. 홍대와 연남동이 같은 상권이라 볼 수 있을 정도로 가까운 위치임에도 불구하고 소비패턴이 다르게 나타난다는 것이다.

오픈메이트가 국가가 제공하는 ‘국가데이터’와 카드사 등 여러 기관이 제공하는 ‘라이프스타일 데이터’를 통합해 분석한 결과, 연남동의 경우 원 거주지가 멀지 않은 ‘생활 밀착형 상권’이며, 홍대는 다양한 지역에서 모이는 ‘광역형 상권’이었다. 연남동은 편의점, 밥집 등 생활 밀착형 업종이 많았으며, 소비자의 연령대도 상대적으로 높았다. 사람이 많이 모이는 시간 또한 저녁때로 한정적이었다. 이에 반해 홍대는 다양한 사람들이 다양한 지역에서 모였기에 업종이 다양했고, 소비자의 연령대도 다양했으며, 시간대와 무관하게 사람이 많이 몰리는 것을 한 눈에 파악할 수 있었다.

이처럼 스마트폰과 교통카드, 주거지와 소비품목, 신용카드, 이동패턴 등 다양한 정보를 모아 분석하면, 실제 고객이 어떤 사람이고 어디에서 왔는지 다양한 고객의 속성을 확인할 수 있다. 이러한 분석을 통해 어떤 위치에 어떤 업종의 사업이 유리한지 예측이 가능하다.

공공기관에서도 이러한 방법으로 정책 입안에 도움을 얻을 수 있다. 특히 복지시설이나 방범용 CCTV 설치 등에는 ‘실 수혜자’를 정확히 파악하는 것이 중요하다. 노인 복지시설의 경우 이전에는 단순히 ‘노인 인구수’만 확인 후 설립해 왔다. 따라서 노인 인구수가 많은 노원구, 은평구 등에 우선적으로 설립됐다. 하지만 소득 등 다양한 계층정보를 확인하면 송파구 등 다른 지역의 실 수혜자가 더 많았다는 것이 이 대표의 설명이다.

이 대표는 “이러한 분석을 시행하다보니 의미있는 정보를 가진 데이터가 많지 않았다는 것을 알게됐다. 이는 데이터를 분석할 목적으로 모은 것이 아니라 그저 모아두었기 때문”이라고 지적하며, “정부3.0에 따른 공공데이터 개방 등을 통해 빅데이터를 얻을 수 있는 상황이지만, 이 속에서 의미 있는 비즈니스 인사이트를 도출하기 위해서는 불필요한 부분을 제하고 핵심을 파고드는 ‘딥데이터(Deep Data)’가 필요하다”고 강조했다. 이어 “목적의식을 갖고 ‘딥데이터’를 모아 분석하고 활용한다면 새로운 비즈니스 가치를 창출할 수 있을 것”이라고 조언했다.


공간정보 소셜 플랫폼 구축사례를 통해 본 빅데이터
“소셜의 힘 더욱 중요하다”

▲ 김대욱 이지스 미래연구도시센터장

네 번째 세션에서는 김대욱 이지스 솔루션사업본부장이 ‘공간정보 소셜 플랫폼 구축사례를 통해 본 빅데이터’를 주제로 발표에 나섰다. 공간정보기술의 변화와 소셜 플랫폼의 등장에 대해 살펴보고, 빅데이터와 결합된 ‘공간정보 소셜 플랫폼’이 지닌 잠재력에 대해 짚었다.

김대욱 본부장은 “공간정보의 패러다임이 변화하고 있다. 오픈API를 통해 데이터 수용한계가 늘어났고, 데이터 생산주체도 공공에서 민간으로 바뀌었다. 또 스마트폰과 드론의 등장으로 데이터 수집기술이 다양해졌으며, 3D-POI(Point of Interest, 관심지역) 방식으로 건물 입주현황을 볼 수 있는 등 표현기술도 발전했다. 특히 콘텐츠의 공유가 이뤄지는 선순환 구조가 정착되고 있어 소셜 플랫폼에 대한 니즈도 확산되고 있다”고 설명했다.

사용자가 직접 데이터를 생산하고, 평가하고, 공유함으로써 지식이 이뤄지는 시대로 변화하고 있다는 것이 김 본부장의 설명이다. 김 본부장은 공간정보 소셜 플랫폼의 역할 또한 이와 마찬가지로 콘텐츠 평가, 콘텐츠 확산, 상호연동이라고 강조했다. 이지스 미래연구도시센터가 개발중인 공간정보 소셜 플랫폼의 경우 POI 기반의 홈페이지와 소셜페이지를 연동해 다양한 데이터를 입력할 수 있게 할 예정이다. 소식지나 이벤트 등 다양한 정보를 입력할 수 있게 하고 이를 쉽게 팔로우 할 수 있도록 제공하겠다는 것이다.

김 본부장은 “빅데이터와 공간정보가 결합한 공간정보 소셜 플랫폼은 앞으로 큰 가치를 제공해줄 수 있을 것”이라며, “빅데이터의 3V(Volume, Velocity, Variety)가 공간정보의 3R(Realtime, Reality, Reflection)과 만나 새로운 비즈니스 기회를 제공할 것”이라고 조언했다.

그는 오픈소스 방식의 참여형 무료지도서비스 ‘오픈스트리트 맵’을 예로 들며, 소셜의 힘이 대단하다고 강조했다. 오픈스트리트 맵은 런던에서 시작돼 전세계적으로 빠른 속도로 확산되고 있다. 2010년 이후 사용자가 급격히 증가했고, 현재 220만 명의 사용자가 등록해서 직접 공간정보를 만들어내고 있다. 매일 50만 건 이상의 콘텐츠가 업데이트 되고 있으며, 자전거도로·소음지도 등 지역밀착형 공간정보서비스가 생산되고 있다.

“빅데이터는 트렌드를 짚어내기 위한 것이라고 여겨지며, 이를 위해 소셜의 힘이 요구되는 것은 당연하다”며, “지금까지의 공간정보 활용사례 가운데 성공적인 것들을 살펴보면 대부분 알게 모르게 사람들의 참여가 있었음을 알 수 있는데, 이 같은 참여를 더욱 활성화하면 더 큰 가치를 얻을 수 있다”고 설명했다.

또한, “사용자 주체적 데이터 생산을 위한 포털, 사용자 편리성 향상을 위한 데이터 생산도구, HTML5를 활용한 N스크린 기반 서비스 등도 이러한 융합의 예시”라며, “3V와 3R의 결합을 통한 새로운 비즈니스들의 시장 장악은 이르면 향후 5년 내 이뤄질 것”이라고 말했다.

 
Tangible Big Data(VOC & 민원 콜센터 분석 및 활용 사례)
“텐저블 시대, 빅데이터 또한 ‘만질 수 있어야(Tangible)’ 한다”

▲ 이석원 와이즈넛 전략경영본부 이사

다섯 번째 세션은 이석원 와이즈넛 전략경영본부 이사가 ‘Tangible Big Data(VOC & 민원 콜센터 분석 및 활용 사례)’를 주제로 발표에 나섰다. 이 이사는 “현재는 ‘텐저블한(만질 수 있는)’ 시대”라면서, “모든 제품과 기술이 ‘텐저블하게’ 만들어지지 않는 한 시장에서 통용되지 않는다”고 강조했다. 빅데이터 또한 흩어져 있던 다양한 데이터를 하나로 융합해 ‘만질 수 있도록’ 혹은 ‘실체하도록’ 하나로 통합해 의사결정을 지원해야 한다는 것이다.

이석원 이사는 소셜 열풍이 불던 2010년에 주목받던 실리콘벨리 소셜 분석 업체 중 85%가 서비스를 종료한 시점에 있다고 지적하며, 빅데이터 분석에 ‘소셜 데이터 분석’은 필수적인 것이 아니라고 주장했다. 소셜 데이터만으로는 기업의 의사결정에 큰 도움이 되지 못하며, 이를 해결하기 위해서는 소셜 뿐만 아니라 다루는 데이터의 범위가 넓어져야 한다는 지적이다.

이어 이 이사는 VOC(Voice Of Customer)와 민원 콜센터, 재난·재해 분석, 병사 사고 예방 등 자사의 여러 가지 빅데이터 분석 수행 사례를 소개했다. VOC를 분석하는 이유는 고객 이탈을 방지하기 위함이 가장 크다. 고객을 응대하는 응대요원이 규정을 준수하는지, 고객이 말하는 내용 중 새로운 마케팅 포인트가 있는지 등을 확인해 개선할 수 있다.

재난·재해 분석의 경우 월 1.5억 건, 매일 5백만 건 가량의 외부 비정형 데이터를 수집해 분석했다. 텍스트 마이닝에 의한 의미패턴 매칭을 활용했다. 이러한 방법을 응용하면 공장의 라인이나 중장비 시설의 예측정비에도 활용할 수 있다.

이 이사는 이어 최근 문제가 되고 있는 군대 내부의 사건사고와 관련한 분석에 대해 언급했다. 와이즈넛은 병사의 사건사고와 관련된 분석 시스템을 꾸준히 제안해 왔다. 수양록, 상담기록, 병영일지 등 다양한 소스를 모아 분석하면 폭행 등 사건 사고를 예방할 수 있다는 것이 이 이사의 설명이다.

이밖에도 와이즈넛은 중국 쇼핑트렌드 분석 사례, 금융시장의 소비별 카드 조합 사례, 산업별 신용평가 시스템 등 의사결정에 기반이 되는 데이터를 제공하는 서비스를 준비하고 있다.

이석원 이사는 “빅데이터를 빅데이터인 채로 제공하는 것이 아니라, 고객과 커뮤니케이션을 유지하면서 원하는 유형과 형태로 바꿔 제공해야한다”고 강조했다. “데이터를 우리가 직접 선별하고, 고객들이 원하는 특정 데이터만 수집한 이후에 분석을 시작해야한다. 와이즈넛은 분석한 것들을 통해 실제로 활용할 수 있는 통찰을 제공하려 한다”고 말했다.

 

빅데이터 제조 품질분석 사례와 공공분야 확대 방안
“제조 등 여러 분야에 신기술 융합해 경쟁력 확보해야”

▲ 김회 메타빌드 신기술사업본부 이사

여섯 번째 세션은 김회 메타빌드 신기술사업본부 이사가 ‘빅데이터 제조 품질분석 사례와 공공분야 확대방안’을 주제로 발표에 나섰다. 김 이사는 메타빌드가 수행한 빅데이터 활용 스마트서비스 시범사업, 자동차 부품기업 공동 활용 빅데이터 플랫폼 구축 등 실제 활용사례를 소개했다.

김 이사는 자동차 산업의 중요성에 대해 먼저 언급했다. 우리나라의 기반산업 중 하나가 자동차 산업이며, 한국산업의 10%를 차지한다. 9년 연속 세계 점유율 5위를 차지했고, 800억 달러 이상의 수출 실적을 냈다. 하지만 이러한 성장에도 불구하고 부품의 품질수준에 대한 신뢰성이 부족한 것이 현실이다. 현재 자동차 부품산업은 자동차 수출액의 34%에 달하고 있지만, 3차 벤더의 부품 경쟁력은 열학한 실정이다. 이에 빅데이터 등 적극적인 IT 산업 융합이 필요한 시점이다.

정부는 ‘제조업 혁신 3.0 전략’을 통해 2024년까지 제조업 4강에 진입하겠다는 목표를 가지고 스마트팩토리 산업에 24조원의 예산을 투자에 나섰다. 스마트한 생산방식을 확산하고, 창조경제의 대표 신산업을 창출하고, 지역 제조업을 혁신하고, 사업재편 촉진 및 혁신기반을 조성한다는 4대 추진방향을 가지고 사업이 진행 중이다.

이어 김 이사는 메타빌드가 수행한 부품 제조기업의 데이터 분석 사례에 대해 소개했다. 해당 사례는 자동차 부품을 생산하는 기업과의 공조로 이뤄졌다. 해당 업체는 다이캐스팅 주조 가공 전문기업으로, 중소기업인 대통령 표창을 수상하고 ISO 16949 인증을 획득하는 등 자동차 부품 생산 분야의 대표적 중소기업이다.

메타빌드는 제품의 불량 발생 원인을 분석하고 해결하기 위해 우선 해당 산업 특성에 대해 파악했다. 주조생산의 특성상 1차 직접 가공 작업에서 인력에 의한 품질차이가 발생하고, 압출공정에 대해 시스템적인 관리가 쉽지 않은 열악한 환경이었다. 이후 다이캐스팅 주조 공정 품질에 원인을 미치는 6 가지 변수를 추려냈다. 이후 빅데이터 플랫폼 인프라를 구축해 체계적인 데이터 수집에 들어갔다.

이러한 방법을 통해 메타빌드는 조건별 불량율을 찾아낼 수 있었으며, 작업자별 불량률도 알아낼 수 있었다. 그 결과 작업자의 노하우 영향을 많이 받는다는 것을 확인할 수 있었다. 회사는 작업자들에게 새로운 변경방법을 제안했고, 이를 적용해 테스트하니 불량률이 3.7% 줄어들었다. 동종 산업계에 확대 적용했다고 가정했을 때, 50개 기업이 10개 품목에 적용하더라도 5,700억 원의 연간 순수 이익이 발생한다고 볼 수 있다.

김 이사는 나아가 IoT에 활용 가능한 서비스 방안을 마련할 계획이라고 밝혔다. 이를 통해 다양한 센서 IoT환경을 제공할 수 있으며 공통 활용이 가능한 시스템 자원 공유 환경이 서비스 가능하다. 분야별 패키지를 통해 많은 생산공장의 데이터를 수집하면 IoT 관련 산업 분야에 기반기술로 확대 공급할 수 있는 토대를 마련할 수 있다고 김 이사는 설명했다.

 


파레토 법칙을 뛰어넘는 빅데이터 추천 분석
“추천을 통해 파레토 법칙 넘어설 수 있어”

▲ 안동혁 위세아이텍 연구소장

일곱 번째 세션은 안동혁 위세아이텍 연구소장이 ‘파레토 법칙을 뛰어넘는 빅데이터 추천 분석’이라는 주제로 발표했다. 안 소장은 최근 이슈가 되고 있는 ‘기계학습’을 우선적으로 언급했다. 안 소장은 “그동안 빅데이터 플랫폼과 데이터가 강세였지만 내년부터는 여기에 알고리즘을 더한 기계학습이 주목받을 것”이라고 설명했다.

구글은 시장의 주도권을 잡고 기계학습 분야의 인재를 늘리기 위해서 자사의 기계학습 알고리즘을 오픈소스로 공개하기에 이르렀다. 이러한 상황에 힘입어 ‘기계학습’은 거스를 수 없는 대세가 됐다는 게 안 소장의 설명이다.

안 소장은 “‘추천’은 통계와 공식을 통해 도출되는 ‘마이닝’과 스스로 학습하는 ‘기계학습’의 중간단계”라고 지적했다. 이러한 ‘추천’을 통해 20퍼센트의 고객이 전체 매출의 80퍼센트를 차지한다는 ‘파레토 법칙’을 보완할 수 있다는 것이다. 나아가 미디어, 유통, 생활, 건강, 의료, 금융, 공공에 이르기까지 어떤 부분에도 적용할 수 있다고 강조했다.

파레토법칙을 따르다보면 특정 고객·상품·브랜드에 의존하게 되는 상황에 직면한다. 팔리지 않는 다른 상품의 재고관리비용이 늘어나는 등 기업의 장기적 수익성에 문제를 가져오는 경우가 있다. 이처럼 파레토 법칙을 따르는 모델은 단기적으로 좋은 효과가 있어도 장기적으로는 불충분하다는 것이 안 소장의 설명이다.

안 소장은 ‘추천’을 통해 파레토 법칙을 뛰어넘은 아마존, 구글, 넷플릭스, 왓차 등의 사례를 소개했다. 아마존은 연관추천을 통해 새로 나온지 십년이 지난 책을 베스트셀러에 올렸으며, 넷플릭스는 고객이 원하는 콘텐츠를 추천해 유료구매율을 높였다. 구글 뉴스는 38% 이상의 조회가 추천에 의해 발생된다.

이어 안 소장은 “추천에는 시간이 걸린다. 추천 정확성은 올라가다가도 떨어지는 경우가 있다. 정확성을 높여가는 데는 시간이 오래 걸린다”라면서 추천의 한계에 대해 설명했다. “빠르게 변화하는 최신 단어를 꾸준히 업데이트해줘야 하고, 사람의 성향이나 데이터 속성이 변하기도 한다. 추천 알고리즘을 고민하는 것도 중요하지만 무엇보다 중요한 것은 추천 정확도가 왜 올라가는지, 혹은 왜 떨어지는지 원인을 찾는 것”이라고 조언했다.

안동혁 소장은 “추천은 값싸게 시작할 수 있는 분야가 아니다. 노력과 경험이 많이 쌓여야 시작할 수 있다. 위세아이텍의 장점이라고 할 수 있는 것이 데이터 분석이며, 분석기반으로 좋은 추천을 제시할 수 있다는 것이 자랑이라고 할 수 있다”고 말했다.


분석 3.0과 빅데이터 실시간분석 및 적용사례
“분석 3.0시대, 스피드가 관건”

▲ 조외현 파스트림코리아 대표

마지막 세션에서는 조외현 파스트림코리아 대표가 ‘분석 3.0과 빅데이터 실시간분석 및 적용사례’를 주제로 발표했다. 다양한 해외 IoT 데이터 활용사례와 함께, 빅데이터를 실시간으로 처리할 수 있는 분석 플랫폼 ‘파스트림’을 소개했다.

조외현 대표는 BI, OLAP, DW 계통의 일반적인 분석을 ‘분석 1.0’, 빅데이터 시대가 도래하면서 다양한 유형 분석이 포함된 분석을 ‘분석 2.0’이라고 설명했다. 조 대표는 “분석 2.0의 빅데이터를 넘어 분석 3.0의 시대가 다가오고 있다. 분석 3.0이란 스피드까지 결합돼 의사결정이 필요한 시기에 바로 의사결정을 내릴 수 있도록 하는 것”이라고 말했다.

이어, “오픈소스가 표면적으로는 공짜이지만, 실질적인 빅데이터 분석이 가능한 시스템을 갖추기 위해 도입해야 할 하드웨어 비용까지 따져보면 실제 TCO(총소유비용)는 만만치 않다”며, “현재 빅데이터 분야는 춘추전국시대로, 이제는 국내에서도 맹목적인 글로벌 기술 추종과 시행착오에서 벗어나 보다 현실적인 대안을 검토할 필요가 있다고 본다”고 덧붙였다.

조 대표는 GE와 포드, P&G, 몬산토 등 많은 기업들이 실시간 데이터를 분석해서 대응에 나서고 있는 상황이라고 설명했다. 2025년에는 사물인터넷 간의 연계로 40%의 부가수익이 창출된다는 분석이 있음에도 IoT 데이터의 99%는 이용되지 못하고 버려지고 있다는 것이다.

“IoT 시대를 맞아 각 지역별 공간정보 등 다양한 원천에서 쏟아지는 대량의 데이터를 실시간으로 활용하려면 그에 맞는 혁신적인 플랫폼이 요구된다”며, “‘파스트림’은 IoT 데이터를 실시간으로 분석할 수 있는 DBMS(데이터베이스관리시스템)로, 이를 통해 충분한 가치를 얻을 수 있을 것”이라고 조언했다.

또한, “MPP(대용량병렬처리) 및 인메모리 기술 등 기존의 검증된 기술을 채용해 대량의 데이터를 빠르게 처리할 수 있고, 나아가 HPCI(고성능압축인덱스)와 GDA(지역분산분석) 등의 고유 기술을 특징으로 삼고 있다. 이를 통해 ‘엣지 인텔리전스(Edge Intelligence)’를 구현할 수 있게 해준다”면서 다양한 사례들을 함께 소개했다.

조 대표는 중국에서 2만대의 풍력 터빈을 관리중인 인비전에너지의 사례와 독일 지멘스사의 가스터빈 모니터링 사례, 자동차 보험사들이 운전자 행동으로 보험료를 산정하는 사례 등을 들어 실시간 분석의 중요성을 강조했다.

저작권자 © 컴퓨터월드 무단전재 및 재배포 금지