산업별 적용사례

[컴퓨터월드]

<4부-적용사례: 금융>

“빅데이터 분석 통해 고객관계관리(CRM) 활동 강화”
윤현기 기자 hkyoon@itdaily.kr

▲ 금기돈 악사손해보험주식회사 경영기획본부 CRM팀장

악사손해보험주식회사(이하 악사)는 보험의 직구 상품인 다이렉트보험을 판매하면서 고객과 직접적으로 소통하고 있다. 그렇기 때문에 고객이 어떤 목소리를 내는지 중요하게 여기고 있으며, 고객관계관리(Customer Relationship Management, CRM) 활동에도 많은 힘을 쏟고 있다.

악사는 CRM 활동 강화의 일원으로 빅데이터 분석을 활용, 자사 비즈니스에 접목하고 있다. 금기돈 악사 경영기획본부 CRM 팀장은 “빅데이터라고 하면 많은 사람들이 하둡, NoSQL, 소셜 분석 등을 생각하고는 있지만, 내부 데이터에 초점을 맞춰서 빅데이터를 할 수 있다”라고 강조한다. 실제로 악사는 보유하고 있는 고객 전화 상담 녹음 데이터나 웹 로그 데이터와 같은 비정형 데이터를 분석하여 이를 직원 생산성 향상 등에 반영하고 있다.

상담 녹음 데이터나 웹 로그 데이터는 이미 이전에도 보유하고 있었지만, 실질적으로 업무 단에서 활용하기에는 제약사항들이 존재했다. 음성 데이터의 특성상 글로 보강해야 했기에 원활한 활용이 어려웠으며, 웹 로그 데이터도 서버에 존재하기 때문에 가져다 쓰는 것도, 컨트롤하는 것도 쉽지 않았다.

이러한 문제를 해결하기 위해 악사는 음성 인식 솔루션과 로그 분석 솔루션을 새롭게 도입해 비정형 데이터를 정형화시켰으며, 이를 기존 OLAP 시스템에 연동시켜 의미 있는 데이터 분석이 이뤄질 수 있도록 했다.

이렇게 구성된 분석 체제를 악사는 고객 경험 플랫폼(Customer Experience Platform, CEP)으로 구성했다. 기존 데이터웨어하우스(DW)가 단순히 내부 자료에 대해서라면 CEP는 비정형 데이터를 활용할 수 있는 부분까지 담았다는 특징이 있다.

내부적으로 의사 결정이나 액션 플랜을 짤 때 CEP가 인프라 역할을 담당한다. 이전까지는 경험에 의하거나 단순한 분석 기반이었다면, CEP를 활용해 다차원적인 분석을 갖고 합리적인 의사 결정을 할 수 있게 된 것이 큰 변화다.

실제로 악사는 CEP 구축 이후 상담원의 화법 증진이라는 생산성 부분의 향상을 경험했다. 음성 데이터를 분석할 수 있게 된 이후, 상담원들이 어떤 표현을 쓰고 어떻게 전달하는지를 확인할 수 있게 됐기 때문. 이를 통해 실적이 좋지 않은 상담원을 대상으로 상담 시 ‘혜택 부분 강조가 부족하다’든지, ‘화법에 변화를 줄 필요가 있다’와 같이 직접적인 조언을 할 수 있게 된 것이다.

또한, 부정거래 탐지 시스템(Fraud Detection System, FDS)도 강화돼 보험사기 적발 역량도 향상됐다. 이전까지는 직원들의 경험에 의해 보험사기를 대처했지만, 이제는 시스템에서 자동적으로 점수를 매겨주고, 보험사기를 노리고 있는 고객을 경고까지 해주기 때문이다. 이를 통해 절감된 비용만 해도 20억 원에 이른다.

금기돈 팀장은 “빅데이터 솔루션을 도입할 때 기존 분석 체제와 연계된 분석이 가능한가를 따져야 한다”며 무조건적인 분석 툴을 도입하는 것은 조심해야 한다고 당부했다.

▲ 악사손해보험 CEP 구성도



<4부-적용사례: 통신1>

통신 데이터, 삶의 질 향상하고 산업 활성화하는 지표
김나영 기자 kny7732@itdaily.kr

이동통신 산업은 데이터의 보고다. 요즘 사람들은 언제 어디를 가든 스마트폰을 휴대하고 있다. 오늘날 스마트폰은 단순한 휴대전화 단말기 이상의 역할을 수행한다. 사람들은 모바일 플랫폼을 통해 세상과 소통하고 세상에 궤적을 남긴다.

빅데이터 시대의 도래, ‘스마트’를 필두로 한 모빌리티의 확산은 이동통신 업체들에게 새로운 자산을 제공했다. 바로 스마트폰이 쏟아내는 방대한 정보들이다. 오늘날 개인은 정부, 기업 등의 의도적인 유도 없이도 자발적으로 스마트폰을 소지하고 다니며 위치정보 등 다양한 데이터들을 쏟아내고 있다. 이를 분석·활용하면 개인 및 지자체의 삶과 질을 윤택하게 할 수 있는 서비스들을 개발하거나 공공 프로젝트 수행 등에서 보다 합리적인 결정을 내릴 수 있다.

그렇다면 이러한 통신 데이터의 빅데이터 활용은 어떻게 이루어지고 있을까. SK텔레콤의 빅데이터TF팀 김정선 부장을 통해 통신업계가 빅데이터로 어떠한 혁신을 도모하고 있는지 사례들을 들어봤다.

통신 업계가 갖고 있는 데이터 자산으로 가장 대표적인 것이 위치정보다. SK텔레콤은 ▲유동/주거/주간 인구에 대한 DB ▲상권/매출/구매자 DB ▲부동산 시세 및 개발 정보에 대한 DB 등 3개의 대분류 DB를 빅데이터 분석 프로젝트에 제공, 활용하고 있다.

유동/주거/주간 인구에 대한 DB는 마케팅 분야에서 잠재 고객의 특성을 파악하는 데 활용되기도 하고, 공공 사업 추진 시 보다 합리적인 의사결정을 할 수 있도록 지원하는 토대가 되기도 한다. 상권/매출/구매자 DB는 소비가 일어나는 현장을 파악함으로써 매출 증대를 돕는다.

이러한 데이터들이 활용되는 실제 사례로는 ▲교통 합리화 정책 ▲민원 해소 정책 ▲치안(CCTV) 정책 ▲관광 활성화 정책 등을 들 수 있다.

▲교통 합리화 정책 수립에 통신 데이터가 활용되는 대표적인 사례로는 대중교통 수요지도를 통한 노선 개편 등을 들 수 있다. 출퇴근 시간에 얼마나 사람들의 움직임을 위치기반 정보로 파악, 보다 효율적인 노선을 마련함으로써 국민의 삶의 질을 높이는데 기여할 수 있다.

▲환경 개선에 대한 민원 해소 정책에도 활용된다. 실제로 익산시청의 경우 악취가 발생한다는 민원에 대한 원인을 파악하고자 빅데이터 분석을 시도했다. 익산시에는 총 956개의 축사가 있는데, 이 중 문제를 일으키는 축사의 위치를 파악하기 위해 각 축사별로 피해 시민의 규모를 조사했다. 이에 따라 18개의 축사에 피해가 집중돼 있다는 걸 파악, 올해 해당 축사를 매입하는 정책을 결정했다. 이로써 익산시는 90% 이상의 민원이 감소되는 효과를 얻었다.

▲치안 정책 수립에도 빅데이터가 활용된다. 빅데이터 활용 전 지자체들은 민원이 발생하는 순서에 따라 CCTV를 배치하는 등 주도적이지 못한 치안 정책을 펼쳤다. 그러나 빅데이터를 활용하면 심야시간 대 유동인구, 특히 젊은 여성 유동인구가 많은 지역을 파악해 이를 CCTV 배치 우선 순위에 둬 보다 효과적인 정책을 펼칠 수 있다. 이러한 접근 방법은 예산 운용에 있어서도 효율성을 발휘한다. 최근 경기도 수원시는 빅데이터 분석으로 최적의 CCTV 설치 장소를 정하고자 움직이고 있다.

▲관광 활성화 정책 수립 역시 빅데이터를 통해 정책의 효과를 극대화할 수 있는 분야다. 이통사가 보유한 위치기반 정보는 방문자의 특성을 파악해 관광 서비스를 개선, 고객 만족도를 높이고 관광 산업을 활성화시키는데 기여한다.

▲ CCTV 배치 등 치안 정책 수립에 빅데이터 분석을 활용하면 보다 효과적인 정책을 수립할 수 있다.



<4부-적용사례: 통신2>

“빅데이터, 직관을 객관으로, 혁신으로 만드는 힘”
김나영 기자 kny7732@itdaily.kr

KT와 서울시가 공동 추진한 ‘빅데이터를 통한 심야버스 노선 정책 지원’ 사업은 빅데이터 활용을 통해 가시적인 성과를 창출한 주요 사례로 꼽힌다. 해당 사업은 서울시가 공개한 교통 데이터, KT가 보유한 통신 데이터를 결합해 최적의 심야버스 노선을 도출하는 내용이다.

해당 사업의 골자는 KT 기지국이 보유한 통화량 데이터, 서울시가 교통카드 사용 등을 통해 수집한 대중교통 데이터를 결합하는 것이다. 공공 데이터와 민간 데이터가 합쳐져 공공 가치를 창출해낸 사례라고 볼 수 있다. KT는 서울시에 위치한 기지국으로부터 심야시간 대 통화량 데이터를 추출, 특정 시간 특정 지역의 유동인구 현황을 파악했다.

서울시는 해당 사업을 통해 주요 인구 밀집지역의 심야버스 노선을 개편, 시민들의 편의를 도모했다. 대표적인 예로 건대입구 지역의 심야버스 노선을 개편했다. 건대입구의 주 버스 노선은 영동대교를 건너 직선으로 가는 내용이었는데, 건대입구 번화가들은 이보다 약간 측면에 위치하고 있어 버스 노선을 바꿔달라는 민원이 많았다. 이를 해당 사업을 통해 개편했다.

해당 성과에서 빅데이터 분석이 갖는 실제적인 힘을 확인할 수 있다. 해당 사업을 통해, 빅데이터 활용의 가치가 “경험을 수치로 바꿔주는 데서 드러나는 것을 확인했다”고 김인식 KT 상무는 언급했다.

예전부터 건대입구 버스 노선을 유동인구가 많은 번화가 지역으로 바꿔 달라는 민원은 많았다. 그러나 선뜻 바꾸기는 어려웠다. 기존 버스 노선을 이용하던 시민들의 반발에 부딪쳤기 때문. 이러한 반발을 종식시키기 위해서는 객관적인 데이터가 필요하다. 여기서 서울시-KT가 공동으로 빅데이터를 분석한 결과가 설득력 있는 근거가 됐다.

더불어 서울시의 경우 해당 사업을 수행하면서 경험적으로 다소 미진했던 심야버스에 대한 새로운 통찰을 얻을 수 있었다. 서울시의 경우 주간버스 노선은 계속 운용해와서 주간버스에 대한 경험은 많지만 심야버스 노선에 대해서는 기반 지식이 별로 없었다.

심야 시간에는 교통 체증이 없어 주간버스 노선과 똑같이 유지하는 걸로는 효용성이 떨어진다. 여성, 노인, 어린이 등의 심야시간 대 안전귀가를 도와야 한다는 점에서 심야 시간대에 집중한 심야버스 노선 정책은 주간버스와는 별도로 필요하다. 서울시는 이러한 요구에 대응할 혜안을 빅데이터 분석을 통해 확보할 수 있었다.

일례로 남산터널 부근의 심야버스 노선의 경우 빅데이터를 분석하니 재미있는 결과가 나왔다고 김이식 KT 상무는 밝혔다. 대부분 강북~강남 노선들은 남산터널을 통과하는데, 해당 노선은 심야 유동인구가 거의 없었던 것. 빅데이터 분석 결과, 서울 시민들은 주거지와 가까운 곳에서 심야 시간을 보내는 경우가 많았다. 김이식 KT 상무는 “데이터를 보지 않으면 놓치는 것들이 있다”며 빅데이터 분석이 간과하기 쉬운 부분에서 기인하는 의사결정 실패를 보완한다고 언급했다.

결론적으로, 서울시-KT가 추진한 사업을 토대로 빅데이터 분석이 정책 수립을 돕는 두 가지 키워드를 엿볼 수 있다. 빅데이터 분석은 ▲이미 생각하고 있음에도 수치화된 근거가 부족해 추진이 쉽지 않은 정책에 힘을 실어주며 ▲데이터 없이 생각할 때 발생하기 쉬운 정책의 ‘구멍’을 메워준다.

▲ 서울시는 빅데이터를 활용해 전통적 방법이 아닌 과학적 방법으로 심야버스 노선을 개편했다.




<4부-적용사례: 보건의료>

건강도 지키는 빅데이터
홍은기 기자 ralphfrd@itdaily.kr


빅데이터는 IT산업뿐만 아니라 모든 산업에 영향을 미치고 있다. 이는 보건의료 산업도 마찬가지다. 전문가들은 빅데이터가 가장 활발하게 영향을 미칠 수 있는 산업 분야가 보건의료라고 말한다.

개인 유전자 정보를 분석해 몇 년 뒤 발생할 질병까지도 예측하고 치료법을 제시할 수 있다면 단순 가치를 넘어서 인류의 문제를 해결 가능하기 때문이다. 맥킨지도 미국 보건의료분야에서 빅데이터 활용으로 인해 매년 3300억 달러를 절감할 수 있다고 예측했다.

보건의료 산업이 치료 중심에서 예방, 건강관리 중심으로 이행됨에 따라 질병발생 가능성 예측, 개인 맞춤형 의료 서비스의 중요성이 증대되고 있고 건강검진자료, 질병자료, EMR, 유전체 분석 데이터 등 바이오센싱, 의료영상을 중심으로 데이터가 급증되고 있는 추세다.

또 보건의료 빅데이터를 통해 질병예방에 따른 의료비 절감, 의료기관의 운영비용 절감, 오류 및 부정에 따른 손실비용 절감 등의 경제적 효과가 기대되면서 보건의료 분야에서의 빅데이터를 활용하는 사례가 점차 늘고 있다.

국민건강보험공단 ‘국민건강 주의 알람 시스템’

▲ 국민건강 주의 알람서비스 개념도

국민건강보험공단은 빅데이터 분석기술을 기반으로 질병의 확산 추이를 예측해 국민에게 알람서비스를 제공한다는 취지의 ‘국민건강 주의 알람 시스템’ 사업을 진행하고 있다. 건보공단은 인플루엔자, 눈병, 식중동, 알레르기성 피부염 등 4개의 질병에 대해 지역과 연령을 구분, 위험도를 4단계(위험·경계·주의·관심)로 나눠 알람을 서비스를 제공하고 있다.

건보공단은 알람 대상 질병별로 증상, 원인, 발생시기와 관련이 있는 어휘를 묶어 다음소프트의 트위터 데이터(2011~2013년)와 연계 분석을 통해 질병 위험도를 예측할 수 있는 모델을 개발했다. 위험도 예측을 통해 질병별로 지역과 연령을 구분, 위험도를 표시하고 각 단계별로 생활 속에서 주의해야 할 사항을 알려주게 된다.

건보공단은 국민건강 주의 알람 시스템을 통해 빅데이터 분석기술을 기반으로 SNS 데이터를 진료데이터와 융합, 질병 발생과 확산 추이를 보다 빠르게 예측하고, 해당 질병에 대한 인식도를 높여 예방효과를 상승시킬 수 있을 것으로 기대하고 있다. 또 결과적으로 건보공단의 진료정보와 다음소프트의 소셜 정보를 융합해 질병발생 예측 모델을 구축함으로써 국민 의료비 절감과 건강 증진을 이룬다는 것이다.

신순애 건보공단 빅데이터운영실 실장은 비정형데이터를 활용하는데 있어 핵심은 ‘빈도’라고 강조했다. 아주 작은 SNS 상의 데이터들이 10만 건, 100만 건 이상이 모이면 의미를 갖는 데이터가 된다는 것.

한편, 건보공단은 기상자료, 대기오염 자료 등 환경측정 자료와 뉴스미디어 등의 데이터 수집 등 채널을 다양화해 알람의 정확도와 신뢰도를 높인다는 방침이다. 또 알람대상 질병을 확대해 국민건강증진과 사회적 편익을 향상시켜 나갈 계획이다.

건강보험심사평가원 ‘보건의료빅데이터센터’

▲ 심평원은 공공데이터를 연계한 빅데이터를 민간에 개방하고 있다.

건강보험심사평가원은 의약품 유통정보 및 청구실적 등 건강·의료정보와 기상정보, 지역·시기별 통계 등 공공데이터를 연계한 빅데이터 서비스를 제공 중이다. 이를 위해 심평원은 지난 4월 보건의료빅데이터센터를 구축, 연간 200억건, 50TB에 달하는 빅데이터를 민간에 개방하고 있다.

심평원 보건의료빅데이터센터는 ▲진료비명세서DB ▲요양기관현황DB ▲요양기관평가정보DB ▲기준정보 등 4가지 통계분석 데이터베이스(DB)를 개방 중이다. 진료비명세서DB에는 연간 14억건에 달하는 전 국민의 진료정보 내역이 담겨있고, 요양기관현황DB에는 국내 병원, 약국 등 약 8만여 기관의 인력과 시설, 장비 내역 등이 담겨있다.

심평원은 자체적으로 공개하는 무료 공공데이터와 학계·업계 등이 개별적으로 요구하는 맞춤형 공공데이터 두 가지로 분류해 공공데이터 법에 저촉되지 않은 선에서 데이터를 유·무료로 공개하고 있다. 또 개방된 빅데이터 목록인 경우 구매자 수요에 맞춰 최소 하루 만에 온라인으로 전달받을 수 있도록 했다.

주민등록번호나 성명, 주소, 전화번호, 요양기관기호(명칭) 등 개인정보와 개별법인·단체 등 정보는 식별 불가능한 형태로 제공되고, 대용량 자료나 개인정보보호가 필요한 자료(대체키변환자료) 등은 별도로 제공하고 있다. 아울러 두 명 이상의 구매자가 각기 다른 유용한 정보를 따로 구매한 뒤 결합시켜 개인정보보호에 위해를 가할 수 있는 문제를 우려해 자료 결합 시 식별할 수 없도록 제한하는 등 보안유출의 가능성을 줄였다.

심평원 관계자는 “빅데이터 활용에 대한 컨설팅도 적극적으로 제공하고 있다”며 “보건의료빅데이터센터 설립이 보건의료 생태계의 한 차원 높은 발전을 도모하고 동시에 맞춤형 의료 같은 혁신적인 서비스를 제공하는 밑거름이 되기를 기대한다”고 말했다.

부산식약청 ‘식중독 예측지도’

▲ 부산식약청이 제공하는 ‘식중독 예측지도’ 서비스

식품의약품안전처 부산지방청은 관내 식중독 발생을 사전에 예방하고 발생 시 신속한 대처를 위해 ‘식중독 예측지도’를 개발해 운영하고 있다.

식중독 예측지도는 그간의 식중독 발생 지역, 학교, 요일, 원인 물질, 날씨 등을 종합적으로 분석해 식중독 발생 가능성을 사전에 예측해 예보하는 시스템으로 식품 관련 종사자들에게 맞춤형 SMS 정보를 제공한다.
식중독 예측지도는 부산식약청과 미래창조과학부 한국데이터베이스진흥원과 함께 지난 12년간(2002~2013) 부산·울산·경남지역 학교 급식소에서 발생한 식중독 통계 자료를 분석한 결과를 바탕으로 개발됐다. 또 식중독 발생원인 파악을 명확하게 하기 위해 ▲교육청 데이터 ▲기상 변수(최고기온, 최저기온, 평균기온, 강수량, 습도) ▲지리·지역적 변수를 반영한 빅데이터 패턴 분석과정을 거쳤다.

부산식약청에 따르면 지난 2002년부터 2013년까지 12년 동안 부산지역 학교 급식소에서 발생한 집단 식중독 사고는 모두 36건, 경남 34건, 울산 21건 등 이었다. 학교별로는 초등학교와 중학교가 각각 6건에 그친 반면, 고등학교는 24건으로 전체 3분의 2 이상을 차지했다.

또 점심만 급식하는 초중학교와 달리 고등학교는 저녁 급식까지 제공하고 있어 식중독 발생비율이 3배 가까이 높았다. 식중독 원인물질은 병원성대장균이 14건으로 압도적으로 많았고, 이어 노로바이러스 3건, 캠필러박터제주니 2건 순이었다.

이들 과정에서 사용된 빅데이터는 ▲신기술 접목을 통해 식중독 예방사업을 추진하는 ‘과학적 식품행정’ ▲식중독 취약대상을 집중적으로 분석하는 ‘발생요인 다변화’ ▲영양사 및 조리사에 대해 차별화된 예방서비스를 지원하는 ‘국민 맞춤형 서비스’ ▲식중독 예측지도 작성의 기반이 되는 ‘예측 및 예방 방식 중독 지수’ 등이 활용됐다.

조지훈 부산식양청 주무관은 “빅데이터 분석을 통한 식중독 예측지도 사례에서 알 수 있듯 공공데이터의 개방과 공유가 과학적인 식품행정을 이끄는 기반이 됐다”고 평가했다.

 
 

<4부-적용사례: 공공>

공공데이터 활용, 시행착오의 한 해
팽동현 기자 dhppp@itdaily.kr

박근혜 정부가 지난해 출범과 더불어 표방한 ‘정부3.0’은 공공정보의 적극적인 개방과 공유, 부처 간 칸막이를 없앤 소통과 협력을 추구하는 새로운 정부 운영 패러다임이다. 이를 통해 국민 맞춤형 서비스를 제공하는 동시에 일자리 창출과 창조경제 지원을 목적으로 하고 있다.

이에 따라 국가가 보유한 각종 행정정보 등 공공 분야에 쌓인 데이터가 공개되기 시작했고, 민간에서는 새로운 서비스 및 상품 개발을 위한 수요가 늘어나고 있다. 특히, 교통·기상정보 등 국가정보자원을 이용한 모바일 앱 개발이 활발하게 이뤄지고 있다. 공공기관의 공공데이터 활용 성공사례로는 심야시간대 시민들의 통화량을 분석해 효율적인 버스 노선을 계획한 서울시 심야버스 ‘올빼미버스’가 대표적으로 꼽힌다.

또한 미래창조과학부와 관계부처는 지난해 12월 경제관계장관회의에서 ‘빅데이터 산업 발전전략’을 합동 발표하며 빅데이터가 창조경제의 핵심임을 천명했다. 지속가능한 데이터 생태계 조성을 추진해 빅데이터를 창조경제 및 정부3.0의 핵심 동력으로 육성하고, 이를 통해 궁극적으로 국민행복을 달성하겠다는 전략이다.

그러나 정부3.0에서 공공기관의 과도한 시장 참여로 인해 관련 SW기업이 도산위기에 빠지는 일이 벌어지기도 했다. 소프트웨어정책연구소(SPRi)가 지난 8월 발표한 ‘공공기관 SW사업의 문제점 및 개선제안’에 따르면, 978개 공공기관에서 총 1,167개 애플리케이션을 배포하는 등 국민의 생활편익을 위해 기관이 보유한 데이터 기반으로 다양한 공공서비스를 관련 기관 및 국민·기업들에게 무상으로 제공하고 있다.

하지만 이 같은 공공서비스는 기존 민간 기업에서 제공하는 서비스와 유사한 것이 상당수로, 오히려 민간 기업에게 피해를 끼치며 시장을 위축시키고 있는 것이다. 지난 2008년 안전행정부의 ‘온나라시스템’ 무료 배포로 당시 176개 기관에 관련 시스템을 보급했던 중소 SW기업 H사가 상장폐지됐던 사례가 대표적인 예라 할 수 있다.

SPRi는 또한 공공기관이 이런 서비스를 지속적으로 운영하기 위해 산하단체나 IT 자회사를 설립해 민간 SW기업과 직접적 경쟁관계를 형성하는 등 SW산업 생태계를 교란시키고 있어 문제점을 낳는다고 지적했다. 공공기관은 강한 사업동기가 없어 즉각적인 대응과 빠른 업그레이드가 어려울 수 있고, 정부의 지속적 예산지원 보장이 어렵기 때문에 서비스 지속은 물론 예산 낭비가 문제될 수 있으며, 해당 분야 시장이 고사돼 민간 서비스를 제공받기 힘들어질 수도 있다는 것.

이에 정부3.0 추진위원회는 새로운 ‘정부3.0 발전계획’을 지난 9월 발표, 정부에 의한 민간 영역 침해를 방지하고, 민간영역을 침범한 정부서비스는 단계적으로 정비해 ‘상생의 데이터 생태계 조성’을 추진한다고 밝혔다. 또한, 클라우드 기술을 활용해 현재 부처별로 관리되는 공문서와 정책 자료의 칸막이를 없애고, 빅데이터 분석을 통해 협업실태를 실시간 모니터링하는 협업 지도도 만들며, 증거기반 정책수립을 법제화해 잘못된 수요조사용역 같은 공공사업의 비효율적 추진과 낭비요인을 근절시키는 등 다양한 계획을 추진할 예정이다.

한편, 정부는 2017년까지 데이터 개방 5대 강국 진입을 목표, 고가치·고수요 데이터를 우선적으로 개방할 방침이다. 산업적 파급효과가 높은 교육(NEIS)·건축(세움터)·교통(자동차) 등 전국단위 시스템 중에서 ‘국가중점 개방 데이터’ 30여개를 국민 주도로 개방시키며, 공공데이터의 신뢰성 보장을 위한 품질인증제도도 도입할 예정이다.



<4부-적용사례: 콘텐츠>

내 귀에 도청장치
팽동현 기자 dhppp@itdaily.kr

빅데이터의 바람은 콘텐츠 산업에도 불어, 일반 사용자들도 그 열기를 체감할 수 있게 됐다. 특히, 개별 소비자의 잠재적 요구에 맞춘 ‘개인화’가 업계의 트렌드로 자리 잡고 있다. 가트너는 지난달 발표한 ‘2015년도 글로벌 IT 시장 10대 주요 예측’에서 2017년까지 컴퓨터 알고리즘 기반의 파괴적인 디지털 비즈니스가 출현할 것으로 전망했다.

로엔엔터테인먼트의 음원서비스 멜론은 서비스 10주년을 맞아 소비이력 데이터를 포함한 핵심 자산을 외부에 개방, 공유하는 플랫폼을 지난 7월 공개했다. 멜론 고객 2,400만 명이 10년간 음원을 소비한 이력과 이용행태 등의 빅데이터를 분석해 유의미한 정보로 변환, 이를 기획사 및 아티스트에 공개해 활용하도록 한 것이다. 하둡 에코시스템을 구축해 전체 사용자의 스트리밍·다운로드 이력을 기반으로 본격적인 빅데이터 활용에 나섰다.

멜론은 접속한 이용자들의 행동을 종합적으로 관찰한다. 스트리밍, 다운로드 횟수 외에도 팬 소비지수도 따로 측정하며, 웹사이트 내 마우스의 움직임, 검색에서 음악 선택까지 클릭 패턴 등도 관찰한다. 팬 신청, 포토 조회, 영상 시청, 댓글 등 32가지에 달하는 지수를 모두 다루는 게 목표다.

이를 통해 멜론 이용자들은 ‘소식함’, ‘팬맺기’ ‘아지톡(AZTalk)’ 등 다양한 기능을 통해 본인의 잠재된 아티스트 선호도가 반영된 큐레이션 서비스로 콘텐츠를 제공받게 됐으며, 아티스트와의 활발한 교류도 가능해졌다. 멜론은 개인화된 서비스 영역을 더욱 강화해나갈 계획으로, 사용자 행태를 다각도로 분석해 다양한 데이터를 파트너 및 사용자에게 제공할 예정이다.

네오위즈인터넷의 음악포털 벅스도 지난 8월 ‘벅스 4.0 앱’을 출시, 개인화 추천 기능을 제공하기 시작했다. 음악 청취 패턴은 자연스럽게 음악적 취향을 보여주므로, 벅스를 사용하는 여러 가지 행위를 분석해 개인의 취향에 맞는 음악을 추천하는 것이다. 사용자로부터 청취기록과 ‘좋아’한 아티스트/뮤직PD/앨범/곡, 내 앨범에 저장한 곡, 다운로드 받은 곡 등의 사용 패턴에 대한 정보를 수집해 활용하고 있다.

벅스의 개인화 추천 시스템 ‘뮤직4U’는 선호하는 아티스트와 유사한 느낌의 아티스트를 추천하고, 내가 자주 듣는 분위기의 음악과 비슷한 분위기의 음악, 그리고 작년 이맘 때 들었던 음악, ‘좋아’를 누른 아티스트의 새로운 앨범 등 다양한 개인화 추천을 제공하고 있다. 방대한 양의 데이터가운데 사용자의 어떤 행위를 주요지표로 정할지, 또 각 지표마다 어느 정도의 가중치를 줄지 등에 대한 추천 알고리즘 구축에 공을 들였고, 이를 기반으로 최상의 퍼포먼스를 낼 수 있도록 구조화하는데 힘썼다는 게 벅스의 설명이다.

벅스는 앞으로도 개인의 데모그래픽 정보(연령, 성별, 위치 등)를 활용해 추가적인 가치를 제공하기보다는, 사용자의 행위기반 정보를 보다 정교화하게 분석해 추천품질을 높이는데 주력할 계획이다. 사용자의 명시적인 행위 기반의 정보(청취, 다운로드, 좋아요 클릭 등)로 추정해볼 수 있는 숨어있는 사용자의 음악이용 패턴을 찾아내 보다 정교하고 향상된 추천품질을 제공할 수 있도록 관련 연구를 시작했다고 한다. 

 

 

<4부-적용사례: 제조>

데이터 분석 기반 ‘Smarter Manufacturing’
팽동현 기자 dhppp@itdaily.kr

빅데이터는 생산과정의 안정성과 효율성을 높이는데도 쓰이기 시작했다. 미래부가 주최하고 한국DB진흥원이 주관해 지난 9월 개최된 ‘2014 데이터그랜드 컨퍼런스’에서 이윤모 베가스 R&D센터장은 ‘제조 분야의 빅데이터 분석 사례’에 대해 세션 발표를 맡았다.

이윤모 센터장은 빅데이터 분석 등 ICT기술을 활용해 보다 스마트한 제조 환경을 구현하는 것을 ‘Smarter Manufacturing’이라고 정의했다. 잠시 멈추기만 해도 막대한 손해가 발생할 수 있는 제조공정에서, 분석과 예측으로 고도화된 의사결정을 지원해 보다 안정적이고 효율적인 환경을 구축하는 게 핵심이다. 활용할 빅데이터는 공장의 설비·장비 등에 탑재된 센서로부터 생성되는 수많은 반정형 데이터와 모니터링 영상과 이미지 등 비정형 데이터가 기존의 정형 데이터와 함께 구성된다.

기간계 시스템으로부터의 정형 데이터와 비정형 데이터를 통합해 빅데이터 기반 분석체계를 확보하고, 이를 분석해 보다 고도화된 의사결정을 지원, 설비이상을 예측하거나 품질 원인을 분석한다. 또한 실시간 제조현장 모니터링을 통한 생산 효율성 향상 및 안전 관리체계 강화도 도모한다. 부수적으로 통합 운영 및 관제를 통해 생산현장 사고나 이상 현상을 실시간으로 감지, 체계적인 대응체계를 구축한다.

‘Smarter Manufacturing’은 설비예지정비, 품질분석, 가상예측, 결함탐지·인지, 재고관리, 에너지절감분석 등 크게 6가지 영역으로 나뉜다.

먼저, 예지정비를 통해 제품생산공정에서의 다양한 이력정보를 활용한 설비장애 조기감지 모델로 기업의 설비 유지·보수비용을 절감할 수 있다. 설비·장비의 진단 및 정보 기술을 활용, 설비·장비의 상태에 대한 데이터를 수집·분석하고 과학적 데이터 관리를 통해 예측모델을 구성한다. 이를 바탕으로 설비·장비의 문제점과 이상상태를 예측하고 개선함으로써 설비·장비의 장애가 발생하는 것을 사전에 예방한다.

또한, 품질분석을 통해 제품의 불량 발생 시 불량의 원인인자 및 최적조건을 신속하게 탐지, 기업의 품질 비용을 절감할 수 있다. 불량 이상 통보 시 불량 증가 원인 공정/설비를 선정, 불량 원인인자를 탐색 후, 인자의 최적 공정조건을 산출한다. 데이터의 통합분석을 통해 불량 발생 트렌드/패턴을 분석해 알람(Alarm)을 생성한다.

아울러, 가상계측은 공정·설비 정보와 계측 데이터의 관계를 모형화해 가상 계측 값을 생성하는 것으로, 실제 계측 값의 이상 변동을 조기 감지해 공정능력을 향상시킬 수 있다. 또 결함탐지·인지는 요약된 데이터뿐 아니라 로(Raw) 데이터를 활용해 패턴을 모형화, 알람을 제시해 보다 효율적인 모니터링을 가능케 한다.

이와 함께, 재고관리는 재고비용을 고려한 반품 수요예측을 통해 재고비용 절감 및 효율적인 재고관리를 가능케 하고, 에너지절감분석은 에너지 사용현황을 파악해 에너지 효율이 다른 설비에 비해 낮거나 과거에 비해 떨어진 원인을 찾아 조치하는 분석방법이다.

이밖에도, 이미지 분석을 통해 패턴의 변화를 탐지해 생산공정의 효과적인 품질관리를 가능케 하고, 영향인자를 반영한 표준화된 수요예측을 통해 매출증대 및 비용절감을 꾀할 수도 있다.
 

저작권자 © 컴퓨터월드 무단전재 및 재배포 금지