소셜미디어 속에 담긴 유권자의 넷심(心)을 표심(心)으로

▲ 강용성 와이즈넛 대표
[컴퓨터월드] 지난 2012년 미국 대통령 선거에서 버락 오바마 대통령 후보는 다양한 형태의 유권자 데이터를 확보, 분석해 유권자 맞춤형 선거 전략을 전개함으로써 재선에 성공했다. 또한 2013년 일본에서 진행된 참의원 선거에서 야후재팬이 빅데이터를 통한 선거 예측 서비스로 높은 정확도를 보여줬다.

선거와 관련된 두 가지 사례는 빅데이터 분석·활용이 가장 적극적으로 이뤄진 것으로, 이른바 ‘빅데이터 선거’로 불리고 있다.

이미 미국, 유럽 등의 국가에서는 트위터, 페이스북, 블로그 등 소셜미디어를 중심으로 한 빅데이터를 통해 선거의 판세를 가늠하고, 나아가 표심을 움직이게 하는데 활용하고 있다.

그러나 국내 사례를 살펴보면 지난 대선 때 다양한 소셜미디어의 자료를 바탕으로 빅데이터 분석을 했지만 실제 개표결과가 생각했던 것보다 큰 차이를 보였다.

이 같은 결과는 미국과 국내에서 데이터를 수집하고 활용하는 범위에 차이에서 기인한다.

미국 오바마 선거진영에서 사용한 데이터는 유권자들의 생필품 등의 구매 내력, 개인 취향 정보, 이전 선거에서의 투표 성향 그리고, 선거진영에서 피드백을 요청한 정당 선호 답변과, 외부의 데이터 유통 업체에서 구매한 데이터 등을 활용했다.

그러나 우리나라는 모든 일정 자격 국민들이 투표를 하고, 개인정보의 엄격한 사용 금지 원칙을 가지고 있기 때문에 개인의 신상정보, 구매이력, 개인의 성향 및 정당에 대한 선호도 등은 알 수가 없으며, 수집된 정보는 많지만 의미 있는 정보는 미비하다. 그리고 당시 빅데이터는 온라인(블로그, 카페, 트위터 등)을 적극적으로 사용하는 젊은 층이나 특정 사용계층에 표본이 집중되어 있다. 이런 점이 미국 대선과 차이라 하겠다.

그러나 소셜미디어는 쉽게 형성되고, 주제가 다채롭고 쉽게 변경되며, 빠른 소멸이 된다는 점과 소셜미디어를 통해 점차적으로 다양한 세대가 소통함으로써 각 세대별 유권자의 참여가 확대되고 있다는 점에서 빅데이터가 ‘선거’에서 지속적인 주목 받고 있는 것은 사실이다.

결국 ‘빅데이터 선거’에서 빅데이터 분석의 가장 기본은 ‘데이터 양’이다.

현재 데이터 분석에서 100% 정답은 내놓을 수는 없지만, 많은 데이터 속에서 공통점을 찾아낼 수 있기 때문에 분석을 통해 지지도, 호감도 등의 후보자에 대한 의미 있는 정보를 제공할 수 있다.

그럼에도 여전히 선거 구도에서 가장 큰 변수는 투표율이기 때문에, ‘빅데이터 선거’에서 빅데이터 분석은 해당 후보에 대한 유권자의 넷심(心)을 통해 선거 판세를 가늠해 보는 정도로 바라봐야 할 것이다.

현재, 오는 6월 4일 전국동시지방선거를 앞두고 각 후보 진영은 지지표를 늘리기 위해 힘을 쏟는 선거운동이 한참이다. 와이즈넛은 6.4 전국동시지방선거 후보자 등록이 마감된 이후인 5월 17일부터 빅데이터 기술로 2014 전국동시지방선거 후보자들의 온라인 영향력을 보여주는 한국형 선거 빅데이터 분석 사이트 ‘초이스 2014’ 서비스를 제공하고 있다.

초이스2014는 시장, 도지사, 교육감 등 이번 선거 각 부문 후보자들에 대한 온라인 노출, 호감도, 신뢰도, 관심지수 등 유권자의 넷심(心)을 다차원 지수분석을 통해 6월 4일 전국동시지방선거의 판세를 가늠해 볼 수 있다는 점에서 의미가 크다.

‘초이스2014’는 와이즈넛이 보유한 빅데이터 수집, 분석 기술과 형태소 분석 기술, 텍스트마이닝 기술, 자연어 처리 기술 등이 집약된 것으로 트위터, 블로그, 카페 등에 올라온 선거 후보자 관련 일일 약 7만5천여 버즈를 수집하고, 수집된 정보의 긍/부정 분석 결과를 종합해 니어 리얼타임(near real time)으로 인품, 자질, 지지도 등 항목별 넷심(心) 성향분석과 후보자간 비교 및 일자별 변화 추이, 버즈의 전파 경로 등을 시각적으로 제공한다.

▲ '초이스 2014'
그 예로, 서울시장 후보인 박원순 후보의 경우 5월 22일 “셔츠에 배낭 매고 선거유세길 나서...”에 대해 전날 대비 정치인관심도지수(BAI)의 긍정지수와 매체노출지수(BVI)가 각각 35%, 15% 증가했다.

한편 정몽준 후보는 5월 13일 “정몽준 아들 발언에 “철없는 아들 너그럽게 용서해 달라” 눈물 쏟아...”에 대해 전날 정치인관심도지수(BAI)의 긍정지수와 매체노출지수(BVI)가 각각 17%, 66% 증가했다.

소셜미디어 데이터가 특정 연령대에 이용자의 편중이 있을 수 있다는 우려가 있기는 하지만, 이는 해당 연령대의 여론을 가장 잘 파악할 수 있다는 반증으로 바라봐야 한다고 생각한다.

결국 ‘빅데이터 선거’는 데이터 속 인간이 가지고 있는 생각, 담겨진 이념을 찾는 것이고, 기존 데이터를 단순 기계적이며 계산적이라고 생각했던 것에서 가장 인간적인 면을 찾아 바라보고자 하는 인식의 변화이다. 이러한 변화의 시도는 인간의 본성에 따른 합리적 의사 결정을 예측할 수 있는 것으로 이어질 것이다.

* [용어설명]
- 정치인 관심도 지수(Buzzinsight Attention Index, BAI)
- 정치인 신뢰지수(Buzzinsight Trust Index, BTI)
- 매체 총노출 지수(Buzzinsight viral index, BVI)

저작권자 © 컴퓨터월드 무단전재 및 재배포 금지