03.28
주요뉴스
뉴스홈 > 인터뷰
[데이터사이언티스트를 찾아서] “시작은 사용자 관점에서부터”이정훈 열정팩토리 대표

[컴퓨터월드] 실리콘밸리에서 생겨난 용어인 ‘스타트업’은 설립한 지 오래되지 않은 신생 벤처기업을 뜻한다. 대부분의 경우 제한된 인력과 자원을 지닐 수밖에 없는 스타트업이 정글 같은 시장에서 살아남고, 또 성공을 거두기 위해서는 새롭고 창의적인 아이디어와, 이를 뒷받침할 수 있는 기술력이 주로 관건이 된다.

‘개인화 추천 서비스’는 현재 ‘빅데이터’라는 단어가 보편적으로 적용되는 사례 중 하나로 꼽힌다. 알고리즘 기반의 맞춤형 추천은 다양한 분야에서 사용자들에게 새로운 경험을 제공해주고 있다. 이 가운데 ‘뉴스’ 콘텐츠의 분석을 통한 ‘큐레이션’으로 승부수를 던진 스타트업이 등장했다. 이 스타트업 ‘열정팩토리’를 이끌고 있는 이정훈 대표의 이야기를 들어본다.

   
▲ 이정훈 열정팩토리 대표

이정훈 열정팩토리 대표는 서울대 전기컴퓨터공학 석사 과정에서 데이터 모델링의 기초를 쌓을 수 있었다고 밝혔다. 연구실에서 무선 자원의 배분을 위해 시뮬레이션과 분석을 수행하며 효율적인 모델을 찾는 방법을 공부했다.

대학원 졸업 이후 7년여 간 일반적인 회사원이었던 이정훈 대표가 ‘뉴스’라는 콘텐츠에 주목하고 분석하게 된 것은 개인적인 경험으로부터 비롯됐다. 스마트폰에서 SNS 다음으로 많이 찾는 서비스가 뉴스라는 것을 자각하면서부터, 뉴스를 이용하는데 불편한 점들이 하나둘 보이기 시작했다.

이러한 점들을 지인들을 통해 공유한 결과, 콘텐츠를 찾는데 드는 시간과 노력을 줄여 새로운 편의성을 제공해보자는 취지에 공감하는 이들이 모였다. 전기컴퓨터공학 전공자들을 주축으로 한 스타트업 ‘열정팩토리’의 시작이다.

제4회 청년기업가대회 우승(대상), 제3회 정주영 창업경진대회 최우수상 등을 수상한 열정팩토리는 지난 6월 본격적으로 출발, 지난 10월말 ‘똑똑한뉴스’라는 이름의 모바일 앱을 안드로이드 마켓에 선보였다. 이정훈 대표가 생활 속에서 느꼈던 불편이 뉴스 큐레이션 서비스의 출시로 이어진 것이다.

“이제 갓 알을 깨고 나온 햇병아리 스타트업이라, 모든 면에서 너무 부족해서 조심스럽다”고 손사래를 치던, 그러나 그 속에서 열정을 내비치던 이정훈 대표로부터 들은 데이터에 대한 신선한 시각을 일문일답 형태로 정리했다.

 

데이터에 관심을 갖게 된 계기는.

데이터 자체에 관심을 가졌다기보다는, 인터넷·웹의 패러다임이 바뀌는 것에 먼저 관심을 가졌다. 1세대 인터넷에서 연결 및 전송이 관건이었다면, 2세대 인터넷은 저장 및 검색이 화두였다.

이제는 기술의 발달에 따라 보다 많은 데이터를 저장할 수 있고 보다 쉽게 검색할 수 있게 됐지만, 사람들은 쌓여있는 수많은 데이터 속에서 자신이 원하는 데이터를 찾는 것을 번거로워하기 시작했다.

이에 따라 사용자를 위해 저장된 데이터를 분류해주고, 또 자동으로 추천해주는 것이 중요해 질 것이라는 생각이 들었다. 기술적으로 이 문제를 풀어보고자 데이터 분석에 자연스레 관심이 갔고, 이는 후에 큐레이션 서비스인 ‘똑똑한뉴스’의 출시로 이어졌다.


스타트업으로서 바라보는 빅데이터란.

빅데이터가 이런 것이라는 얘기를 할 입장은 아닌 것 같다. 스타트업을 시작하는 과정에서의 경험을 공유해본다면, ‘똑똑한뉴스’는 요즘 뜨는 빅데이터라는 키워드를 주제로 뭔가를 해보자고 출발한 것은 아니었다.

스마트폰으로 뉴스를 이용하는데 불편을 없애보고자, 개인화 추천 알고리즘을 적용하기 위해 데이터 분석을 도구로 활용하려 한 것이었고, 그러한 고민과 적용해보려는 노력의 결과로 만들어진 것이라고 설명할 수 있다.

‘똑똑한뉴스’에서 바라보는 데이터는, 각 사용자를 표현해주는 기록이다. 디지털 세상에서는 소비하고 이용하고 관심 갖는 데이터가 곧 그 사람의 정체성(Identity)으로 여겨진다.

주위를 둘러보면 빅데이터에 관심을 갖는 스타트업은 늘어나는 추세다. 이는 빅데이터에 대한 대중적인 관심의 증가와 무관하지 않은 것으로 보인다.

대개의 경우 아직은 빅데이터를 다루거나 처리하는 기술에 초점이 맞춰져 있는데, 데이터 분석은 그 안에 담겨 있는 실질적 의미까지 연결돼야 한다고 생각한다. 이러한 부분에 대한 이론이나 교육이 보다 체계화되면 도움이 될 것 같다.


뉴스 콘텐츠의 특징이 있다면.

미국의 모바일 앱 분석업체 플러리(Flurry)에 따르면, 뉴스는 SNS와 더불어 고객 충성도와 사용 빈도가 모두 높은 콘텐츠로 분류된다. 또 뉴스는 실시간성을 지녀, 48~60시간이 지나면 의미가 급속도로 떨어진다. 국내의 경우 하루에 2,000개 이상의 기사가 인터넷에 배포되고, 1인당 평균 12개의 기사를 읽는 것으로 알려졌다.

뉴스 기사도 텍스트이므로, 분석을 위해서는 자연어 처리가 필요하다. 대개 단어별로 띄어 쓰이는 영어에 비해 한국어 자연어 처리는 어렵다. 게다가 요즘 콘텐츠들은 띄어쓰기도 지켜지지 않는 경우가 많다. 미국에서 쓰이는 알고리즘을 그대로 적용할 수도 없고, 한국어 처리 알고리즘의 발전도 더딘 편이다.

자연어 처리를 위해 논문도 찾아보고, 모교 교수의 도움을 받기도 했다. ‘똑똑한뉴스’에서는 비교적 중요성이 덜한 조사나 접속사 등 품사를 떼어내고, 또 기사에 포함된 키워드들 중에서도 우선순위를 가려내 처리하고 있다.


기존 모바일 뉴스 서비스 이용 시 불편했던 점은.

기존 모바일 뉴스 서비스들로부터 개인적으로 느껴왔던 불편을 많은 사람들도 공통적으로 겪고 있는지 확인하기 위해, 지난 2월부터 6월까지 지하철과 버스에서 스마트폰으로 뉴스를 보고 있던 이용객 150여명에게 직접 다가가 물어봤다.

그 결과, 관심 있는 기사를 찾기 위해 수차례 조작해야 되서 번거롭고, 과도한 광고배너가 기사를 읽는데 방해된다는 답변을 들었다. 아울러, 유사한 내용의 기사들이 제목만 조금씩 다르게 올라옴으로써 중복으로 보게 돼 시간 낭비를 초래하고, 이로 인해 댓글도 기사별로 분산돼 의견 공유에 걸림돌이 된다는 것을 파악할 수 있었다.

여담으로, 대중교통 이용객들로부터 의견을 모을 때, 먼저 도착지까지 네 정거장 이상 남았는지부터 물어봤다. 그 밑으로는 시간이 부족하더라.


기존 모바일 뉴스 서비스의 불편을 어떻게 해소했는가.

‘똑똑한뉴스’는 자연어 처리로 연관 뉴스 기사를 실시간으로 묶는 클러스터링을 통해 기존 모바일 뉴스 서비스의 불편을 해소하려 한다. 뉴스 기사와 더불어 사용자 선호도에 대한 분석도 병행, 맞춤형 콘텐츠 제공을 꾀하고 있다. 사용자의 선택에 따라 자동으로 기사가 추천되는 형태다.

또한 간편 보기 기능을 활용하면 뉴스 기사의 본문과 이미지만을 추출해 가독성을 높여주고, 클러스터링을 기반으로 한 통합 댓글 시스템도 지원하는 등 편의성을 제공한다.

특히, 추천을 위해서는 먼저 콘텐츠의 분류가 선행돼야 한다. 콘텐츠 제공자들이 정치, 경제, IT 등으로 카테고리를 크게 분류해 제공할 수는 있지만, 정치 카테고리 내에서 대통령, 선거, 여야관계, 특정인물 등으로 다양하게 분류해줄 수는 없는 상황이다. ‘똑똑한뉴스’는 이러한 방식을 취하지는 않지만, 기사 간의 연관성을 파악해 그룹으로 묶어서 카테고리를 세분화시키고 있다.

이러한 자체 개발 알고리즘은 별도 설정이 필요 없이 사용자의 관심 주제에 맞춰 추천해주고, 또 이에 대한 사용자의 선택결과를 기계적으로 학습해 동적으로 변화하며 적응하는 게 가능하다. 서비스 사용자가 늘어날수록 보다 정확해져, 더 나은 가치를 제공할 수 있을 것으로 기대한다.


데이터 사이언티스트는 어떤 사람이라고 보나.

스스로는 ‘데이터 사이언티스트를 꿈꾸는 사람’이라고 여긴다. 그런 입장에서 본다면, 데이터 사이언티스트는 데이터에 포함된 이면의 의미까지 한걸음 더 나아가 볼 수 있는 사람이라고 사료된다. 즉, 데이터에 내포된 의미와 사용자들의 습성을 더 잘 읽을 수 있고, 이를 분석에 활용하는 것. 데이터 수집이 수월해졌기 때문에 무엇을, 어떠한 상황에서 수집할지 결단을 내리는 게 중요해졌다.

이러한 사람이 되기 위해서는 첫째로 관찰과 고민을 통해 통계적인 가설을 세울 수 있어야 하고, 둘째로 이 가설을 기술적으로 시연해볼 수 있는 역량이 요구될 것이다. 이 두 가지가 함께 어우러져야 충분한 분석이 이뤄질 것으로 보인다.

열정팩토리는 데이터 사이언티스트를 꿈꾸는 사람들이고, 지금도 부족한 점들을 서비스를 통해 계속 발견하고 있다. 진정한 데이터 사이언티스트가 되는 그날에 다시 이 자리에 서고 싶다.

 

인터뷰를 마치며 향후 계획을 묻는 기자의 질문에 이정훈 대표는 “당장의 수익 추구보다는, 서비스 안정화와 함께 사용자 확보에 주력해 플랫폼으로 자리매김하는 게 목표”라고 설명했다. 소탐대실(小貪大失)의 우를 범하지 않고, 스타트업답게 도전하고 배워가며 멀리 바라보겠다는 것.

아울러 이 대표는 “열정팩토리는 사용자들이 검색하거나 따로 입력 및 설정하지 않아도, 그저 서비스 이용만으로 모든 콘텐츠를 자동으로 맞춰서 제공하는 시스템을 꿈꾸고 있다”며, “함께해주는 고마운 열정팩토리 구성원들과 더불어, 언젠가는 이 하늘을 지배하는 독수리로 거듭나 돌아오겠다”고 포부를 밝혔다.
   
▲ 열정팩토리

여백
컴퓨터월드 추천기업 솔루션
인기기사 순위
IT Daily 추천기업 솔루션
153-023) 서울시 금천구 가산동 327-32 대륭테크노타운 12차 13층 1314호 (주)ITMG
TEL:02-2029-7200  FAX:02-2029-7220  사업자등록번호:106-86-40304
개인정보/청소년보호책임자:윤현기  등록번호:서울 아 00418  등록일자:2006.10  발행인:김용석  편집인:김선오