주민번호 수집금지, 개인정보 이용 등 논란 여전

[컴퓨터월드] 올해 초부터 발생했던 금융사와 통신사의 고객정보 유출 사고는 국민들에게 많은 충격을 안겨줬다. 이전부터 고객정보가 유출되는 사고들이 발생했었지만 올해만큼 많은 규모로, 그리고 많은 정보가 유출된 적은 없었기 때문이다. 게다가 이렇게 반복적으로 고객정보 유출 사고가 발생하다보니 국민들의 불안감은 더욱 커질 수밖에 없었다. 이에 정부는 국민들의 악화된 여론을 안정시키면서 개인정보에 대한 보호 수위를 높이기 위한 방향으로 관련법을 개정하기에 이르렀다.

이에 따라 개인정보를 보호하는 내용을 담고 있는 개인정보보호법의 개정안과 정보통신망 이용촉진 및 정보보호 등에 관한 법률(정보통신망법)의 개정안이 각각 오는 8월 7일과 11월 29일부터 시행된다. 개인정보 보호조치 강화 및 위반자에 대한 처벌 규정 강화 등 규제력이 더욱 높아진 법 시행으로 인해 관련 업계에도 큰 변화가 있을 것으로 예상되고 있다. 변화되는 규정은 무엇이고, 그에 따른 문제점들은 없는지 짚어본다.

이슈 ① 주민번호 법정 수집주의

주민번호 수집·이용 최소화
개인정보보호법 개정안으로 가장 뜨거운 논란을 불러일으키고 있는 것은 당연 ‘주민번호 수집 법정주의’이다. 이는 법령에 구체적인 근거가 있는 경우를 제외하곤 원칙적으로 주민번호의 수집을 금지한다는 것을 골자로 하고 있다.

주민번호는 그동안 행정서비스를 비롯해 금융, 의료, 복지 등 전 사회에서 개인을 식별하기 위한 기초 자료로 널리 활용되어 왔다. 그러나 이런 주요한 개인 식별 정보인 주민번호는 그동안 기관이나 기업들의 관행적인 수집 및 제3자에 대한 무단 제공 등으로 인해 과도하게 오·남용되어 왔고, 관리 부분에 있어서도 취약점이 많아 유출의 우려가 높은 편이었다.

결국 주민번호를 비롯한 개인정보가 유출되는 사고들이 지속적으로 발생하고 있고, 이렇게 유출된 주민번호가 명의도용이나 스팸발송, 피싱 등에 악용되어 커다란 사회 문제로 부각되고 있는 만큼, 이를 원천적으로 차단하겠다는 것이 이번 법 개정의 주요 방향이다.

지난 3월 19일, 안전행정부는 지난해 8월 개정된 개인정보보호법의 원활한 시행을 위해 주민등록번호 유출에 따른 과징금과 불법 수집에 따른 과태료 부과 세부기준 등을 규정한 ‘개인정보보호법 시행령 일부개정령안’을 입법예고했다.

이번 개정령안에 따르면, 앞으로 주민번호를 안전하게 관리하지 않아 유출된 경우 해당 유출 규모와 피해확산 방지를 위한 후속조치 이행 여부 등을 고려하여 최대 5억 원의 과징금이 부과되며, 공공기관이나 민간사업자가 법령 근거 없이 주민번호를 수집한 경우에는 해당 위반 횟수와 그 동기 및 결과 등을 고려하여 최대 3천만 원의 과태료가 부과된다.

안행부는 주민번호에 대한 보호를 보다 강화하기 위해 법령상 근거 없이 주민번호를 수집하거나 이를 유출한 기업에 대하여는 과태료 및 과징금 등의 법적 처벌을 확대하는 한편, 적법하게 수집한 주민번호의 경우에도 반드시 암호화를 통해 안전하게 보관토록 함으로서 유출시 추가적인 피해를 예방토록 한다는 입장이다.

▲ 주민번호 수집·이용 최소화 방안

주민번호 이외 본인 확인은 어떻게?
이보다 앞서 지난 2012년, 정보통신망법에서는 온라인상 주민번호 수집·이용을 금지토록 했으며, 본인 인증이 필요할 경우 아이핀(i-PIN)이나 공인인증서, 휴대전화 인증과 같은 주민번호 이외의 인증수단을 이용하도록 했다.

문제는 오프라인이다. 개인정보보호법 개정안으로 인해 오프라인에서도 주민번호 수집이 중단되게 된 만큼, 이에 어떻게 대처해야 하는지에 대한 논의가 도마 위에 올랐다.

크게 불만을 드러낸 곳은 이동통신사들이다. 고객의 주민번호를 이용하여 미납요금 조회나 채권추심 의뢰 등 업무를 진행해왔던 이통사들의 경우 업무 시스템을 전면적으로 수정해야 할뿐더러, 개정안 시행까지 얼마 남지 않은 기간 내에 시스템 전환을 완료할 수 있을지조차 불투명한 상황. 이에 이통사들은 요금과 관련된 포괄적 업무를 위해서 주민번호 이용을 요청했지만 받아들여지지 않았다. 주민번호 수집 법정주의에 가급적 예외는 두지 않겠다는 것이 정부의 입장이기 때문이다.

▲ 아이핀 발급기관 공공아이핀센터 사이트 화면

오프라인 고유 식별정보 도입
그렇다면 이통사들과 같은 이런 문제들을 해결하기 위한 방안은 무엇일까. 안행부의 해답은 (가칭)마이핀(My-PIN) 서비스다. 오는 8월 7일부터 법령에 근거 없는 주민번호 수집이 금지됨에 따라 일상생활에서 본인확인의 불편을 최소화하기 위해 오프라인 본인확인 수단으로 사용될 예정이다.

마이핀은 인터넷이 아닌 일상생활에서 사용할 수 있는 본인확인 수단으로써, 개인 식별 정보가 전혀 포함되어 있지 않은 13자리 무작위 번호다. 그동안 온라인상에서 사용해왔던 아이핀을 정부와 공인된 기관에서 오프라인까지 확대 제공하는 서비스다.

안행부에 의하면 마이핀은 주민번호와 달리 자체에 나이·성별 등 개인정보가 포함되어 있지 않아 개인 사생활 정보를 보호할 수 있으며, 필요시 연간 최대 3회까지 변경이 가능해 유출이나 도용시 피해를 최소화할 수 있다는 장점이 있다. 또한 의무 가입 사항이 아니기 때문에 필요한 발급을 받고 싶은 사람만 받아서 사용할 수 있다.

본인확인이 필요한 경우 고객(정보주체)은 마이핀 확인 프로그램이 도입된 사업장에서 종이서식에 직접 쓰거나 전자서식 등 컴퓨터에 직접 입력할 수 있으며, 전화(ARS)로 마이핀을 불러 주는 형태로 사용하게 된다.

이에 따라 서비스 연계가 필요한 멤버십카드 신청, 각종 렌탈 서비스 계약이나 고객 상담 등에서 주민번호를 사용하지 않고도 마이핀으로 본인확인을 할 수 있게 될 전망이다.

안행부는 마이핀 서비스의 원활한 보급을 위해 공공아이핀센터, 나이스평가정보 등 본인확인기관 홈페이지나 지역 주민센터에서 쉽게 발급이 가능하도록 할 예정이다. 또한 마이핀의 사용 편의성을 고려하여 번호를 굳이 암기하지 않고도 이용할 수 있도록 신용카드 크기의 발급증 형태로 제공하거나 수시로 확인할 수 있는 스마트폰 앱 서비스도 제공할 계획이며, 마이핀 사용내역을 휴대폰이나 이메일 등으로 알려주는 ‘알리미서비스’도 제공함으로써 안전성도 높인다는 계획이다.

마이핀 서비스는 시스템 구축 등 준비를 갖추고 7월 중 시범운영을 거쳐 8월 7일부터 본격 시행될 예정이다.

▲ 해외 주요국의 고유 식별정보 제도

주민번호 파기 의무, 업계 부담 가중
개인정보보호법 개정안은 법령상 근거가 없는 경우에는 대체수단 도입 등을 통해 주민번호를 수집하지 않도록 했으며, 기 보유한 주민번호는 법 시행 2년인 2016년 8월 6일까지 파기하도록 하고 있다. 뿐만 아니라 주민번호 수집을 요구하는 업무절차나 내부규정, 그리고 서식 개선까지 병행해야 한다.

기존 개인정보보호법에서도 수집한 개인정보가 불필요하게 됐을 때는 지체 없이 해당 정보를 파기할 것을 명시하고 있지만, 실제로 이를 지키는 곳은 드물었다. 실제 단속도 잘 이뤄지지 않았을 뿐더러, 불필요한 개인정보를 일일이 찾아 삭제하는 것도 많은 노력이 요구됐기 때문이다.

그러나 개정안 시행과 더불어 현장 실태점검 역시 강화되기 때문에, 이번만큼은 사업자들이 어렵다는 이유로 주민번호 파기를 소홀히 할 수 없게 됐다. 또한, 한국인터넷진흥원(KISA)에서 상시 종업원 수 50인 미만인 영세사업자(소상공인 및 중소사업자, 벤처기업, 창업자), 비영리단체, 영세사업자용 고객관리 프로그램‧홈페이지 개발사 등 고객의 개인정보를 관리하는 사업자 등을 대상으로 무료 기술지원 서비스를 제공할 만큼 국가적인 차원에서도 이를 지원하고 있기 때문에, 주민번호 파기를 위한 움직임은 한층 바빠질 것으로 보인다.

그렇지만 이는 업계의 부담을 한층 가중시킬 것이라는 목소리도 높아지고 있다. 지난 6월 16일, 방송통신위원회와 KISA는 ‘온라인 개인정보 보호 컨퍼런스’를 개최하고 주민번호 미수집 전환 및 파기 정책에 대해 설명하는 시간을 가졌다. 컨퍼런스에 참석한 사업자들은 주민번호 파기에 대해 많은 어려움을 토해냈다.

대형 쇼핑몰에서 근무하고 있는 참석자는 “미성년자에게 판매할 수 없는 물품들이 있기에 고객 연령대를 확인해야 하는데, 주민번호를 삭제하면 이를 확인하기 위한 방안이 없다”며, “주민번호를 모두 삭제하는 것 대신 뒤쪽 7자리 숫자만 삭제하고, 생년월일 6자리는 남겨놓으면 안 되느냐”고 질문했다. 이에 대해 박찬욱 방통위 사무관은 “무조건 주민번호를 삭제하고, 필요하면 고객 동의를 얻어서 새롭게 생년월일을 수집해야 한다”라는 원칙론적인 입장을 밝혔다.

이밖에도 게임업계에 종사하고 있는 참석자는 “오프라인에서 고객센터로 문의를 주는 사람들에 대해 본인확인을 할 수 있는 방안이 없다”고 밝혔으며, 또 다른 참석자는 “현재 모든 사회 시스템이 주민번호 상으로 돌아가고 있는데, 주민번호 수집이 안 되는 경우 어떻게 대처해야 할 지 모르겠다”고 의견을 피력했다.

▲ 개인정보 보호 종합지원 포털에서는 개인정보 보호와 관련된 다양한 정보를 제공하고 있다

잊혀질 권리, 개인정보 보호와 공공의 알 권리의 충돌

지난 5월 유럽 사법재판소(ECJ)가 온라인 상 ‘잊혀질 권리’에 대해 인정하는 판결을 내리면서 이에 대한 찬반양론이 뜨겁다.

▲ 유럽 사법재판소가‘잊혀질 권리’에 대해 인정하는 판결을 내린 이후, 구글은 삭제 요청을 받기 시작했다

잊혀질 권리는 제3자에 의해 작성된 개인의 민감 정보를 포함한 인터넷 게시물을 시간이 경과한 뒤 정보주체가 해당 게시물에 접근할 수 없도록 하는 권리이자, 해당 게시물을 삭제토록 하여 게시물로부터 자유로울 수 있는 권리를 의미한다. 다만 이번 ECJ의 판결은 원 게시물의 삭제가 아닌, 해당 게시물을 검색할 수 있는 포털(구글) 상에서 검색이 불가능하도록 막는 조치만 인정됐다.

이 판결은 유럽 내 28개국에서만 유효하지만, 해당 판결 이후 파장은 전 세계로 퍼지고 있다. 외신에 따르면 구글이 ECJ의 판결에 따라 삭제 요청을 받기 시작한 지 하루만에 1만 2천여 건의 신청이 쇄도한 것으로 나타났다.

과연 이처럼 잊혀질 권리가 국내에는 어떤 영향을 미칠까? 전문가들은 해당 사안에 대해 신중론을 펼치고 있다.

법무법인 민후의 김경환 변호사는 “언제 어느 정보를 삭제할 것인지, 정보주체의 이익과 정보에 접근하는 일반대중의 이익을 비교형량하여 결정할 필요가 있다”며, “잊혀질 권리를 인정하기 위해서는 앞으로 지속적인 논란이 있을 것으로 보이는 바, 새로운 명문의 입법을 통해 명확한 근거 규정을 도입하는 것이 필요하다”라고 밝혔다.

성균관대 법학전문대학원의 지성우 교수도 “잊혀질 권리가 공인들이 자신의 과거를 세탁하고자 하는 수단으로 남용되거나 오용되는 것은 막아야 한다. 일반인이 갖고 있는 알 권리, 기억될 권리도 잊혀질 권리와 함께 논의가 돼야 한다”며 잊혀질 권리와 충돌하는 기본권에 대해서 함께 생각해야 된다고 강조했다.

이슈 ② 개인정보 보호 강화 vs 개인정보 이용 활성화

빅데이터 시대, 개인정보의 중요성 증대
최근 몇 년 동안 IT업계의 화두는 단연 빅데이터다. 빅데이터란 데이터의 생성이나 주기, 양, 형식 등이 매우 방대해져서 기존 방식으로는 수집이나 저장, 검색, 분석 등이 어려운 데이터를 의미한다. 특히 이전까지는 데이터로 취급하지 않았던 것들도 이제는 엄연한 데이터로 인정받게 되며 그 규모는 더더욱 커지고 있다. 특히 무선 네트워크와 모바일 기기의 발달로 인해 SNS 등 개인들이 생성하는 데이터의 양도 급속도로 증가하며 빅데이터는 더욱 빅(BIG)해지고 있다.

빅데이터가 주목받고 있는 이유는 단순하다. 데이터 속에 필요한 것이 있기 때문이다. 많은 데이터를 모으고 분석을 통해 그 속에서 어떤 사회현상에 대한 어떤 법칙 등을 발견하고 통찰력(Insight)을 찾아서 그에 대응하는 조치를 취한다. 기업 입장에서는 문제를 해결하고 수익을 추구하는 쪽으로 이용하는 것이다.

이런 빅데이터 시대를 맞아 개인정보의 중요성이 점차 높아지고 있다. 기업들은 자신들의 뜻대로 제품이나 서비스를 개발하는 것이 아닌, 어떻게 하면 고객들에게 더 어필할 수 있고, 고객들의 구매 욕구를 자극할지를 고민하고 있다. 그렇기에 시장조사나 경쟁기업 제품 분석 등 다양한 방식으로 제품을 개선하고 서비스를 출시하고 있지만, 무엇보다 중요한 것은 고객들이 관심 있어 하거나 원하는 제품, 서비스를 출시하는 것이기에 이를 파악하기 위한 방법으로 눈을 돌리게 됐다. 그것은 바로 고객들의 정보를 활용한 제품과 서비스를 만드는 것이었다.

고객 이용 정보를 활용한 맞춤형 서비스 등장
누구나 한 번쯤은 쇼핑몰에서 클릭해본 제품, 그리고 그와 연관된 제품이 다음 쇼핑몰 방문 시 광고로 뜨는 것을 본 경험이 있을 것이다. 이것은 해당 쇼핑몰이 고객의 사이트 이용 정보(쿠키)를 활용하고 있기 때문이다.

온라인 쇼핑몰들은 이처럼 쿠키를 활용해 자사 고객들에게 맞춤형 서비스를 제공하고 있다. 고객이 어느 상품을 클릭했는지, 어떤 상품을 구매했는지, 어떤 후기를 남겼는지 등을 종합적으로 수집하고 분석해 해당 고객이 희망하는 것에 대해 적절한 상품을 추천한다.

▲ 인터넷 쇼핑몰이 쿠키를 이용해 맞춤형 서비스를 제공하는 화면

이는 쇼핑몰들이 그동안 축적된 데이터를 통해 고객이 클릭하는 상품은 구매하기 위함이거나 관심이 있기 때문이라는 분석 결과를 도출했기 때문. 그렇기에 고객이 상품을 구매하지 않았더라도 차후 방문 시 해당 상품을 구입하도록 유도하는 광고를 배치하는 것이다.

이밖에도 고객이 관심을 갖는 카테고리를 설정했을 경우 해당 카테고리에 있는 새로운 제품이 출시되거나 할인 행사 등을 진행할 때 고객에게 해당 사실을 알리며 방문을 유도하고 구매할 수 있도록 한다. 이 모든 것들도 쿠키를 수집하고 분석했기 때문에 가능한 것이다.

명확하지 않은 개인정보 정의
지난해 방통위가 발표한 ‘빅데이터 개인정보보호 가이드라인’에 의하면 정보를 ‘공개된 개인정보’와 ‘생성된 개인정보’, 그리고 ‘이용내역정보’로 분류하고 있다.

공개된 개인정보는 ‘정보주체 및 정당한 권한이 있는 자에 의해 제한 없이 일반 공중에게 공개된 부호·문자·음성·음향 및 영상 등의 정보로서 생존하는 개인을 식별할 수 있는 정보 및 다른 정보와 쉽게 결합하여 개인을 식별할 수 있는 정보’를 말한다. 공개형 SNS 메시지나 인터넷 게시글 등이 이에 해당한다.

반면, 생성된 개인정보는 ‘정보 조합·분석·처리시스템 운용을 통해 생성된 정보로서 생존하는 개인을 식별할 수 있는 정보 및 다른 정보와 쉽게 결합하여 개인을 식별할 수 있는 정보’를 말한다. 조합된 개인정보나 개인의 성향, 행태 정보 등이 이에 해당한다.

▲ 인터넷 쿠키 파일들

또한 ‘이용내역정보’는 ‘정보통신서비스와 관련하여 이용자가 해당 서비스를 이용하는 과정에서 자동으로 발생되는 인터넷 접속정보파일, 거래기록 등의 정보로서 생존하는 개인을 식별할 수 있는 정보 및 다른 정보와 쉽게 결합하여 개인을 식별할 수 있는 정보’라고 표기하고 있다. 인터넷 쿠키나 접속기기 정보, 서비스 이용 기록 등이 이에 해당한다.

앞서 온라인 쇼핑몰의 사례처럼 상당수의 국내 주요 웹사이트들은 쿠키를 활용해 이용자에 관한 정보를 수집하고 있다. 가이드라인에 의하면 인터넷 쿠키는 ‘이용내역정보’에 해당하며, 넓은 의미의 개인정보로도 볼 수 있다.

하지만 쿠키파일을 개인정보로 볼 것인지 대한 명확한 기준은 아직 구체적인 법률로 규정하고 있지 않다. 비록 쿠키 자체로 개인을 식별할 수는 없지만 특정 컴퓨터를 식별할 수는 있으며, 쿠키 내용을 종합하거나 쿠키 정보와 다른 유형의 정보를 조합해 개인을 식별하는 것이 가능할 수도 있다.

개인정보보호법에 의하면 해당 정보만으로는 개인을 식별할 수 없지만, 다른 정보와 결합해 알아볼 수 있는 것도 개인정보로 규정하고 있기 때문에, 쿠키도 ‘결합’한다는 의미를 어떻게 해석하느냐에 따라 개인정보인지 아닌지 판단이 바뀔 수 있는 소지가 있다.
 

개인정보 보호 관련법, 너무 많다?

지난 2011년 개인정보보호법이 시행되기 전에는 공공기관의 개인정보 보호에 관한 법률이 개인정보 보호를 규율하고, 정보통신망법이 정보통신서비스사업자를 중심으로 민간분야에서 개인정보 보호를 규율했다. 그 밖에 위치정보, 신용정보 등에 대해 위치정보의 보호 및 이용 등에 관한 법률, 신용정보의 이용 및 보호에 관한 법률 등 별도의 개별법에서도 규율이 이뤄졌다.

이렇게 사회전반에 걸쳐 영역별 정보보호법이 존재하는 방식은 문제에 대한 포괄적·전면적 대응에는 부적절한 방법으로 평가됐고, 결국 공공분야와 민간분야에 대해 통일적으로 적용될 수 있는 개인정보보호법 제정으로 이르게 됐다.

그러나 개인정보 보호업무의 권한 분장이 단일 주체의 관할로 조정되기 어렵다는 이유로 인해 입법과정에서 단일한 개인정보보호법으로 모두 포섭되지 못했고, 영역별 개별법이 남아서 유지되고 있다. 이로 인해 개인정보보호법과 개별법들의 적용에 있어서 상호관계를 어떻게 해석할 것인지가 중요 쟁점이 되고 있으며, 개인정보 보호를 위한 규제 수준이나 방법론의 적정성에 대해 문제제기가 지속적으로 이뤄지고 있는 상황이다.

이에 대해 구태언 테크앤로 법률사무소 변호사는 “사용자 동의 없는 개인정보 수집에 대해 개인정보보호법은 과태료로, 정보통신망법은 형사처벌로 규제하는데 이런 불균형적인 처벌제도를 갖고 있으면 죄형법정주의에 의해 정보통신망법 처벌을 무력화시킬 수도 있다”며, “통폐합을 이루지 못한 과도기적인 문제는 장기적으로 관련 법률들을 단일법으로 통합시키고, 특수 영역에 한해서는 특별법을 마련해야 한다. 단기적으로는 세부적인 가이드라인을 만들어서 이중 규제 문제 등을 해결할 필요가 있다”고 밝힌 바 있다.

개인정보 침해 늘어…개인정보 보호 필요성 증대
빅데이터 시대를 맞아 데이터가 비즈니스의 원천으로 거듭나고 있는 지금, 기업들은 이전까지 활용하지 않았던 데이터들에 대해서도 수집하고 분석하기에 이르렀다. 그러나 자칫 데이터 수집에 열을 올린 나머지 개인정보를 비롯한 민감한 정보 수집에 대한 우려도 높아지고 있다.

특히 페이스북, 트위터와 같은 소셜 네트워크 서비스(SNS)들은 이용자들에게 맞춤형 정보를 제공하기 위해 출생지, 연령, 거주지, 학력, 선호도 등 조합을 통해 개인의 식별이 가능한 개인정보를 요구하고 있으며, 이런 개인정보들을 수집하는 것이 가능해지면서 실제로 개인정보 침해가 발생하고 있는 것으로 나타났다.

이는 한국전자통신연구원(ETRI)이 자체 개발한 ‘빅데이터 개인정보 분석 기술’로 지난해 페이스북 657만개, 트위터 277만개 등 한국인 SNS 이용자 계정 934만개를 대상, 개인정보 노출현황을 분석한 결과에도 잘 드러나 있다.

▲ ETRI는 페이스북에서 많은 개인정보를 유추할 수 있다고 밝혔다

ETRI 조사 결과 페이스북의 경우 성별(92%), 고등학교(47%), 혈액형(40%), 관심사(19%), 좋아하는 음악(14%) 순으로 개인 신상 정보가 노출됐으며, 트위터의 경우 이름(69%), 지역(45%), 직업 (33%) 순으로 노출된 것으로 드러났다. 뿐만 아니라 페이스북에서 이름과 고등학교 조합만을 통해서도 개인이 식별되는 경우는 226만 명(34%), 대학교 정보를 추가할 경우 297만 명(45%)의 개인 식별이 가능한 것으로 확인됐다.

ETRI는 트위터와 페이스북에 노출된 이름, ID 등 간단한 정보를 이용해 최소 17만 개의 트위터 계정과 페이스북 계정을 서로 연결할 수 있는 것으로 파악됐다고 설명했다.

ETRI 측은 “그동안 정보 하나하나를 조합해 개인을 식별하거나, 계정을 상호 연결해 더 많은 정보가 노출될 수 있는 위험성이 많이 지적되어 왔다”며, “이번 조사를 결과를 통해 그 심각성을 확인했다”고 밝혔다.

이밖에도 에드워드 스노든의 폭로로 인해 밝혀진 미국 국가안보국(NSA)의 프리즘이나 영국의 템포라와 같이 정보 감시를 위한 국가적 데이터 수집도 발생하고 있다. 비록 국가 안보를 위한 것이라고는 하지만, 명백한 개인정보 침해에 해당하는 사건들이다. 이처럼 빅데이터 시대를 맞이하며 개인정보 보호에 대한 필요성은 한층 높아지고 있다.
 

개인정보 비식별화 기법과 이를 활용한 빅데이터 사업 사례

서울시 심야버스 노선정책

▲ 개인 식별 요소 제거 요령

심야버스 노선 사업은 서울시가 공개한 교통 데이터와 KT가 보유한 통신 데이터를 결합해 최적의 심야버스 노선을 도출한 결과물이다. 심야버스 노선 사업에는 KT 기지국의 통화량 데이터가 활용됐다. 서울시에 위치한 KT 기지국에서 심야시간 통화량 데이터를 추출해, 해당 시간 특정 지역의 유동인구 현황을 파악한 자료를 토대로 버스 노선을 설정했다.

이번 사업에서 고객의 개인정보라고 할 수 있는 데이터는 KT 내부에서 비식별화 과정을 거친 후 데이터를 분석에 활용했다. 비식별화를 거친 데이터는 고객 성명과 연령, 그리고 청구지 주소다.

▲ 서울시와 KT가 함께 한 심야버스 노선 구성 방식

우선 통화량에 매칭되는 데이터인 개인의 성명은 삭제했다. 그리고 개인정보에 가까운 데이터인 연령대 같은 경우 특정 지역(1km 헥사곤형태)으로 가공 및 통계 처리를 했다. 이는 개인을 식별하는 분석이 아니기 때문에 통계처리로 충분했다. 또한, 청구지 주소의 경우 우편번호 단위를 헥사곤에 매핑 후 지역별 통계로 처리했기 때문에 개인의 구체적인 집 위치를 파악하지 않았다.

이런 과정을 통해 설정된 심야버스 노선은 효율적인 노선 서비스의 제공으로 서울 시민들에게 심야 최적의 교통서비스를 제공할 수 있었으며, 상대적으로 소득이 낮은 심야 경제 활동인구에게 경제적으로 기여하는 계기가 됐다. 그리고 범죄에 취약한 심야 및 새벽시간대 심야버스 운행으로 범죄 예방 효과도 부가적으로 거둘 수 있었다.

  

저작권자 © 컴퓨터월드 무단전재 및 재배포 금지