조성배 연세대학교 컴퓨터과학과 교수 / 한국BI데이터마이닝학회 회장

[컴퓨터월드] 이세돌과 알파고의 바둑 대국으로 인공지능에 대한 관심의 수위가 나날이 높아지고 있다. 정부는 이 분야에 1조 원을 투자해 기술 개발을 하겠다고 나섰고, 민간 주도의 기업형 지능정보기술연구소도 설립한다고 한다. 삼성전자, LG전자 등의 대기업들도 이 기술 개발을 위해 수십억에서 수천억 원까지 투자한다고 밝히고 있다.

그러나 아쉬운 점은 인공지능에 대한 ‘오해와 편견’이라는 사실이다. 인공지능이 마치 신세계를 여는 양 개발 투자 프로젝트를 급조해 내놓는가 하면, 일부 인공지능 관련 교수들은 모든 것을 다 알고 있는 것처럼 의견을 내놓고 있기 때문이다.

사실 인공지능은 50여년 전부터 시작됐고, 관심을 갖고 미래 산업의 주요 아이템 가운데 하나로 지목된 것은 20여년 전이다. 이미 인공지능 기술은 다양한 분야에서 사용되고 있기도 하다. 주차장에서 카메라로 번호판을 인식해 주차요금을 계산하는 것이나 OMR 채점, 그리고 게임들에는 거의 인공지능 기술이 조금씩은 다 적용되고 있다.

인공지능에 대한 높은 관심은 SW 산업 발전을 통한 미래 일자리 창출, 더 나아가 국가 경제 발전에 크게 기여할 수 있다는 면에서 긍정적임에는 분명하다. 다만 정부를 중심으로 한 대기업들의 장기 투자계획이 충분한 시간을 갖고 심도 있게 검토했느냐? 라는 의문이 제기되고 있다. 사뭇 정치적인 논리에 빠져 ‘자기 밥 그릇 챙기기’에만 급급할 가능성이 높다는 우려의 목소리도 높기 때문이다.

올 초 다보스 포럼에서는 4차 산업혁명을 예고했다. 즉 미래 산업은 인공지능, 로봇공학, 빅데이터, 사물인터넷, 무인자동차 등이 주도할 것이라는 예고다. 이런 시대를 대비해 다소 늦었지만 지금부터라도 제대로 된 장기적인 계획을 세워 차분히, 그리고 철저히 준비해야만 글로벌 경쟁 환경에서 살아남을 수 있다는 게 전문가들의 지적이다.

본지는 이에 따라 국내 최고의 인공지능 전문 교수로 평가받고 있고, 인공지능의 한 뿌리라고 할 수 있는 BI, 빅데이터 등의 기술 발전을 위한 모임인 한국BI데이터마이닝학회 회장을 맡고 있는 연세대학교 컴퓨터과학과 조성배(51세) 교수를 만나 어떻게 하면 우리나라가 4차 산업혁명의 중심 국가 대열에 오를 수 있는지 들어봤다.

▲ 조성배 연세대학교 컴퓨터과학과 교수 / 한국BI데이터마이닝학회 회장

“인공지능이 생산성이나 효율성을 높이는데도 쓰이겠지만, 현재 사회가 인간개체들만으로는 건강하게 안 돌아가는 것 같으므로 이런 부분에도 필연적으로 쓰일 것이다. 앞으로는 사람끼리 인터랙션 하는 것처럼 그 속에 자연스럽게 인공지능이 낄 수도 있다. 독거노인 등의 외로움을 완화시켜주는 용도를 예로 들 수 있고, 향후 SF영화 같은 광경이 펼쳐질지도 모르겠다. 아직은 인공지능에 대해 이질감을 느끼겠지만 향후에는 같이 살게 될 것이며, 인공지능을 받아들이는 건 철학의 차이라고 본다.”

조성배 연세대학교 컴퓨터과학과 교수이자 한국BI데이터마이닝학회장은 인공지능은 인간 생활 속의 한 부분으로 자연스럽게 자리 잡게 될 것이라고 확신했다. 조성배 교수는 국내 최고의 인공지능 교수 가운데 한 사람으로 평가받고 있다. 그는 KAIST에서 인공지능(신경망의 현실적인 적용방안)으로 박사학위를 2년 만에 땄고(1993년), 일본 ATR 인간정보통신연구소 연구원으로 재임(1993년~1995년)한 바 있으며, 현재 연세대학교 인지과학연구소 소장을 역임하고 있다.

조 교수는 특히 패턴인식과 인공지능 분야에서 실제 문제 해결을 통해 SCI(Science Citation Index, 과학기술논문 인용색인) 등재 논문지에 200여 편을 포함한 1,000편 이상의 논문을 발표했다. 조 교수에게 ‘인공지능의 전설’이라는 별명이 붙은 이유이기도 하다. 조 교수는 현재 인간의 추론 학습 기능을 모방한 데이터마이닝 기술과 이에 기반 한 모바일 환경에서의 상황인식 및 개인화 서비스 개발에 집중하고 있다.

‘SW 인식’을 바꿔야 인공지능 성공

- 인공지능은 사실 20년여 전부터 관심을 가질 만한 아이템으로 지목된 바 있다. 그러나 그 때는 별 관심을 보이지 않다가 이제야 마치 ‘큰 일’이라도 난 것처럼 호들갑이다. 그것은 그만큼 정부를 비롯한 관련 기업들이 미래를 준비하지 못하고 있음을 드러낸 것으로 판단된다. 물론 이제라도 관심을 갖게 됐다는 것은 다행이라고 생각하지만, 앞으로가 문제다. 어떻게 준비하는 게 좋은가.

▶ 화제가 된 것 자체가 좀 뜻밖이다. 인공지능이 이렇게 높은 관심을 받을 줄은 몰랐다. 알파고 이벤트 이후 붕 떠있는 느낌도 들고, 신기하기도 하다. 어떤 상황이든 인공지능이 주목을 받게 된 것은 좋은 전기가 될 수 있다고 본다. 다소 늦은 감이 없지는 않지만 지금부터라도 기획을 잘해서 목표치나 지향점을 잘 잡고 체계적으로 집중해 들어간다면 그렇게 뒤처지지는 않는다고 생각한다. 미국과는 좀 다른 측면도 있다. 거기는 인재도 많고 돈도 많으니 버려도 될 여지가 있지만 우리나라는 아니기 때문이다.

정부에서 인공지능에 1조 투자한다는데, 나쁠 것은 없다. 그러나 그 이전에 기본적으로 SW에 대한 인식을 바꿔야만 한다. 즉 SW를 경시하지 말아야 한다는 것이다. 또 1조 투자한다니까 인공지능이 아닌 것들도 포장되는 측면도 없지 않다. 요는 핵심적인 쪽부터 확실하게 짚고 집중할 수 있었으면 좋겠다. 의욕적으로 시작했는데 정작 관계없는 쪽으로 흘러가면 나중에 남는 게 없을 수 있기 때문이다.

개인적으로는 인지과학이나 뇌과학 이런 것들이 먼 미래에 새로운 것을 찾는 데는 몰라도 현재 응용에는 도움이 전혀 안 된다고 본다. 인공지능을 만들어본 적도 없는데 자기 신념 갖고 논하는 사람들도 있다. 우리나라 상황은 실용화에 집중하는 게 더 좋을 것 같다.

문제는 1조로 정부에서 원하는 그림을 그릴 수 있느냐가 관건인데, 여기서 우려되는 부분은 인공지능이라고 분류된 것들 중에 ‘이건 아닌데?’라는 의문이 드는 것도 있다. 그렇다고 핵심적인 것들만 한다면 이것만으로 뭘 할 수 있을까? 라는 생각도 든다. 사실 그 1조도 새로 나온 게 아니라고 본다. 기존에 있던 다른 데서 돈을 돌려 나온 것으로 알고 있다. 다시 말해 이미 하고 있던 것들에 인공지능 이름만 씌울 가능성이 높다는 것이다.

물론 기존에 인공지능을 연구하던 사람들 중 재원이 부족한 이들을 발굴해서 잘 도와줘야 한다. 정부 입장에서 지원이라 하면 슈퍼컴퓨터 같은 건 따로 갖고 있기 힘드니 이런 건 정부에서 지원해줄 필요가 있고. 여담이지만 최근에 나는 딥러닝 연구를 많이 하는데, 이것은 하드웨어가 많이 필요하다. GPU서버 1대에 1천만 원 정도 하는 등 연구에 많은 돈이 든다.

또 하나 중요한 건 교육이다. 현재 한국에는 인공지능을 전공한 인물들이 별로 없다. 컴퓨터 전공 학생들도 한 과목 정도를 듣는 정도다. 60~70명 학급에 15명 정도만이 수강을 하고 있을 뿐이다. 특히 인공지능 개념을 이해하고 오픈소스 SW도 쓸 줄 알아야 하는데, 이런 부분은 너무 부족하다.

대표 브랜드 상품 위주의 선택과 집중을

정부에서 제대로 지원하려면 대표적인 브랜드 상품을 개발해 낼 수 있는 플래그십 사업이 필요하다고 본다. 백화점 식으로 나열되는 건 적절치 않다고 본다. 자원이나 자금이 풍부한 미국과는 달리 우리나라는 어떤 특별한 대표적인 브랜드에 걸어야 되지 않을까 생각한다.

예를 들어 IBM 왓슨의 인공지능과 구글의 인공지능은 완전 다른 얘기다. IBM은 지식 기반 어프로치(접근)고, 구글은 데이터 기반 어프로치이다. 전통 AI는 지식 기반으로 데이터를 저장하는데 사람이 기억하는 것처럼 논리적으로 추론하고 결과를 내는 것이다. IBM이 이런 어프로치고, 왓슨은 그 사이즈를 키운 것이다. 이건 심볼릭하다고 얘기되는데 심볼은 기호를 갖고 데이터를 집어넣는 방식이다. 그런데 구글이 하는 머신러닝은 데이터, 즉 수치를 기반으로 하는 것이라 다르다.

그래서 IBM은 전문가 시스템 같은 것을 만들어 비즈니스를 해왔고, 왓슨은 그걸 일반 상식까지 넓힌 거다. 퀴즈를 푸는 게 마지막 골이 아니라, 그만큼 방대한 양의 지식을 저장하고 Q&A를 가능케 하는 인공지능 기술이 있다는 걸 보여주려 만든 것이다. 왓슨도 세세하게는 머신러닝도 쓰는데 큰 줄기는 이것이다. 반면 구글은 사람의 개입을 최소화하는 자동화된 방법을 추구한다. 기업 자체가 데이터들 속에서 적절한 것 찾아서 보여주는 검색기술에서 출발했기 때문이다. 요즘 얘기하는 머신러닝이나 딥러닝은 심볼릭 한 게 아니고, 이렇게 데이터를 일반화해 처리하는 것에 가깝다.

그래서 이런 두 가지 중에 어떤 어프로치를 우리가 택할지 먼저 정해야 한다. 이것저것 다 늘어놓기 보다는 판을 읽고 필요로 하는 목표치와 방법을 선택해 집중적으로 진행하는 게 맞지 않을까 생각한다. 한 마디로 미래 설계가 필요하다는 것이다. 현재 제시되고 있는 여러 아이디어나 의견들을 어떻게 조율해 기획하고 설계를 하느냐가 가장 중요한 관건이라고 할 수 있다.

우려되는 건 자기 밥그릇 챙기기다. 이런 것 때문에 1조 투자했는데 흐지부지 될 수도 있다는 점을 경계해야만 한다고 본다. 사실 어느 쪽이든 추진 방향에 정답이란 건 없다. 그러나 원론적으로는 인공지능을 연구하기 위한 틀이 ▲인프라 ▲인력 ▲연구개발 등 3가지라고 봤을 때 연구개발은 나눠주기 식보다는 그림을 그려 지향점을 향해 갈 수 있도록 해야만 한다고 본다.

요즘 금융 분야에서도 로보어드바이저 같은 것 쓰이지 않나. 원래 대량의 자료를 뒤지는 건 기계가 인간보다 잘한다. 어느 순간 데이터가 엄청 많아지다 보니 사람이 하면 오류가 날 가능성이 높다. 이번에 알파고가 보여준 것도 그런 측면이다. 사람의 직관이 최고봉이라는데 데이터만 많으면 객관화해서 할 수 있다는 점.

판례도 법률사무소 사람들이 다 찾고 있는데 왓슨이 이런 걸 더 잘할 수도 있는 것이고, 기존에 있는 걸 토대로 결과만 내주는 것이라면 인공지능이 더 잘 할 수밖에 없다. 의료도 여러 새로운 정보들을 넣어놔서 인공지능이 객관적인 자료를 근거로 내놓으면 판단은 사람이 하는 식이 될 수 있다. 인공지능에 일방적으로 의존하는 건 아니지만 이렇게 도움이 되는 걸 찾으면 정말 많다.

인공지능 이미 생활 속에 많이 적용

- 인공지능이 일상생활에 이미 많이 적용되고 있다는데.

▶ 주차장에서 카메라로 번호판을 인식해 주차요금을 계산해주는 것이나 OMR 채점 등에 인공지능 기술이 적용돼 있다. 게임에는 인공지능이 많든 적든 거의 다 들어가 있다. 기계적으로만 보이면 재미없으니까 사람이 하는 것처럼 만들려면 인공지능 기술을 적용시켜야 한다. 앞으로 패러다임이 바뀌는 게 4차 산업혁명이고 여기에 인공지능이 필요하다. 효율을 높이고, 빅데이터 처리하고, 의사결정 도와야 하는 등등.

최근 인공지능에 따른 일자리 문제로 많이 걱정들을 하는데, 지금 얘기 나오는 그런 것들은 굉장히 추상적인 이야기들이 나오고 있는 거다. 인공지능이 더 잘하면 내 일자리가 없어지는 게 아니냐고 묻는다면, 더 좋은 새로운 기술이 나와 기존을 대체하는 건 산업혁명 때부터 계속돼온 일이다. 준비하고 있지 않으면 타격을 받을 수 있겠지만, 꼭 그렇게 된다고 마냥 잃기만 하는 게 아니라 거기에 적응도 되고 또 그에 따라 새로운 일자리도 만들어지고 그렇게 흘러왔다. 지금은 그래서 5~10년 후를 내다보고 재교육을 할 필요성이 있다고 본다.

- 우리나라 인공지능 기술 수준은 어느 정도라고 보는가.

▶ 사실 어려운 얘기다. 흔히 언론에 나오는 식으로 선진국 대비 몇 점이고 몇 년 늦춰줬다 라는 평가는 신뢰성이 떨어진다. 우리나라의 인공지능 기술이 선진국에 비해 뒤처진 건 사실이다. 그러나 머리가 나빠서 실력이 없는 게 아니라 그간 주목을 못 받아 저변 확대가 잘 안 돼 많이 못 했기 때문이다. 또 인공지능의 핵심 기술이 블랙박스처럼 감춰진 게 아니라 주로 오픈소스로 개방돼 있는 게 많다. 이 분야 주요 인물들이 오픈소스 개방을 주도하고 있는 측면이 있다. 그래서 실제로 해보면 어떤 면에서는 우리가 더 잘 할 수 있는 기술도 적지 않다.

IBM 왓슨처럼 장학퀴즈 나가는 건 할 수 있고 그 정도 기술은 갖고 있지만, 이건 빙산의 일각이고 물밑에 갖춰야 할 기술이 더 많은데 이를 위한 인력도 부족하다. 보이는 기술은 되는데 저변 확대가 안 돼 있고, 원천기술이 없다. 한마디로 내공이 없는 것이다. 인공지능 내에도 여러 가지 기술이 있고, 여러 기초과학과 연계되는 부분도 많다.

다는 못하니까 기본이 되는 인프라와 인재 양성은 하되, 나머지는 선별적으로 집중하는 게 낫지 않을까 생각한다. 원천기술을 확보해 기업화하고 부가가치나 삶의 질을 높일 수 있는 것부터 해야만 한다. 일단 노하우나 경험이 있어야 IBM이나 구글처럼 할 수 있는데, 이번 알파고를 계기로 좀 따라잡을 수 있었으면 좋겠다.

머신러닝, 딥러닝, 빅데이터, BI는 인공지능과 같은 뿌리

- 인공지능, 머신러닝, 딥러닝, 빅데이터, BI 간의 상호 연계성과 차이점이라면.

▶ 유기적인 관계다. 인공지능은 지능의 본질을 탐구해 인공으로 만드는 학문이다. 지능이 뭔지 모르는 게 문제인데, 그 방법 중에 크게는 지식 기반 방법과 데이터 기반 방법으로 나뉜다. 지식 기반으로 만드는 건 일종의 흉내 내기로, 사전에 결과가 도출된 지식을 집어넣는 것이다. 이런 건 예외를 잘 처리 못하는 게 문제다. 반면 데이터를 모아놓고 자동적으로 결과를 내보는 게 머신러닝이다.

머신러닝 중 인공신경망이 있는데 이건 마치 뇌의 뉴런처럼 가중합을 비선형으로 출력하는 것으로, 층을 쌓아서 결과를 예측한다. 층간의 연결에 가중치가 있으면 이걸 자동으로 만들어 해결하려는 걸 신경망이라고 한다. 예전에는 층이 많으면 많을수록 좋은 건 알겠는데 여기서 가중치를 조절하는 방법을 못 찾았다. 그런데 최근 딥러닝이 나왔다. 딥러닝이란 용어가 딥과 러닝이니 사람이 하는 것처럼 심층적으로 학습하는 것이라고 착각하기 쉬운데, 이것은 층을 여러 개 쌓아 파라미터를 자동적으로 학습할 수 있게 하는 것이다. 이를 딥하게 할 수 있기 때문에 수천만 건을 넣어도 스스로 학습할 수 있다는 게 장점이다.

빅데이터는 데이터 양 뿐만 아니라 생성되는 주기도 빠르고 또 다양해야 한다. 전통적으로 데이터라 하면 수치 값을 생각하는데, 데이터에는 텍스트도 있고 영상도 있고 이렇게 기존과는 다르게 비정형데이터가 혼재돼 있다. 빅데이터의 속성으로는 ▲볼륨 ▲벨로시티 ▲버라이어티 등을 꼽아 3V라 한다. 이를 분석하기 위한 알고리즘이나 분석방법도 빅데이터라고 한다.

비즈니스 인텔리전스인 BI도 코에 걸면 코걸이 귀에 걸면 귀걸이다. 데이터를 처리하는 걸 기업 경영 도메인에 한정시킨 걸 BI라고 하는 것 같다. 그동안 직관적으로 해왔던 걸 데이터를 처리 분석해 객관적으로 다가가고 혁신에 활용하는 것이라 할 수 있다. 이런 것들의 뿌리가 인공지능이라고 생각한다. 인공지능이 50년 전부터 시작됐다. 데이터마이닝, 머신러닝 등등 다 여기서 나왔다. 데이터마이닝만 해도 머신러닝 기법을 같이 쓰고 일부는 통계학에서 쓰는 기법도 쓴다.

구글과 IBM의 인공지능은 근본이 다르다

- 알파고의 원리는 무엇이고, 새로운 것이 있었다면.

▶ 알파고는 기존 바둑프로그램과 크게 다르지 않다. 게임을 할 때 기본적으로 하는 건 먼저 둘 수 있는 수를 찾을 테고, 바둑은 19x19니까 기계적으로 이렇게 돼있는 것 중에 또 상대방이 둘 수 있는 수와 내가 둘 수 있는 수까지 다 해서 마지막에 내가 이기는 것을 찾는 것이다. 이런 걸 게임트리라고 하며, 행위 하는 공간에서 어떤 곳이 가치를 높이냐 하는 탐색 문제다. 바둑이란 게 다 늘어놓으면 너무 많으니까 그리고 시간 내 둬야 하니 가지 수를 줄이는 방법으로 휴리스틱이란 걸 쓰는데, 이건 우리말로 표현하자면 일종의 통박이다.

또 하다보면 이 수로도 저 수로도 이길 수 있으니 그 중에 랜덤하게 취해도 같다고 해서 방법을 쓰는 게 몬테카를로 서치로, 이는 끝까지 안 가고 이길지 질지 보고 다음 수를 두는 것이다. 이런 것들은 이전에도 다 한 거고, 알파고도 그대로 썼다. 신경망으로 만들고 빠르게 처리하고가 좋은데 이것만 하면 이세돌을 못 이겼을 거다.

중요한 건 프로그램을 카피해 둘이 서로 두게 만들어서 이긴 프로그램에 점수 주고, 진 경우는 체크해서 엄청나게 파라미터 튜닝을 한 거다. 구글도 아마 진다는 생각은 안 했겠지만 이 정도까지는 기대 못했을 거다. 새로운 기술은 없지만 적재적소에 활용한 것이랄까. 굳이 새로운 것을 꼽는다면 딥마인드이다. 즉 그 회사가 잘하는 딥강화 학습, 다시 말해 DQN이라는 것을 잘한다. 작년에 발표한 논문인데 이게 성능향상에 크게 도움을 줬다고 본다.

“인공지능 기술 인력 양성 시급”
 

현재 한국에는 인공지능을 전공한 인물들이 별로 없다. 컴퓨터 전공 학생들도 한 과목 정도를 듣는 정도다. 60~70명 학급에 15명 정도만이 수강을 하고 있을 뿐이다. 특히 인공지능 개념을 이해하고 오픈소스 SW도 쓸 줄 알아야 하는데, 이런 부분은 너무 안 돼 있다. 따라서 인공지능 기술 인력이 시급하다고 조성배 교수는 강조했다.

한편 조성배 교수는 어렸을 때부터 로봇 설계도 같은 것을 갖고 놀았고, 이후 대학교에서부터 지금까지 ‘사람이 어떻게 생각하고, 미래에는 인간이 어떻게 통신할 수 있을까?’라는 의문을 풀기 위해 연구 노력해 왔다고 한다. 그런 노력이 국내 최고의 인공지능 교수로 평가받는 결과를 낳았을 것이라는 게 주변 관계자들의 공통된 지적이다. 인공지능을 중심으로 한 4차 산업혁명이 도래하고 있다. 조 교수를 바라보는 시각이 그 어느 때보다 다른 이유이다.

저작권자 © 컴퓨터월드 무단전재 및 재배포 금지