플리토 강동한 최고기술책임자(CTO)

 플리토 강동한 최고기술책임자(CTO)
플리토 강동한 최고기술책임자(CTO)

[컴퓨터월드] 언어 데이터 및 전문번역 서비스 기업 플리토(대표 이정수)는 ‘언어 제약 없이 자유롭게 소통하는 세상을 만들겠다’는 목표로 비즈니스를 영위하고 있는 기업이다. 플리토는 언어 장벽을 없애기 위해 아마존웹서비스(AWS)의 클라우드 기반 앱과 웹을 통해 다양한 언어 관련 서비스를 제공하고 있다. 플리토의 비즈니스 핵심은 언어 데이터를 수집한 후 AI 학습 및 전문번역가의 검수를 통해 고품질의 데이터를 구축하는 것이다. 플리토는 이 같은 일련의 데이터 비즈니스 프로세스를 AWS의 클라우드에서 구현했다. 플리토의 강동한 최고기술책임자(CTO)를 만나 플리토 서비스, AWS와의 협력 체계, 이용 중인 AWS 서비스 등에 대해 들어봤다.


비즈니스 첫 출발은 ‘AWS’

플리토는 ‘언어의 장벽을 넘어 세상을 자유롭게 하는 기업’을 목표로 2012년 8월 설립됐다. 이 회사는 언어 인공지능(AI) 개발과 학습용 데이터 생성 및 영상, 웹툰 및 웹소설 번역, 기업 전문 번역 등 언어와 관련된 다양한 맞춤 서비스를 제공하고 있다. 강동한 CTO는 SK텔레콤 재직 당시 이정수 대표, 김진구 CDO와 함께 사내 벤처 프로그램에 참여했으며, 이후 의기투합해 2012년 플리토를 설립했다.

플리토 창립 멤버인 강동한 CTO는 “창립 멤버는 대표를 포함해 총 3명이다. 대표를 제외한 2명은 외국어에 대한 스트레스가 상당했다. 다국어 커뮤니티, 언어 서비스 등 비즈니스 모델을 고민한 이유도 여기에 있었다. 언어 데이터를 대량으로 수집해두면 데이터를 바탕으로 좋은 언어 서비스를 개발할 수 있을 것으로 기대했다”면서, “처음에는 소셜 네트워크 서비스(SNS) 번역 작업을 진행하며 언어 데이터를 수집했다. 당시 AI에 대한 관심도 적었고, 수요도 없었기 때문에 비즈니스는 기대에 미치지 못했다. 하지만 집단 지성 번역을 통해 사세를 확대했고, AI가 IT 트렌드의 주류로 자리 잡으면서 사업이 활기를 띄게 됐다”고 창립 당시를 술회했다.

플리토는 처음 서비스를 개발할 당시 국내 유명 호스팅 업체인 A 기업의 인프라를 이용하려 했다. 하지만 전 세계에서 발생하는 다양한 외국어 데이터를 수집하고 활용해야 한다는 점 때문에 국내 기업의 호스팅 서비스가 적합한가에 대한 의문이 들었다.

강동한 CTO는 글로벌 데이터 수집에 용이하고 다양한 개발 서비스를 이용할 수 있는 AWS의 클라우드로 눈을 돌렸다. 강 CTO는 AWS 계정을 만든 후 싱가포르 리전에서 ‘아마존 EC2’ 서비스를 이용했다. 당시 서버 3대 분량의 EC2 서비스를 이용해 애플리케이션을 개발했다.

그는 “플리토 창립 이전 SK텔레콤을 비롯해 중소기업에서도 근무했었다. SK텔레콤에 근무할 때는 HPE, IBM 등의 HW 장비를 이용했다. 하지만 중소기업에 근무할 때는 용산전자상가를 찾아가 조립 서버를 구매해야만 했다. 이러한 경험을 바탕으로 플리토 창립 이후 처음 애플리케이션을 개발할 때 초기 비용 효율성을 중시했다”면서 클라우드 도입 이유를 덧붙였다.

플리토는 처음 비즈니스를 시작할 때 영국의 테크스타 런던 인큐베이팅(TechStars London Incubating) 프로그램에 아시아 기업 최초로 선정되며 8억 원의 시드 투자를 받았다. 또 AWS 클라우드를 이용할 수 있는 크레딧 7,000달러도 함께 받으며, 다양한 AWS 클라우드를 이용할 수 있었다. 플리토로서는 큰 행운이었다.

현재 플리토는 ‘AI 번역’, ‘아케이드’, ‘집단지성 번역’, ‘전문 번역’, ‘1:1 전문가 매칭’, ‘플레이스’ 등 다양한 기능을 추가하며 비즈니스를 확대해 나가고 있다.


언어 AI, 언어 데이터, 전문 번역 등 3가지 비즈니스 주력

플리토는 ‘플리토’라는 플랫폼을 기반으로 △언어 인공지능(API 솔루션) △언어 데이터 △전문 번역 등 3가지 비즈니스에 집중하고 있다.

먼저 언어 인공지능 측면에서 플리토는 인공지능 번역, 집단지성 번역, 기업특화 번역 등 3가지 API를 내세우고 있다. 인공지능 번역은 플리토가 자체 개발한 인공신경망 기술을 활용해 2,000만 문장 이상 학습한 AI 번역 API다. 주로 기업 솔루션 내에서 번역문을 요청할 경우 플리토 AI 번역 엔진이 API 형태로 번역문을 실시간 전송한다.

다음은 집단지성 번역 API 서비스다. 이 서비스는 AI가 제대로 번역하지 못하는 문장을 전 세계 언어 전문가들에게 요청하고, 상황에 맞는 자연스러운 번역 결과를 호출할 수 있다. AI 번역 엔진이 번역한 결과를 고객사가 확인하고, 집단지성 플랫폼에 수정요청을 보낸 후 고객사 서버로 번역물을 송출한다.

기업특화 번역 API 서비스는 기업 전용 서버에 맞춤형 AI 번역 엔진을 구성하는 방식으로 이루어진다.

기업 및 업계 특화 용어집을 학습한 후 기업 서버에 구성된 AI 번역 엔진이 플리토 플랫폼과 통신하며 정제된 데이터를 실시간으로 받는다. AI 번역 시 완벽하지 않은 문장은 집단지성을 통해 수정된 데이터로 재학습할 수 있다. 클라우드 개방형 API와 연동하거나 기업 자체 온프레미스에 번역 엔진을 구축하는 등 2가지 방식으로 제공된다.

아울러 플리토는 언어 데이터 비즈니스에도 주력하고 있다. 플리토는 한국어는 물론 전 세계 다양한 언어 데이터를 취급한다. 강동한 CTO는 “천만 명 이상이 사용하는 플리토 플랫폼에서 매일 수많은 고품질의 학습용 언어 데이터가 생성된다. 이렇게 생성된 언어 데이터는 고객사에 설치된 AI 엔진 고도화에 적용되거나 특정 분야의 언어 데이터 구축 프로젝트에 적용하고 있다”면서, “다국어 병렬 코퍼스(말뭉치), 다국어 음성 데이터, 이미지 데이터 등을 다루고 있다. 이 같은 데이터를 고객사에 판매하기도 한다. 3단계의 집단지성 검수 및 내부 전문가 추가 검수 작업을 통해 언어 데이터의 품질이 높으며 저작권에도 문제가 없다”고 설명했다.

이어 그는 “플리토는 ‘플리토 플레이스’와 ‘아케이드’를 통해 언어 데이터를 수집하고 있다. 플리토 플레이스는 QR 코드를 활용한 다국어 번역 서비스다. OCR 기술을 활용해 다국어 메뉴판, 안내판 이미지에서 텍스트를 추출한 후 집단지성을 통해 정제 과정을 거쳐 고품질의 AI 학습용 데이터로 변환된다. 아케이드는 집단지성을 통한 언어 퀴즈형 리워드 서비스다. 크라우드소싱으로 언어 관련 데이터를 수집‧가공하며 번역, 교정, 받아쓰기 등 언어와 관련된 다양한 퀴즈를 푼 사용자에게는 보상으로 플리토 포인트를 지급하고, 지급된 포인트는 플리토 스토어 내에서 현금처럼 사용할 수 있다. 플리토는 해당 데이터를 정제해 AI 학습용 데이터로 활용하고 있다”고 부연했다.

 플리토의 비즈니스 체인 (출처: 플리토)
플리토의 비즈니스 체인 (출처: 플리토)

한편, 플리토는 기업 문서, 게임, 영상, 웹툰, 웹소설 등 다양한 분야의 전문 번역 서비스도 제공하고 있다. 플리토 전문번역실에는 전문번역가 뿐만 아니라, 번역 프로젝트 전반을 관리하는 프로젝트 매니저, 식자작업자 등이 상주하고 있으며, ‘플리토 엔터프라이즈’라는 이름의 고객 전용 번역 관리 플랫폼을 운영한다.

 플리토 강동한 CTO는 “스타트업은 비즈니스 집중력이 중요하다. 비용 절감을 위해 기존 서비스를 고수하기보다, 혁신적인 클라우드 서비스와 관리 서비스를 적극적으로 도입해 비즈니스에 집중할 수 있는 환경을 만들어야 한다”고 조언했다.
플리토 강동한 CTO는 “스타트업은 비즈니스 집중력이 중요하다. 비용 절감을 위해 기존 서비스를 고수하기보다, 혁신적인 클라우드 서비스와 관리 서비스를 적극적으로 도입해 비즈니스에 집중할 수 있는 환경을 만들어야 한다”고 조언했다.

다음은 플리토 강동한 CTO와의 대담을 일문일답 형식으로 구성한 것이다.


“다양한 AWS 클라우드 서비스로 비즈니스 혁신 꾀한다”

Q. AWS의 어떠한 클라우드 서비스를 이용하고 있는가.
A. 플리토의 API 서비스, 추가 서비스, 보안 및 시스템 엔지니어링, 관리 등 크게 4가지 부문에서 AWS 클라우드 서비스를 이용하고 있다.

먼저 API 서비스와 관련, 지역에 구분을 두지 않고 전 세계 어디서나 균등하게 서비스를 제공해야 하며, 갑작스러운 트래픽 변화에도 쉽게 대응해야 한다. 이에 ‘AWS 람다(Lambda)’와 ‘아마존 다이나모(Amazon Dynamo) DB 글로벌 테이블’을 이용하고 있다. 아울러 최근 추가하고 있는 기능을 위해서는 ‘아마존 EKS(Amazon Elastic Kubernetes Service)’를 이용하고 있다. 쿠버네티스를 기반으로 플리토 플랫폼에 기능들을 추가해 효율적으로 리소스를 관리하고, 유연하게 대응할 수 있는 환경을 구성했다.

가장 중요한 보안 및 시스템 엔지니어링 부문에도 AWS의 클라우드를 이용하고 있다. ‘AWS WAF v2’, ‘가드듀티(GuardDuty)’, ‘데브옵스구루(DevOpsGuru)’ 등이 대표적이다. 마지막으로 관리 업무를 줄이고 핵심 비즈니스 개발에 집중하기 위해 AWS의 관리형 서비스도 이용 중이다. 대표적으로 ‘아마존 RDS’, ‘아마존 엘라스틱캐시(Amazon ElastiCache)’, ‘AWS 오픈서치(Open Search)’, ‘AWS 도큐먼트DB(DocumentDB)’ 등이다.

Q. 플리토 플랫폼에 대해 MSA화를 진행 중이라고 들었다.
A. 그렇다. 최근 추가되는 기능과 서비스는 물론 기존 기능까지 마이크로서비스 아키텍처(MSA)화하고 있다. 플리토는 2017년에 쿠버네티스(Kubernetes)를 도입하면서 도메인을 마이크로서비스 단위로 분리하는 작업을 진행했다. 기존 모놀리식(Monolithic) 아키텍처 형태에서는 배포에 큰 부담이 있었고, 장애가 발생할 경우 서비스를 중단해야만 했다.

대부분의 스타트업들이 그렇듯 MSA 전문가가 없어 처음에는 걱정이 앞섰다. 때문에 기존의 서비스와 기능을 MSA화 하기보다는 새로 추가하는 기능을 중심으로 MSA화했다. 이 과정에서 엔지니어들이 MSA화 작업에 익숙해졌고, 기존 서비스와 기능의 MSA 작업도 가능하게 됐다. 물론 현재 MSA 과정이 6년차에 접어든 상황에서 MSA로 100% 전환했다고 평가하지는 못하지만, 꾸준하게 MSA 기반 플랫폼으로 진화하려 노력 중이다.

Q. 쿠버네티스가 부상하기 전부터 이용을 했는데, 어려운 점은 없었는가.
A, 물론 어려운 점이 있었다. 플리토는 K-옵스(kOps)라고 하는 컨테이너 관리 프로젝트가 등장한 2017년부터 AWS 클라우드 위에 쿠버네티스를 직접 설치해 이용했다. K-옵스는 쿠버네티스를 AWS 클라우드에서 클러스터를 생성하고 EC2 노드 개수 증감을 관리할 수 있는 오픈소스다. 우리는 AWS EC2 위에 K-옵스를 설치해 쿠버네티스를 이용했다.

힘든 작업이 많았다. 쿠버네티스 업데이트에 대한 공부는 물론 업데이트에 따른 타 서비스와의 호환성 연계 작업 등 관리에 대한 이슈가 컸다. 이러한 상황에서 AWS가 당시 리인벤트를 통해 아마존 EKS를 공개했다. 우리는 아마존 EKS를 적극적으로 도입해 이용했다. 아마존 EKS는 콘솔에서 업데이트만 선택하면 손쉽게 패치를 적용할 수 있다. 물론 일부 노드에 대한 버전업 작업은 수행해야 하지만, 그래도 K-옵스에 비해 1/10 수준으로 작업량이 줄었다.

또 해당 서비스를 도입하는 과정에서 AWS코리아 측에서 1~2일 워크숍 등 스터디 세션도 제공해줬다. 덕분에 서비스에 대한 역량도 확보할 수 있었다. 새로 플랫폼에 추가하는 서비스의 경우 쿠버네티스를 기반으로 개발, 배포, 관리하고 있으며, 모니터링을 위한 서비스도 쿠버네티스로 이용하고 있다.

Q. 클라우드 비용 효율에 관심이 많다. 추천하는 방식이 있다면.
A. 전 세계적으로 경제가 위축되면서 클라우드를 비롯한 IT 비용 절감에 관심이 집중되고 있다. 이와 관련해 플리토가 직접 경험하며 쌓아온 팁이 있다. 바로 AWS가 보유하고 있는 리전을 적절히 이용하는 것이다. 서비스마다 비용이 다르지만 통상 클라우드 서비스 중 가장 많은 비용을 차지하는 부분은 EC2 GPU 인스턴스다.

플리토를 예로 들겠다. 플리토는 AI 모델 정확도를 높일 수 있는 양질의 데이터 수집이 중요하다. 데이터의 양이 늘어날수록 AI 모델을 훈련할 때 들어가는 GPU 인스턴스 비용이 크게 늘어난다. 플리토는 서울 리전보다 저렴한 미국 서부 오레곤 리전을 이용하고 있다. 물론 실시간 작업이 필요할 경우 이 방법을 추천하지는 않는다. 거리상 네트워크 레이턴시가 존재하기 때문이다. 오레곤 리전 외에 미국 동부의 노스 버지니아도 비용이 저렴한 것으로 알려져 있다.

이 외에 예약 인스턴스(RI)를 활용하거나 세이빙 플랜(SP)을 통해 클라우드 이용 약정을 걸고 요금을 할일 받을 수 있다. 전문 MSP의 도움을 받는 것도 비용을 절감할 수 있는 좋은 방법이다. 우리는 메가존클라우드의 도움을 받아 비용을 절감하고 있다.

Q. 향후 도입을 고려 중이거나 검토하고 있는 AWS의 서비스는 무엇이 있는가.
A. 최근 인공지능(AI) 부문에서 화두로 떠오른 챗GPT와 같은 생성형 AI 서비스 도입을 고려하고 있다. AWS는 최근 ‘베드락(Bedrock)’이라는 서비스를 출시했다. 베드락은 기업들이 아마존의 파운데이션(기반) 모델을 활용해 생성 AI 애플리케이션(앱)을 구축할 수 있는 서비스다. 이를 통해 아마존의 자체 초거대언어모델(LLM) ‘타이탄(Titan) FM’을 비롯해 AI21 랩스(Labs), 앤트로픽(Anthropic), 스태빌리티(Stability) AI 등을 사용할 수 있다.


“AWS로 핵심 비즈니스에 집중할 수 있는 환경 마련”

Q. AWS의 클라우드 서비스가 비즈니스에 어떠한 가치를 줬는가.
A. 플리토의 비즈니스에 AWS의 클라우드 서비스는 복잡한 일을 대신해 주는 조력자가 됐다. 스타트업의 특성상 비즈니스 핵심에 집중해야 하지만, 여러 환경적인 제약이 존재한다. 그 중 가장 큰 이슈는 바로 인력이다.

플리토는 데이터 기반의 비즈니스를 하고 있다. 때문에 DBA(DB 관리자)와 데이터 사이언티스트가 비즈니스에 매우 중요한 역할을 한다. 기업이 이러한 인력을 보유할 수 있다면 좋겠지만, 그렇게 하기 어려운 것이 스타트업의 현실이다. 우리는 이러한 문제를 AWS의 완전 관리형 서비스로 해결했다. DBA의 DB 이중화, 백업, 성능 분석 등 업무를 아마존 RDS로 대체한 것이다.

특히 보안 관련 전문가 확보도 매우 어려운 일이다. 플리토는 보안 전문가가 해야 할 업무를 AWS의 클라우드 서비스를 통해 처리하고 있다. 우리는 AWS의 WAF v2를 이용하고 있다. 한 사건을 소개한다면, 플리토의 플랫폼에는 리워드를 제공하는 기능이 있다. 이 서비스에 대해 특정 국가에서 해킹시도가 많다. 그러던 중 회원 아이디와 패스워드가 담긴 DB를 불법적으로 구매해 침투하는 방식의 브루트 포스(Brute Force)라는 공격이 있었다. 쉽게 말해 네 자리 자물쇠를 일의 자리부터 천의 자리까지 하나하나 다 맞춰보는 방식이다. 플리토의 리워드 서비스에 대해 AWS의 보안 서비스로 공격 IP를 확인한 결과 대구의 한 제조업의 서버에 문제가 있었다. 제조 기업에 서버가 해킹됐다는 점을 알렸다. 실제 해당 전산실에 오래된 서버가 있었고 그 서버의 포트를 통해 공격이 발생했었다.

이처럼 보안 전문가나 DBA가 해야할 작업을 AWS의 클라우드 서비스로 대체함으로써 애플리케이션 개발과 관리에 더 집중할 수 있었다.

Q. AWS와의 협업은.
A. AWS로부터 기술, 비용, 교육 등 부문에서 도움을 받고 있다. AWS코리아의 어카운트 매니저, 솔루션즈 아키텍트들로부터 기술, 비용과 관련해 많은 조언을 받고 있다. 새로운 서비스나 플랫폼에 적용하면 효율성이 높아질 것 같은 서비스들을 제안해주곤 한다. 아울러 플리토 역시 AWS의 다양한 서비스를 이용해보고 피드백을 준다. AWS의 서비스 개발 방향이 고객사의 피드백을 반영하는 것인 만큼 AWS는 피드백을 귀담아 듣는다.

최근에는 ‘AWS 베드락’이라는 생성형 AI 서비스를 써보고 싶다는 의사를 전달하기도 했다. 또한 AWS는 고객사가 클라우드를 잘 이용할 수 있도록 많은 정기‧비정기 교육 프로그램들도 제공하고 있다. 우리 회사로 솔루션즈 아키텍트가 찾아와 해당 서비스와 아키텍처 교육부터 비즈니스에 대한 부분까지도 세심하게 신경 써주고 있다.

Q. 데이터 비즈니스를 하려는 스타트업에게 조언한다면.
A. 데이터 기반 비즈니스를 위해선 먼저 양질의 데이터를 확보하는 것이 핵심이다. 또 확보한 데이터를 기반으로 클라우드 위에서 데이터 비즈니스 프로세스를 만들어야 한다. AI 모델의 완성도를 점수로 평가할 경우, 60~70점 수준의 AI 모델은 인터넷 상에서 데이터를 수집하거나 공개된 모델을 이용해 쉽게 도달할 수 있다. 하지만 그 다음부터는 데이터가 아무리 고품질일지라도 1점 올리기가 쉽지 않다. 데이터를 정제하기 위해선 데이터 사이언티스트가 수행할 수 있는 작업이 요구된다. 그 다음에는 AI 모델을 훈련하기 위해 필요한 인프라도 갖춰야 한다. 데이터 비즈니스를 위해서는 엄청난 비용과 노력이 요구된다는 의미이다.

비용 효율성을 높이고 개발 공수를 줄이기 위해 클라우드를 이용하길 권장한다. CSP들이 제공하는 클라우드 서비스는 데이터 전문가의 작업을 대체할 수 있어 개발에 필요한 노력을 줄일 수 있다. AI 모델 훈련에 필요한 인프라도 필요할 때만 이용할 수 있어 비용 효율적이다. 이처럼 클라우드 위에서 AI 모델 훈련을 수행하고 비즈니스를 만들 수 있는 일련의 프로세스를 빠르게 완성하고 비즈니스에 몰두해야 한다. 그래야 생존할 수 있다.

저작권자 © 컴퓨터월드 무단전재 및 재배포 금지