본지, 5월 21일 서울 양재동 엘타워서 ‘2025 데이터 컨퍼런스’ 개최

본지가 5월 21일 개최한 ‘2025 데이터 컨퍼런스’ 현장
본지가 5월 21일 개최한 ‘2025 데이터 컨퍼런스’ 현장

[컴퓨터월드] 생성형 인공지능(Generative AI)은 이제 유행을 넘어 비즈니스의 중심으로 자리매김하고 있다. 오픈AI의 ‘챗GPT(ChatGPT)’가 촉발한 변화는 자율적 업무 수행이 가능한 ‘AI 에이전트’로까지 이어졌다. 이제 화두는 AI를 얼마나 잘 활용할 수 있는가다.

생성형 AI가 이룩한 혁신, 그 중심에는 데이터가 자리하고 있다. 수집, 저장, 통합, 관리 등 데이터 활용 전 과정이 뒷받침돼야 뛰어난 성능을 갖춘 AI 모델을 개발할 수 있다. AI 기술 발전과 함께 데이터의 중요성이 높아지고 있는 이유다.

이러한 변화 속에서 본지(컴퓨터월드/IT DAILY)는 지난달 21일 서울 서초구 양재동 엘타워에서 “AI를 이용한 데이터 활용 방안”을 주제로 ‘2025 데이터 컨퍼런스’를 개최했다. 행사는 AI로 고도화된 환경에 걸맞은 데이터 운영 전략과 생성형 AI와 관련한 주요 이슈에 대한 인사이트를 찾고, 관련 솔루션의 시연까지 경험해 볼 수 있는 자리로 마련됐다.


“규칙에서 학습으로: 이상치 탐지의 새 패러다임”

한국데이터마이닝학회 회장 김성범 교수
한국데이터마이닝학회 회장 김성범 교수

키노트를 맡은 한국데이터마이닝학회 김성범 회장(고려대학교 산업경영공학과 교수)이 ‘규칙에서 학습으로: 이상치 탐지 새로운 패러다임’을 주제로 연단에 올라 행사의 포문을 열었다. 이상치 데이터는 정상과 다른 새로운 패턴이나 예외가 존재하는 데이터를 뜻한다. 이상치 탐지는 스팸 메일 필터링, 센서를 통한 중장비 이상 감지 등 다양한 산업 분야에서 쓰이고 있다.

이상치를 탐지하는 방법은 크게 △규칙 △밀도 △모델 △재구축 등 네 가지가 있다. 규칙은 전문가가 경험을 토대로 기준을 세우는 방식이며, 밀도는 데이터를 정규분포로 정리한 뒤 정상과 이상을 구분하는 방식이다.

김성범 교수는 “규칙 기반은 데이터 없이도 단순한 예측이 가능하며, 밀도 기반은 전문 지식 없이도 이상 유무를 쉽게 파악할 수 있다는 장점이 있다”고 설명했다.

규칙과 밀도는 전통적 이상치 탐지에 쓰였다. 모델 기반 방법론은 여기서 한 단계 더 나아간 알고리즘이다. 이는 정상 데이터로 학습한 머신러닝 모델을 기반으로 객체별 정상·이상 여부를 판단하는 방법론이다. 선, 원 등으로 정상 데이터의 영역을 구분한 뒤 이를 바탕으로 수식을 세우고 이상치를 탐지한다.

최근에 많이 쓰이는 방법은 ‘재구축 기반’이다. 재구축 기반 모델은 정상 데이터를 압축해 특정 데이터를 추출하고, 이를 다시 정상 형태로 복원하는 학습 과정을 거친다. 그 후 데이터를 투입하고 복원한 결과가 정상 데이터와 얼마나 일치하는지를 기준으로 오차를 계산하며, 이 오차가 클 경우 이상치로 분류한다.

재구축 기반의 대표적 예로 ‘오토인코더(Autoencoder)’가 있다. 오토인코더는 입력 데이터의 특성을 요약하는 인코더(Encoder)와 요약 정보를 복원하는 디코더(Decoder)로 구성된다. 여기서 입력 데이터와 복원 데이터 간 차이를 토대로 이상치를 찾아낼 수 있다. 오토인코더뿐 아니라 생성형 AI의 기반을 이룬 ‘트랜스포머’와 이미지 생성 모델에 쓰이는 적대적 생성 신경망(GAN) 등도 재구축 기반 모델에 해당한다.

김성범 교수는 “AI 하면 흔히들 챗GPT를 떠올린다. 하지만 이는 AI의 한 종류일 뿐이며 데이터 예측·분석에 강점을 갖춘 여러 머신러닝 모델이 있다”며 “많은 AI 가운데 본인이 필요한 것을 찾고, 이를 통해 업무 효율을 높이기 위한 노력을 지속해야 변화하는 시대에 뒤처지지 않을 수 있다”고 강조했다.


“AI 시대, 개발자의 길을 찾다!”

비아이매트릭스 배영근 대표
비아이매트릭스 배영근 대표

비아이매트릭스 배영근 대표는 ‘AI 시대, 개발자의 길을 찾다!’를 주제로 메인 세션 첫 발표에 나섰다. 배 대표는 개발자로서 30여 년간 고민한 개발 방법론과 AUD 플랫폼 등 자사 솔루션을 활용한 업무 효율화 방안을 소개했다.

개발 프로젝트는 현업의 불명확한 요구 사항, 잦은 변경 요청으로 여러 시행착오를 겪는다. 이 때문에 만족스런 결과물을 얻지 못할 뿐 아니라 비용과 시간도 많이 소모된다. 현재 기업과 기관에서는 요구명세서로 현업과 개발 조직이 원활한 소통이 가능하도록 돕고 있다.

배 대표는 여기서 한 단계 나아가 ‘빨리빨리 개발방법론(PPDM)’을 제안했다. PPDM은 분석과 설계를 없애고 요구 사항을 직접 개발하는 방법을 뜻한다.

배 대표는 “PPDM을 토대로 화면·기능 설계 과정에서 현업이 원하는 내용을 담은 엑셀을 HTML, 자바(JAVA)로 변환하는 ‘AUD 플랫폼’을 개발했다”며 “AUD 플랫폼으로 소통 과정에서 빚어지는 마찰은 줄임으로써 개발자는 다른 업무에 더 여력을 쏟을 수 있다”고 설명했다.

프로젝트 개발 과정에서 여러 프로그램이 쓰이며 이로 인한 비효율화 문제도 대두됐다. 이를 해결하고자 비아이매트릭스에서는 AUD 플랫폼에 코딩 없이 개발이 가능한 솔루션을 탑재, 개발에 드는 공수를 절감했다.

비즈니스에 AI를 어떻게 도입하는가 또한 기업이 고민하는 문제다. 범용적인 AI 서비스는 기업 내 업무를 수행하는 데 약점을 드러낸다. 이에 비아이매트릭스는 AI 모델에 내부 데이터베이스(DB)와 도메인 전문 용어를 학습시킴으로써 특화된 업무 수행이 가능토록 구현했다. 이를 통해 자연어 입력만으로도 데이터를 바탕으로 보고서 초안을 만들거나 차트, 표로 재구성한 화면을 생성할 수 있다.

나아가 비아이매트릭스는 올 하반기에 개발도구와 AI를 결합해 코딩 작업을 자동화하고 이미지 시안을 실제 분석 인터페이스로 전환하는 기능 등을 공개할 계획이다.

배영근 대표는 “비아이매트릭스는 로우코드(Low-code), 노코드(No-code)를 아우르는 플랫폼으로 AI 시대에 걸맞은 업무 환경 고도화를 지원하겠다”고 밝혔다.


“AI 전환의 숨은 장애물, 데이터 사일로를 해결하는 방법”

퀘스트소프트웨어코리아 유광일 부장
퀘스트소프트웨어코리아 유광일 부장

퀘스트소프트웨어코리아(이하 퀘스트)의 유광일 부장은 ‘AI 전환의 숨은 장애물, 데이터 사일로를 해결하는 방법’을 주제로 발표했다. AI가 사람처럼 학습, 판단하기 위해선 방대한 데이터가 필요하다. 그런데 기업들은 많은 데이터를 보유하고 있음에도 AI 전환을 어려워하고 있다.

이는 데이터가 각기 다른 시스템에 저장된 데다 접근이 어렵고 통합되지 않는 ‘사일로(Silo)’ 문제를 겪고 있기 때문이다. 실제로 기업에서 전사적자원관리(ERP), 고객관계관리(CRM) 등 여러 솔루션을 사용 중인데, 이들 간 연계가 이뤄지지 않은 탓에 전체 상황 파악이 어렵고 고객 불만과 컴플레인으로 연결되기도 한다.

데이터 사일로를 해결하기 방안으로 퀘스트는 쉐어플렉스(SharePlex)를 제안하고 있다. 쉐어플레스는 실시간으로 데이터를 복제하고 통합할 수 있는 솔루션이다. 기존에 데이터를 처리하던 ‘배치(BATCH)’ 방식과 달리 원본 데이터베이스(DB)에 변경 사항이 생길 때마다 이를 즉각 타깃 DB에 반영한다. 데이터를 최신 상태로 유지하기 때문에 비즈니스에서 실시간 의사결정이 가능한 환경을 마련할 수 있다.

유광일 부장은 “쉐어플렉스는 국내 금융권에서 오랜 기간 안정적으로 운영되며 성능과 신뢰성을 검증받은 제품”이라면서 “온프레미스와 클라우드를 모두 지원해 마이그레이션, 하이브리드 환경 구축에도 활용할 수 있고, 복제 외에 빅데이터 분석을 위한 데이터 스트리밍, GUI 기반 모니터링까지 기본 기능으로 제공한다“고 설명했다.

퀘스트는 완성도 높은 복제를 위해 데이터 무결성을 보장하는 기술도 구현했다. 이를 통해 전통적 방식에서 발생하는 서비스 중단이나 검증 과정에서 다운타임을 개선한 마이그레이션이 가능해졌다. 특히 기업이 데이터 중요도, 시스템 리소스에 따라 적절한 방법을 선택할 수 있도록 로우(Row), 칼럼(Column) 등 단위별 복제 기능을 제공한다.

유광일 부장은 “AI가 발전할수록 실시간성과 정합성을 갖춘 데이터 통합은 더욱 중요해질 것”이라며 “쉐어플렉스는 통합 데이터 플랫폼으로서 AI 전환에 적합한 기능과 성능을 제공한다”고 강조했다.


“AI 거버넌스를 위한 통합 컨트롤 타워, ‘AI 워크벤치’”

지티원 어호경 전무
지티원 어호경 전무

세 번째 메인 세션 발표를 위해 연단에 오른 지티원 어호경 전무는 ‘AI 거버넌스를 위한 통합 컨트롤 타워 – AI 워크벤치’를 주제로 발표했다. AI가 발전함에 따라 리스크 관리가 중요 문제로 떠오르고 있다. 산출물에 대한 윤리적 문제를 해소하고, 데이터 보안 및 개인정보 침해에 대응하기 위해 정부, 기관 차원에서 기준을 제시하고 있다. 최근 유럽연합(EU)에서는 AI법(AI Act)를 만들었으며 우리나라에서도 AI기본법을 제정한 바 있다.

새로운 AI 관련 법과 규제는 관리 감독 인력 확보, 조치 사항 문서화 등을 규정하고 있다. 이에 따라 기업에서도 AI를 책임감 있게 사용하기 위한 거버넌스의 필요성이 주목받고 있다. 하지만 거버넌스 수립에 필요한 표준화된 프로세스와 산출물 관리 체계가 부재한 실정이다.

지티원은 AI 거버넌스 체계 수립 지원을 진단부터 실제 적용까지 올인원으로 제공하고 있다. 우선 금융위원회, 과학기술정보통신부 등 정부 부처, 금융 당국에서 제시한 가이드라인을 분석해 총 4개 영역, 45개 항목으로 사전 진단 체크리스트를 만들었다. 기업은 이를 토대로 4~6주간 현재 거버넌스 운영 수준을 점검할 수 있다.

거버넌스 수립 과정에 참고할 만한 레퍼런스 모델도 지원한다. 레퍼런스 모델은 표준 프로세스, 산출물 구성 항목, 책임감 있는 AI(RAI) 지표 등으로 구성된다. 기업에서는 레퍼런스 모델과 현 시스템을 비교하며 개발 단계에서 검증 사항을 확인하고 절차에 따른 과정 전반을 한눈에 파악할 수 있다.

지티원은 AI 거버넌스를 기업 시스템에 빠르게 적용할 수 있도록 ‘AI 워크벤치’를 만들었다. 이 솔루션은 컴플라이언스 준수, 프로세스 표준화를 위한 진단 항목을 ‘지식 통합팩’ 형태로 제공한다. 또 전체 워크플로와 통합돼 업무 수행 과정에서 전체 진행 상황이 거버넌스와 일치하는지 파악할 수 있다. 지티원에서는 규제 변화에 따른 대응이 가능토록 프로세스, 체크리스트도 지속적으로 업데이트하고 있다.

지티원 어호경 전무는 “여러 가이드라인, 규제를 파악하고 이에 맞는 체계를 만드는 데 많은 시간이 소요된다”며 “지티원은 AI 워크벤치를 중심으로 시스템 진단, 표준 체계 수립, 산출물 관리 등 거버넌스 운영에 필요한 모든 요소를 올인원(All-in-One) 서비스로 제공한다”고 강조했다.


“AI, 데이터 혁신의 게임 체인저, 스노우플레이크”

스노우플레이크 조동규 상무
스노우플레이크 조동규 상무

스노우플레이크 조동규 상무는 ‘AI, 데이터 혁신의 게임체인저, 스노우플레이크로 비즈니스를 가속화하다’를 주제로 발표했다.

조 상무는 AI를 효과적으로 도입하기 위한 선결 과제로 ‘문제 정의’를 강조했다. 단순히 최신 기술을 도입하는 것이 아니라 비즈니스 관점에서 AI가 해결해야 할 과제를 분명히 하고, 그에 맞는 체계적 접근이 필요하다는 분석이다.

조 상무는 AI 기반 혁신의 핵심 요소로 △사람(AI를 이해하고 활용할 인력) △솔루션(적절한 AI 기술) △데이터(문제 해결을 위한 정확한 데이터) 등 세 가지를 꼽았다. 그는 “많은 기업이 인력이나 솔루션 확보에는 집중하지만 정작 ‘데이터’를 간과하는 경우가 많다”며 “AI는 결국 데이터에 기반하기 때문에 제대로 된 데이터 없이는 아무리 뛰어난 알고리즘도 무의미하다”고 지적했다.

AI에 필요한 데이터의 기준도 언급했다. 첫째는 ‘볼륨(양)’이다. 기업 내부에 AI 학습을 위한 데이터가 절대적으로 부족한 경우가 많다. 둘째는 ‘품질’이다. 오래된 데이터가 많더라도 정확성과 일관성이 떨어지면 활용도가 낮다. 셋째는 ‘정합성’이다. 부서 간 데이터가 연결되지 않아 하나의 흐름으로 분석할 수 없는 경우가 많다는 것이다.

이러한 데이터 문제는 ‘데이터 사일로’로 이어지며 기업 전반의 AI 전략 실행에 걸림돌이 된다. 스노우플레이크는 이를 해소하기 위해 다양한 기업 데이터셋을 공유·거래할 수 있는 ‘스노우플레이크 마켓플레이스’를 운영 중이다.

조동규 상무는 “외부 고품질 데이터를 마켓플레이스에서 안전하게 확보해 기업의 데이터 역량을 보완할 수 있다”며 “이런 구조가 AI 기반 비즈니스 혁신의 기반이 될 것”이라고 강조했다.


“AI 에이전트 연결로 여는 스마트 워크 전략”

엔코아 김기동 팀장
엔코아 김기동 팀장

오후 세션은 트랙 1과 2로 나뉘어 진행됐다. 트랙 1 첫 세션에서는 엔코아 김기동 팀장이 ‘기업 데이터 활용의 극대화, AI 에이전트 연결로 여는 스마트 워크 전략’을 주제로 발표했다.

김 팀장은 챗GPT와 같은 생성형 AI 서비스는 범용 목적으로 데이터 트레이닝이 진행돼 특정 조직 및 업무 영역에 대한 이해도가 낮다고 지적했다. 기존 생성형 AI는 사용자가 질문 시 별도의 파이프라인 없이 거대언어모델(LLM)에 바로 전달돼 학습한 범위 내에서만 답변이 가능하다. 따라서 학습 범위 밖의 질의에 대해서는 엉뚱한 답변인 ‘환각(Hallucination)’ 현상이 발생한다.

이와 달리 검색 증강 생성(RAG)을 이용할 경우, 사용자 질의 시 AI 시스템은 파이프라인을 통해 데이터 자산을 먼저 검색하고, 검색된 내용과 질의를 함께 LLM에 전달한다. LLM이 업무 내용에 대한 학습을 하지 않았어도 검색된 내용을 토대로 유의미한 콘텐츠를 생성해 업무에 활용할 수 있다.

김 팀장은 스마트 워크 전략으로 RAG 기반 AI 플랫폼을 구축할 때 필요한 요소로 총 4가지를 강조했다. 이는 △실제 업무 내용을 이해하고 현업에서 활용될 수 있는 실용성 △자유롭게 파이프라인을 구성 및 수정하는 유연성 △특정 부서에 대한 의존 없이 파이프라인을 설계 및 운영하는 접근성 △파이프라인을 플랫폼 형태로 다양한 애플리케이션과 공유하는 확장성 등이다.

또한 김 팀장은 “실제 업무가 질문과 답변처럼 간단한 형식으로 끝나는 경우는 거의 없다”며, 복잡한 업무 흐름을 반영할 수 있는 자사의 에이전트 오케스트레이션 플랫폼인 ‘데이터웨어 AI 파워드 팩(DATAWARE AI Powered Pack)’을 소개했다. 해당 제품은 워크플로의 구축과 배포 과정을 시각화할 수 있으며, 개발자의 개입 없이도 손쉽게 AI 에이전트를 구축 및 배포하도록 지원한다. 더불어 챗봇을 통한 AI 에이전트 활용이 가능하며, 특정 벤더에 종속되지 않고 다양한 환경에서 AI 모델을 활용할 수 있다고 김기동 팀장은 설명했다.
 

“데이터와 업무의 AI 융합 시너지 솔루션”

핸디소프트 신기술연구소 윤상집 상무
핸디소프트 신기술연구소 윤상집 상무

트랙 1 두 번째 세션에서는 핸디소프트 신기술연구소 윤상집 상무가 ‘데이터와 업무의 AI 융합 시너지 솔루션’을 주제로 발표했다. 윤 상무는 AI가 전 산업에 빠르게 확산하며 업무 프로세스에 에이전트 AI까지 적용이 가능한 시점에 이르렀다고 평가했다. 그는 기업들이 단순히 AI를 도입하는 것을 넘어 축적한 데이터와 AI를 어떻게 활용해야 시너지를 창출할 수 있을지 실무적인 고민을 해야 하는 단계에 도달했다고 제언했다.

윤 상무는 지난 3월 맥킨지 앤드 컴퍼니(McKinsey & Company)에서 발표한 AI 현황 보고서를 인용하며 최근 기술 트렌드를 소개했다. 주요 내용은 △비즈니스 혁신의 주요 과제로 ‘AI와 데이터 융합’ 부상 △생성형 AI의 등장으로 업무 자동화와 창의적 작업 확장 △업무 데이터 재활용 및 재생성에 따른 데이터 품질과 AI 전략 중요성 증대 등이다.

이어서 실제 현업에서 발생하는 AI 업무 및 데이터 관련 주요 이슈도 짚었다. 윤 상무가 꼽은 주요 이슈로는 ▲데이터 큐레이션과 평가의 복잡성 ▲도메인 특화 데이터 부족 ▲모델 편향성 문제 ▲데이터 생성 비용과 시간 부담 ▲데이터 정제 시 인간과 AI 간 협업 필요 ▲합성 데이터 실제 적용 한계 등이 포함된다.

이에 대한 해결 방안으로 윤상집 상무는 ‘핸디인텔리전스(HANDY Intelligence)’를 소개했다. 해당 제품은 ‘시냅스-에이전트 AI(Synapse-Agent AI, 이하 SAAI)’를 기반으로 설계된 플랫폼이다. SAAI는 각각의 다양한 LLM을 사용하는 AI 에이전트들과 머신러닝, RAG를 한 엔진에서 통합 제어하는 기술이다. 신경망처럼 연결된 AI 에이전트를 통해 복잡한 문제 해결 및 운영 환경의 효율성을 극대화할 수 있다고 윤 상무는 설명했다.


“IBM SPSS 스태티스틱스와 생성형 AI의 결합”

데이타솔루션 빅데이터러닝센터 정성원 센터장
데이타솔루션 빅데이터러닝센터 정성원 센터장

트랙 2에서는 ▲데이타솔루션 빅데이터러닝센터 정성원 센터장의 ‘IBM SPSS 스태티스틱스(Statistics)와 생성형 AI의 결합’ ▲데이터벅스 송정욱 이사의 ‘자연어 검색을 위한 CDC와 실시간 벡터 임베드(Vector Embed)’ 등의 세션이 마련됐다.

트랙 2 첫 발표를 맡은 데이타솔루션 빅데이터러닝센터 정성원 센터장은 ‘IBM SPSS 스태티스틱스와 생성형 AI의 결합’을 주제로 통계 분석에 생성형 AI가 적합한 이유를 소개했다.

먼저 정성원 센터장은 통계 분석 분야에서 생성형 AI가 갖는 장점을 강조했다. 생성형 AI 중 널리 알려진 LLM은 수많은 정보를 토대로 구성된 기초적 모델이다. 특정 목표에 맞게 개발된 형태가 아니기에 학습 과정에서 충분한 양의 데이터가 구성된 분야와 그렇지 않은 분야 간 전문성의 차이가 나타난다. 그렇기에 데이터 수집이 수월한 영역이라면 더 강력한 성능을 보여줄 수 있다는 게 정 센터장의 의견이다.

정 센터장은 “데이터 수집 측면에서 통계 분석은 생성형 AI가 잘할 수 있는 일이다. 인터넷에 통계 분석과 관련한 정보는 비교적 많다. 정보를 유료화하는 경향을 띠는 외국과 달리 우리나라는 블로그나 사이트를 통해 개인이 분석한 결과를 공유하는 경우가 잦아 충분한 학습 데이터를 확보할 수 있다”고 설명했다.

통계 분석과 생성형 AI 간 결합을 위해 데이터솔루션은 ‘코리아플러스 스태티스틱스 AI 코치(KoreaPlus Statistics AI Coach)’를 6월 중 출시할 예정이다. 코리아플러스 스태티스틱스는 IBM의 통계 분석 솔루션 ‘SPSS’에 데이터솔루션의 ‘밸류 애드 컴포넌트(Value Add Component)’와 서비스를 추가한 플랫폼이다. 이에 수행한 결과를 생성형 AI로 분석하는 모듈인 AI 코치를 접목한다는 계획이다.

정성원 센터장은 “사용자는 AI 코치를 통해 통계에 쉽게 접근할 수 있고, 결과에 대한 추가적인 질문으로 관련 답변을 제공받아 통계 분석의 품질을 향상할 수 있을 것”이라고 말했다.


“자연어 검색을 위한 CDC와 실시간 벡터 임베드”

데이타벅스 송정욱 이사
데이타벅스 송정욱 이사

데이타벅스 송정욱 이사는 ‘자연어 검색을 위한 CDC와 실시간 벡터 임베드(Vector Embed)’라는 주제로 발표에 나섰다. 송정욱 이사는 먼저 자연어 검색에 실시간 데이터를 취합할 필요성이 있음을 강조했다.

송정욱 이사는 “기업들은 자사 데이터를 기반으로 LLM을 구축하고 이를 고객에게 자연어 검색이 가능하도록 제공하기를 원하고 있다. 그러나 모델을 구축한 후 사용 기간이 늘어날수록 실시간으로 생성되는 데이터와 내부 데이터 간의 격차가 커진다. 곧 기업은 시의성을 놓치게 된다”고 설명했다.

송정욱 이사는 이를 해결할 방안으로 실시간 벡터 임베드를 소개했다. 송 이사는 “지금까지는 실시간 데이터를 반영하기 위해 벡터 데이터 베이스(DB)를 기술자가 업데이트하는 방식을 활용해 왔다. 하지만 이 방식은 시의성을 놓치는 것은 물론 매번 업데이트를 기업이 신경 써야 하는 번거로움이 있다. 실시간 벡터 임베드 기술을 활용하면 이 문제를 해결할 수 있으며, 기업들은 실시간 인사이트를 통해 의사결정에 도움을 받을 수 있다”고 강조했다.

송정욱 이사가 제시한 해결책은 스트림(Striim)의 ‘변경 데이터 캡처(Change Data Capture; CDC)’다. CDC는 실시간으로 다양한 소스에서 데이터를 수집하고 가공해 타깃 DB로 옮길 수 있도록 지원하는 기술이다.

스트림은 CDC와 함께 기업이 보유한 데이터 소스 중 민감한 데이터가 있는지 확인하는 ‘셜록 AI(Sherlock AI)’와 실시간으로 흐르는 데이터에서 민감한 데이터를 처리하고 보호하는 ‘센티넬 AI(Sentinel AI)’ 등도 탑재해 보안성도 제공한다.

마지막으로 송정욱 이사는 초기적재 모델과 실시간 벡터 임베드를 시연했다. 초기적재 모델에 비해 CDC로 실시간 데이터를 수집하는 모델이 자연어 검색에서 가지는 강점을 선보였다. 송 이사는 “결국 자연어 검색을 통해 일관성 있고 정확한 답변을 제공하기 위해서는 하이브리드 서치가 필수”라고 강조했다.


“오픈소스 DBMS를 활용한 디지털 현대화”

EDB코리아 김희배 지사장
EDB코리아 김희배 지사장

행사의 대미는 EDB코리아 김희배 지사장이 장식했다. 김희배 지사장은 ‘오픈소스DBMS를 활용한 디지털 현대화’를 주제로 발표를 진행했다.

김희배 지사장은 먼저 오픈소스의 장점을 강조했다. 김 지사장은 “현재 80~90%의 소프트웨어(SW)가 오픈소스를 활용하고 있다. 각 벤더가 보유할 수 있는 개발자들은 100만 명 내외인 반면, 오픈소스 환경에서는 1억 명이 넘는 개발자들이 협업·경쟁하고 있다. 이러한 측면에서 새로운 혁신 기술을 개발하는 경우 오픈소스 모델이 가지는 강점이 있다”고 설명했다.

EDB에서 제공 중인 ‘포스트그레SQL(PostgreSQL)’은 오픈소스 데이터베이스 관리 시스템(DBMS)이다. 기업은 포스트그레SQL을 공식 홈페이지에서 직접 다운받아서 활용하거나 EDB와 같은 벤더를 통해 사용할 수도 있다.

김희배 지사장은 기업들이 EDB 같은 벤더를 통해 포스트그레SQL을 도입할 때 고려할 점을 제시했다. 김 지사장은 “기업이 해당 오픈소스 커뮤니티 발전에 얼마나 기여하고 있는지 살펴봐야 한다. 다음은 혁신이다. EDB의 경우 쿠버네티스 환경에서 클라우드 네이티브를 구현해 내는데 큰 기여를 했으며, 포스트그레SQL의 다양한 혁신 분야에서 일조해 왔다”고 말했다.

김희배 지사장은 기술 지원과 벤더 종속 해결 여부도 짚었다. 특정 이슈가 발생할 경우 국내에서 얼마나 빠르게 대응할 수 있는지, 기존에 시장을 점유하던 벤더로부터 겪던 정책적·비용적 부담을 해결할 수 있는지를 고려해야 한다는 의견이다.

김 지사장은 “EDB는 시장에서 큰 점유율을 가진 오라클의 솔루션을 활용하던 고객들이 이전할 경우, 95% 수준의 마이그레이션 호환성을 제공하고 있다. 또한 자사 솔루션을 활용할 때 오라클을 활용하는 경우에 비해 50~80% 총 소유 비용(TCO) 절감이 가능하다”고 강조했다.

마지막으로 김희배 지사장은 벡터 DB 구축 방안에 대해 제언했다. 김 지사장은 “몇몇 고객은 벡터 DB를 구성하고자 전문 벡터 DB를 구축해야 하는지를 물어보기도 한다. 만약 이미 사용 중인 DB 벤더에서 벡터 DB를 서비스한다면 기존 시스템에서 구축하는 것을 추천한다”고 설명했다.

이어 김 지사장은 “전문 DB를 새롭게 도입하는 경우 비용적 부담이 발생할 수 있으며 기존에 구축해 둔 DB와 호환되지 않는 경우 데이터 전처리 과정의 번거로움도 생길 가능성이 있다. 물론 EDB도 벡터 DB를 지원하고 있으며 AI 액셀러레이터(AI Accelerator)를 통해 전용 벡터 DB 보다 4.42배 빠른 시맨틱(semantic) 기반 문서, 이미지 검색을 지원한다”고 말했다.

지난 5월 21일 서울 양재동 엘타워에서 열린 ‘2025 데이터 컨퍼런스’ 부스 현장
지난 5월 21일 서울 양재동 엘타워에서 열린 ‘2025 데이터 컨퍼런스’ 부스 현장
저작권자 © 컴퓨터월드 무단전재 및 재배포 금지