[강좌] AI 도입, 모델보다 문제 정의가 먼저다

성공적인 AI 기술 개발 및 도입 - 산학협력 사례를 중심으로

2025-08-29     손영두
동국대학교 산업시스템공학과 손영두 교수

손영두 교수는 2017년 3월부터 동국대학교 산업시스템공학과에 재직 중이다. 손 교수가 이끄는 동국대학교 데이터과학연구실은 최신 인공지능 기술 개발 및 가치를 창출하기 위한 산업 응용 연구를 진행하고 있다. 제조 공정 및 설계 자동화, 설비 이상 탐지, 기상 위성 영상 분석, 의료 영상 분석, 문서 인식 및 요약, 농산물 품질 관리 등 다양한 산업 분야에 AI 기술을 접목하는 프로젝트를 수행해 왔다. 2024년 12월 기상 위성 영상 자료를 이용해 미래 강수 예측 및 전지구적 온실가스 분포를 추정하는 AI 기술을 개발한 공로로 환경부 장관 표창을 수상했다.

연재 순서

제1회: AI 도입, 모델보다 문제 정의가 먼저다 (이번호)

제2회: 제조업 사례로 알아본 소통의 중요성 (다음호)

제3회: 기상 위성 분석 사례로 알아본 도메인 지식의 중요성 (11월호)

 

[컴퓨터월드] 

“모든 행복한 가정은 비슷하지만, 불행한 가정은 각자의 이유가 있다.” - 안나 카레니나 (톨스토이)

 

필자가 진행했던 많은 AI 산학협력 프로젝트는 성공적으로 마무리돼 현재까지도 현장에서 활용되고 있다. 하지만 일부 프로젝트들은(공식 결과는 성공으로 기록되었더라도) 현장 적용까지 이어지지 못하고 마무리되기도 했다.

돌이켜보면 위의 구절처럼 성공한 프로젝트들은 모두 비슷한 과정을 밟았지만, 실패한 프로젝트들은 각각 서로 다른 단계에서 문제가 발생했다. 이번 연재는 그런 경험을 바탕으로 성공적인 AI 기술 개발 및 도입을 위한 핵심 단계와, 각 단계에서 주의해야 할 점을 사례와 함께 소개해보고자 한다. 본 내용은 산학협력 상황을 주로 다루지만, 넓게 AI 기술 전문가와 산업계 전문가의 협업 원리로도 바라볼 수 있을 것이다.


첫 번째 단계 : 문제 정의 및 요구사항 분석

문제 정의 및 요구사항 분석은 AI 프로젝트에서 가장 중요한 단계다. 어떤 문제를 AI로 해결할 것이며, 프로젝트의 성공/실패 판단의 기준을 무엇으로 할 것인지 결정한다. 구체적으로 문제를 명확히 정의하고, AI를 통해 해결 가능한지, 그리고 관련된 데이터의 존재 여부를 확인한다.

가장 흔한 난관은 산업 전문가와 AI 전문가의 문제 이해 방식의 차이다. 예를 들어, ‘적절한 공정 방식’을 결정하는 AI 기술을 개발하고자 하는 문제를 살펴보자. ‘적절한 공정 방식’이라는 표현이 산업 전문가에게는 자명할 수 있지만, AI 전문가의 입장에서는 문제의 이해를 위해 정량적 판단 기준과 제약 조건 등을 알아야 한다.

따라서 긴밀한 소통을 통해, 산업 전문가는 AI 기술을, AI 전문가는 산업 지식을 이해하고, 이를 바탕으로 문제를 입력, 출력(타깃), 제약 등 AI 문제의 형태로 재표현하게 된다. 문제 정의 후, 가능한 한 빠르게 관련 데이터의 존재 여부를 파악하는 것이 중요하다. 일반적으로 출력 변수는 명확하지만, 입력 변수의 범위는 고민이 필요하다. 이미 영향이 큰 것으로 알려진 요소들만 고려한다면, 기존에 알고 있던 것과 크게 다르지 않은 결과가 도출될 수 있다.

AI 전문가의 입장에서 입력 변수는 다양할수록 좋지만, 데이터 수집에 필요한 시간과 비용을 고려할 때 기존에 영향이 큰 것으로 알려진 요소들과 더불어 산업 전문가의 직관에 근거한 가능성이 있는 변수를 함께 고려하는 것이 가장 좋다고 생각한다. 특정 기술(LLM 등)을 꼭 사용해야 한다면, 이 단계에서 함께 논의해 가능 여부를 판단해야 한다.


두 번째 단계 : 데이터 수집 및 파악

데이터는 AI 품질의 80% 이상을 좌우한다고 언급될 정도로 AI 개발의 가장 핵심적인 요소이다. 데이터가 조금만 있어도 AI 기술 개발을 시도할 수 있지만, 질과 양에 따라 선택 가능한 기술의 범위가 달라지게 된다. 일반적으로 데이터의 양이 많을수록 시도할 수 있는 모델의 종류가 많아지게 되고, 다양성이 높을수록 안정적인 결과를 도출할 수 있다.

앞서 언급한 대로 수집 대상은 널리 알려진 핵심 요소에 더해, 기존 이론에는 반영이 어렵지만 직관상 영향이 있을 것 같은 인자들을 포함하는 편이 좋다. 추후 지속적인 모델 업데이트를 고려한다면, 데이터 수집 과정을 일회성이 아닌 프로세스로 설계하는 편이 좋다.

현대 AI 모델들은 영상, 음성 등 다양한 형태의 데이터를 모두 처리할 수 있기 때문에 데이터 형태에는 구애받지 않는다. 개인정보 및 보안 이슈가 없다면, 데이터 전처리는 AI 팀에 위임하는 것이 효율적이다.

데이터의 양과 더불어 다양성도 중요하다. 예를 들어 성공할 때까지 수정된 설계 도면과 같이 특정한 종류의 데이터만 반복해 존재한다면 최종적으로 학습된 AI 모델은 안정적인 결과를 도출하지 못할 수 있다. 이 문제는 기술적으로 보완할 수 있지만, 일반적으로 다양한 데이터를 통해 학습된 경우에 AI 모델은 더 안정적인 결과를 도출한다.

데이터 수집이 끝나면 산업 및 AI 전문가가 함께 모여 질의를 통해 대한 데이터에 대한 통일된 이해를 갖추는 절차가 필요하다.


세 번째 단계 : 모델 선정과 개발

AI 전문가가 주도적으로 활약하는 단계이다. 이 단계에서는 어떤 AI 모델과 기술을 사용할지를 결정하며, 이는 문제의 난이도, 입출력 데이터의 형태와 양, 그 외 모델 설명 가능성 및 운영 환경 등의 제약 조건에 의해 달라진다.

기본적으로 문제의 난도가 높을수록 복잡한 모델과 기술을 사용하게 되며, 이에 따라 필요한 데이터의 양도 함께 늘어난다. 입출력 간 관계 도출이 단순한 문제에 지나치게 복잡한 모델을 사용한다면 오히려 안정적이지 못한 결과를 도출할 수 있으니 주의해야 한다.

필자는 학술지 및 학술대회에서 발표되는 최신 기술들은 패션쇼의 옷들과 비슷하다는 말을 종종 한다. 패션쇼의 옷들은 디자이너들의 능력과 앞으로 패션계가 나아갈 방향성을 보여주지만, 실생활에서 입기에는 지나치게 화려하거나 편안함이 부족할 수 있다.

AI 전문가들도 무조건 최신 기술을 사용해 기술력을 자랑하기보다는 문제 해결에 집중해 적합한 모델을 선택하고 개발해야 한다.


네 번째 단계 : 파일럿 테스트

개발한 모델의 유용성을 실제와 유사한 작은 범위에서 테스트해보는 것이 목적으로, 프로젝트의 목표 달성 여부를 측정할 수 있어야 한다. 목표 달성 여부를 측정할 수 없는 상황이라면, 먼저 측정 환경을 구축해야 한다. 또한 목적에 따라 기존 레거시 시스템의 결과와 병행해 비교할 수 있다.

예상되는 주요 리스크는 조업 일정으로 인한 테스트 지연 및 현장 사용자의 변화 저항 등이다. 이 단계에서 산업 전문가는 변화 관리를 통해 현장 사용자들의 협조와 테스트가 올바르게 진행될 수 있는 환경 구축에 신경을 써야 한다.


다섯 번째 단계 : 구현 및 운영

완성된 솔루션을 실제 환경에 배포해 운영하고 모니터링하는 체계를 갖추는 단계이다. 가급적 많은 부분을 자동화해 운영 효율성을 높이고, 보안, 개인 정보, 권한 등의 관리 체계를 마련한다.

AI 모델이 원활히 잘 작동하더라도 완전히 안정화되기 전까지는 레거시 시스템을 유지하는 편이 만일의 사태에 대응할 수 있다.


마지막 단계 : 유지 보수 및 피드백

모니터링을 통해 모델의 정상 작동 여부를 지속적으로 관찰하고, 성능 저하 시 원인을 찾아 해결한다. 일반적으로 모델의 성능 저하는 환경 변화에 따른 입력 데이터 분포의 변화로 발생하며, 이때 가장 기본적인 방법은 학습 데이터를 다시 수집해 재학습하는 것이다.

데이터 수집과 모델 재학습은 새로운 프로젝트라는 인식으로 예산과 인력을 투입해야 한다. 만일 한 번 구축된 모델이 새로운 환경에 맞추어 지속적으로 업데이트되기를 원한다면, 설계 단계부터 이를 염두에 두고 개발해야 한다. AI 모델이 잘 작동할수록 모니터링을 소홀히 하기 쉽고, 예산 축소 및 인력 이탈 등으로 유지보수가 약해지는 것 또한 시스템 구축 후에 흔히 벌어질 수 있는 위험이다.

위와 같이 AI 기술 개발 및 도입 프로세스를 여섯 단계로 정리하고, 각 단계에서 생각할 요소들을 살펴보았다. 정리하면, 단계별로 다양한 문제가 발생할 수 있지만, 대부분은 상호 간의 긴밀한 소통을 통해 해결할 수 있다. 특히 이른 단계에서의 논의가 많은 문제를 예방할 수 있다.

마지막으로 AI를 도입하기로 결정하면 막연히 잘 될 것이라는 기대를 조금 내려놓고, 발생 가능한 문제들을 해결해 나가고자 하는 마음가짐을 가지는 것이 중요하다.

다음 화부터는 필자의 산학협력 프로젝트 사례들을 예시로, 위의 단계들이 구체적으로 어떻게 적용되었고, 각 단계에서 발생한 문제와 해결 등을 살펴보고자 한다.