한국한의약진흥원 김상진 지능정보화센터장
[컴퓨터월드] 4차 산업혁명 시대에 빅데이터와 인공지능(AI, Artificial Intelligence)은 다양한 산업에서 새로운 혁신을 주도하는 핵심 기술로 자리 잡고 있다. 특히 헬스케어 분야에서는 코로나19 팬데믹 이후 환자 진단, 치료 계획, 예후 예측 등 지능형 의료 서비스를 제공하기 위해 빅데이터와 인공지능의 역할이 더욱 확대되고 있다. 이러한 의료 패러다임의 전환과 기술의 발전은 현대 의학 뿐만 아니라 전통적인 한의약에도 새로운 가능성을 열어주고 있다.
한의약은 오랜 세월 축적된 경험과 지식을 바탕으로 독자적인 치료법과 건강관리 체계를 발전시켜 왔으나, 현대적 데이터 분석 기술과의 연계는 아직 초기 단계에 머물러 있는 것이 현실이다. 이제는 한의약 분야에서도 빅데이터와 인공지능 기술을 적극적으로 도입하여 한의약의 과학화와 표준화를 촉진하고, 안전성과 유효성을 객관적으로 입증해야 할 때다.
한의약 분야에서는 보건복지부와 관계 부처가 합동으로‘한의약 육성법’에 따라 제4차 한의약 육성발전 종합계획(2021~2025)을 수립했다. 이를 바탕으로 한국한의약진흥원(보건복지부 산하 공공기관으로, 한의약 육성법 제13조에 근거하여 한의약기술의 진흥을 효율적으로 지원하기 위하여 설립)은 첨단 기술을 활용한 한의약 발전 기반 마련을 위해 한의약 빅데이터 Hub 구축, 한의약 빅데이터 기반 인공지능 활용 체계 마련 등 과제를 수행하고 있다.
한국한의약진흥원의 지능정보화센터(센터장 김상진)와 임상정보빅데이터추진단(단장 서병관)은 한의약 빅데이터ㆍ인공지능 활용 기반 구축을 목표로 ‘한약 인공지능 플랫폼 구축’, ‘한의약 임상정보 빅데이터 지원센터 구축’, ‘한의약 정보 인프라 구축’의 세 가지의 주요 사업을 추진하고 있다.
총 7편의 연재에서는 한의약 빅데이터·인공지능 생태계 조성을 위한 전략을 제시하고, 세 가지의 주요 사업을 현재와 미래 전망, 그리고 도전 과제라는 카테고리로 나누어 다루어 본다.
1. 한의약 빅데이터·인공지능 생태계 조성을 위한 전략 (10월 호)
2. 한약 실험정보 공동 활용을 위한 한약 인공지능 플랫폼 구축의 현재와 미래 (이번 호)
3. 특정 질환 치료를 위한 GCN 기반 한약재 조합 예측 모델 (다음 호)
4. 한의약 임상정보 빅데이터 허브 구축의 과정과 미래 전망
5. 한의 표준 전자의무기록(EMR) 확산을 통한 한의약 임상정보 선진화
6. 전통적 한의약의 디지털 전환으로 한의약 정보 인프라를 향한 도전
7. 한의약 특허기술 거래를 통한 한의약의 미래 가치 창출
10월호 기고(1편)에서는 ‘한의약 빅데이터·인공지능 생태계 조성을 위한 전략’에 대해 개념도를 중심으로 큰 그림과 예시를 통해 소개했다. 이번 기고에서는 그 전략의 주요 요소를 이루고 있는 ‘한약 인공지능 플랫폼 구축’의 현황을 점검하고, 향후 계획을 바탕으로 인공지능이 도입된 한의약 산업의 미래를 전망해 본다.
현재 한국한의약진흥원 지능정보화센터(센터장 김상진)는 제4차 한의약 육성발전 종합계획(2021~2025)에 근거해 한약 인공지능 플랫폼 구축 사업을 추진하고 있다. 이 사업의 목표는 ‘한의약 빅데이터 기반 인공지능 활용체계 마련’과 ‘미래형 한의약 신제품 발굴 및 산업화 지원’이다. 한의약 빅데이터와 인공지능 기술을 융합해 한약의 안전성과 유효성을 예측하고, 신효능 후보군 발굴, 한약재 추천 등을 통해 한의약 산업 발전의 기반을 마련하자는 것이다. 이를 위해 2021년부터 기초 자원 확보의 일환으로 한약 실험정보(비임상 정보)를 수집하고 있으며, 이러한 데이터를 효과적으로 활용할 수 있는 체계를 지속적으로 구축하고 있다.
한약 실험정보는 한약재 성분정보, 공정서 등록정보, 한약재 처리 방법 등 기본 정보뿐만 아니라, 이를 검증하기 위한 실험동물(예: 쥐, 토끼)이나 세포주(예: 암세포주, 면역세포)를 대상으로 한 실험 과정에서 생산된 데이터를 포함한다. 이러한 정보는 사람을 대상으로 하는 임상 연구에 앞서 한약의 안전성과 유효성을 예비 평가하고, 약리학적 작용 기전(메커니즘), 독성 여부, 최적 용량 등을 확인하는 데 중요한 역할을 한다.
여러 곳에 산재돼 있는 ‘한약 실험정보 데이터’
한약 실험정보는 임상정보와 달리, 개인정보 가명처리 작업 등이 필요하지 않아 수집 및 활용 과정에서 정책적·법적 검토와 절차가 거의 요구되지 않는다. 그러나 한약 실험정보 데이터는 세계 최대 의학 논문 데이터베이스인 펍메드(PubMed), 세계 최대 화학 정보 데이터베이스인 펍캠(PubChem), 중국의 중의통합데이터베이스(TCMID), 그리고 국내의 한약 관련 데이터베이스인 전통의학정보포털(OASIS), 한국전통지식포탈 등 여러 곳에 산재되어 있어 모든 사용자가 정보를 쉽게 접근하고 활용하기 어려운 상황이다.
이에 따라 한국한의약진흥원은 논문 정보, 화학 정보, 생약 정보 등 한약의 효능 분석, 신약 개발과 약재 추천에 필요한 모든 정보를 통합 제공하는 ‘한약 실험정보 공동 활용 시스템 구축’을 중요한 도전 과제로 추진하고 있다. 이 과제의 중장기적인 목표는 비임상 단계에서 연구자들의 높은 실험 비용과 시간, 실패율 등을 줄이고, 인공지능 알고리즘을 활용해 한약의 새로운 효능과 안전성을 예측하며 치료 후보물질을 신속하게 발굴할 수 있도록 지원하는 것이다.
이번 기고(2편)에서는 한약 실험정보 공동 활용을 위한 한약 인공지능 플랫폼 구축의 현재 상황과 향후 추진 방향을 제시하고자 한다.
위 그림은 한약 인공지능 플랫폼 구축을 위한 로드맵을 시각적으로 표현한 개념도이다. 이 로드맵은 한약 실험정보 수집 및 가공, 지식정보 서비스, 인공지능 기반 한약 추천 및 신효능 예측 등 한약 실험정보 공동활용을 위한 시스템 구축 과정을 포함하고 있으며, 한의약 빅데이터ㆍ인공지능 생태계 조성을 위한 전략의 중요한 요소라고 할 수 있다. 이 개념도를 바탕으로 왼쪽에서 오른쪽으로 한약 인공지능 플랫폼 구축에 대해 각 단계별로 살펴보자.
1. 한약 실험정보 데이터 수집 및 정리(2021~)
데이터 수집 대상은 한국한의약진흥원(국가한의임상정보, 한의약소재정보 등), 정부 기관(식물 및 천연물 소재·성분·효능, 화합물 정보 등), 국내외 공공 포털(PubMed, PubChem, 한국전통지식포털 등)과 같은 한약 관련 실험정보를 제공하는 주요 기관 및 데이터베이스다.
이처럼 다양한 출처에서 제공되는 한약 실험정보를 하나로 통합하고 체계적으로 정리하는 작업은 매우 복잡하고 시간이 많이 소요된다. 데이터 출처마다 형식과 내용이 달라 이를 표준화하고 중복된 정보를 제거하는 과정에서 많은 어려움이 발생한다.
같은 한약재에 대한 실험이라 하더라도, 연구실(실험실)마다 사용하는 한약재명(학명, 국명, 일반명 등), 실험 항목 값(용량 단위, 실험 주기 등)이 다를 수 있어 데이터 표준화 작업이 필수적이다. 비록 초기 작업은 시간과 비용이 많이 소요되지만, 데이터를 공동으로 활용할 수 있는 코드 체계를 마련하고 지속적으로 한약 실험정보 데이터를 축적해 체계적으로 정리하는 기반을 구축하는 것은 매우 중요하다.
지능정보화센터는 2021년도부터 현재까지 Pubmed, Pubchem, 한국전통지식포털 등 국내외 공공 포털에서 논문 및 자료를 수집해 데이터 식별, 추출, 정제, 표준화 등의 과정을 거쳐 한약 실험정보를 구축해 오고 있다. 특히, 대표 한약재 및 처방 151개 품목에 대해 약재와 처방, 독성, 약력학, 약동학, 약물 상호작용(in vivio: 생체 내, in vitro: 시험관 내) 등 다양한 분야의 데이터를 전처리하고, 이를 표준화 및 정규화해 한약 실험정보 통합 데이터베이스를 구축하고 있다.
2. 인공지능 학습용 데이터 생성 및 한약 신효능 인공지능 모델 개발(2024~)
가공된 한약 실험정보 데이터를 활용해 분석과 예측을 수행하려면 인공지능 학습을 위한 별도의 데이터 가공 과정이 필요하다. 학습용 데이터를 통해 인공지능을 학습시키고 특화된 조정(미세조정)을 거치면, 최종적으로 사용자가 원하는 결과나 응답을 추론하고 예측할 수 있게 된다. 이처럼 검증된 인공지능 모델은 타겟 질환, 단백질, 화합물 등을 발굴하고, 나아가 한약의 추천 및 신효능을 예측하는 데 사용될 수 있다.
2023년에는 이렇게 구축된 인공지능 학습용 데이터를 활용해 특정 한약재의 실험 항목 값 변화에 따른 독성 여부를 확인할 수 있는 독성 예측 알고리즘을 프로토타입(Prototype)으로 개발했다.
올해는 특정 암에 효과적인 한약재 조합을 발굴하기 위한 항암 약재 조합 알고리즘을 개발 중이다. 앞으로도 체질 및 질환에 따른 맞춤형 처방과 한약 추천, 특정 타깃 질환(예: 월경통, 알레르기 비염 등)을 선정해 실질적인 개념 증명(PoC, Proof of Concept)을 통해 데이터 활용 가치를 높여갈 계획이다.
3. 한약 실험정보 지식 서비스 및 대화형 챗봇 서비스(2025~)
2025년에는 한약 실험정보 데이터를 성분, 소재, 처방 등 사용 목적에 따라 분류하고, 사용자에게 제공할 수 있는 인터페이스를 구축해 지식 서비스 형태로 시범적으로 개방할 예정이다. 2026년에는 사용자 경험을 반영한 고도화를 통해 한약 실험정보 지식 서비스를 ‘한약 실험정보 공동활용 시스템’으로 발전시킬 계획이다.
또한, 한의약 정보에 특화된 인공지능 챗봇 서비스 개발도 중요한 과제 중 하나이다. 이 챗봇 서비스는 방대한 자료 중에서 사용자가 필요로 하는 정보를 실시간으로 제공해 신속하고 정확한 고품질 데이터 환경을 조성할 것으로 기대된다. 이는 디지털 시대에 한의약 산업의 경쟁력을 높이는 전략적 도구가 될 것이다.
한의약과 생성형 인공지능의 결합은 창의적이고 새로운 콘텐츠를 생성하고, 기존의 정보나 아이디어를 더욱 개선할 기회를 제공할 수 있다. 이러한 챗봇은 단계적인 시범 운영(Pilot Launch)을 통해 추가적인 데이터 학습을 지속하며 점차 고도화될 예정이다.
궁극적으로 한약 실험정보 공동활용 시스템은 산업계, 학계, 연구기관, 한방병원, 한의원 등 모든 국민이 한의약 서비스에 쉽게 접근할 수 있는 대표 플랫폼으로 자리 잡아야 하며 이를 위해서는 한약 인공지능 플랫폼 구축 사업이 확장돼야 한다. 이를 통해 각 분야의 연구자와 의료 종사자들이 효율적으로 정보를 활용하고 한의약 연구와 치료 개발을 가속화해 한의약 산업 발전과 국민 건강 증진에 기여할 수 있을 것이다.
결론
이번 기고에서는 한약 실험정보 데이터 수집부터 지식 서비스, 인공지능 모델을 통한 분석, 추천 및 예측, 그리고 사용자 맞춤형 챗봇 서비스까지의 전반적인 과정을 통해 한약 인공지능 플랫폼 구축의 현재와 미래를 살펴보았다. 한약 인공지능 플랫폼 구축 사업을 통해 다양한 약재와 질환에 관한 연구 데이터를 누구나 쉽게 활용할 수 있는 시스템이 구축된다면, 한약 비임상 연구 분야에 획기적인 변화를 가져올 것이다.
한편, 국내에는 공공 신약 개발을 지원하기 위한 사례로 ‘인공지능 신약 개발 플랫폼(KAIDD, Korean AI-driven Drug Development)’을 들 수 있다. 이 플랫폼은 현재 합성의약품(양의약) 관련 빅데이터를 기반으로 다양한 인공지능 모델을 소개하고 있다. 그러나 한약 관련 후보물질 발굴, 독성 예측 등의 인공지능 모델은 찾아보기 어렵다. 따라서 한약의 신효능 발굴, 유효성 및 안전성 예측 등을 위한 인공지능 모델 개발에 적극적인 관심과 체계적인 지원이 필요하다.
인공지능 시대의 도래는 한의약 산업에도 새로운 도전과 과제를 제시하고 있다. 이러한 변화에 효과적으로 대응하고 필요한 기술을 충분히 활용하려면 모든 이해관계자들이 긴밀하게 협력하고 상호 지원하는 것이 필수적이다. 한의약 산업의 지속 가능한 발전을 위해 이해관계자들이 함께 힘을 모아 새로운 길을 개척해야 할 시점이다.
한약 인공지능 플랫폼 구축 사업이 한의약 빅데이터ㆍ인공지능 생태계 조성을 위한 마중물이 되어, 한의약 산업의 디지털 전환을 촉진하고 지속 가능한 성장을 이끌어내기를 기대한다.


