WGAN으로 약물 임상시험을 가상으로 치르는 시대

 



AI 기반 바이오동등성 임상시험 개념 일러스트 – 왼쪽에 인공지능 뇌를 형상화한 실루엣, 오른쪽엔 사람 아이콘과 약물, 그래프, 데이터가 연결된 구조
인공지능이 만들어낸 ‘가상의 환자들’이 실제 임상시험을 대신한다는 컨셉을 시각화한 일러스트. AI와 바이오동등성 시험의 만남을 표현했다.


"가짜 사람"이 약을 대신 먹는다면?


“약효가 같다고요? 그걸 어떻게 믿죠?”

우리가 복용하는 제네릭 약(복제약)은 시중의 오리지널 약과 ‘바이오동등성(Bioequivalence, BE)’이 입증되어야만 허가된다. 이를 위해 실제 사람을 대상으로 한 임상시험이 필수다. 보통 24명 내외의 건강한 지원자를 대상으로 이뤄지지만, 이조차도 비용, 시간, 윤리 문제 등으로 만만치 않다.


그런데 이제 "진짜 사람이 아니라 가상의 사람"이 이 실험을 대신할 수 있다면?

이 상상이 현실로 다가오고 있다. 최근 그리스 아테네대학교와 헬라스연구재단(FORTH)의 공동 연구팀이 생성적 적대 신경망(WGAN)이라는 인공지능 기술을 활용해, 약물 임상시험에 참여할 ‘가상의 환자’를 만들고 이를 통해 BE 시험을 재현하는 데 성공했다.


---


 바이오동등성 시험, 왜 중요한가?


제네릭 의약품은 오리지널 약과 성분이 같더라도 체내 흡수 속도나 농도가 다를 수 있다. 이를 검증하는 것이 바로 BE 시험이다. 시험 결과, 약물 흡수 면적(AUC)최대 혈중 농도(Cmax)가 기준 안에 들어야 한다. 이 기준은 규제기관(FDA, EMA 등)이 엄격하게 관리한다.


문제는 이 시험이 항상 쉽지 않다는 점.

참여자 수는 작지만, 통계적으로 의미 있는 결과를 얻으려면 표본 수가 더 많아야 하는 경우도 많다. 사람 수를 늘리면 시간과 비용이 폭증하고, 참가자 건강에 대한 윤리적 부담도 커진다.


---


 인공지능으로 만든 ‘가짜 환자’의 등장


연구팀은 이 문제를 해결하기 위해 인공지능, 그 중에서도 Wasserstein 기반 생성적 적대 신경망(WGAN)이라는 알고리즘을 활용했다. 이 기술은 기존의 데이터 일부를 학습해, 그와 통계적으로 매우 유사한 ‘가짜 데이터’를 만들어낸다. 말 그대로 ‘AI가 만든 가상의 환자들’인 셈이다.


기존 BE 시험 데이터를 입력하면, WGAN은 이를 바탕으로 유사한 개인들의 약물 반응 데이터를 생성해 낸다. 실제로 이 연구에선 **단 3명 분량의 데이터를 입력해도, 24명 전체의 결과와 거의 같은 가상 집단을 만들 수 있었다.** 정말 대단한 일이다.


---


 실험은 어떻게 이뤄졌을까?


연구진은 2×2 교차 설계 방식의 BE 시험을 기반으로 시뮬레이션을 돌렸다. 여기엔 다양한 조건이 설정됐다:


* 총 피험자 수: 12, 24, 48, 72명

* 샘플링 비율: 25%, 50%, 75%

* 피험자 간/내 변이(CV): 10%, 25%

* Test/Reference(T/R) 비율: 1.0, 1.05, 1.1


각 조건에서 실제 데이터를 일부만 사용해 WGAN을 학습시킨 후, 가상 환자 집단을 생성하고 이 집단의 BE 시험 통계값을 계산했다. 그 결과는 기존 전체 집단과 얼마나 유사한지, BE 기준을 만족하는 비율이 얼마나 비슷한지를 비교했다.


---


 놀라운 결과: 단 3명으로도 충분했다


실험 결과는 놀라웠다.


* 24명 중 단 6명(25%)의 데이터만으로도 생성된 가상 환자 집단은 전체 집단과 100% 동일한 BE 판정 결과를 도출했다.

* 더 극단적인 경우, 12명 중 단 3명만 사용해도 유사 결과를 얻었다.

* 오히려 일반 샘플링으로만 시험을 할 경우, 전체 집단과의 차이가 더 컸다.


게다가 WGAN으로 생성한 가상 환자 집단을 실제보다 2배 크기로 늘릴 경우, 오히려 BE 판정의 신뢰도가 올라가는 경향도 보였다. 이는 곧, 통계적 파워(검정력)를 높이면서도 실제 사람 수는 줄일 수 있는 가능성을 보여준다.


---


 단점은 없을까?


물론 한계도 있다.


* 현재는 약물 간 흡수율 차이(T/R 비율)가 10% 이하인 비교적 이상적인 조건에서만 실험이 이뤄졌다.

* 높은 변동성(CV > 30%)을 가진 약물에 대한 적용은 아직 검증되지 않았다.

* 실제 사람을 완전히 대체할 수 있는 것은 아니며, 기본적인 실험 참가자는 반드시 필요하다.


연구진은 "우리의 기술은 사람을 완전히 대체하는 것이 아니라, 일부만으로도 전체를 예측 가능한 수준까지 끌어올리는 것"이라고 설명했다. 가령, 12명을 뽑아 6명만 실제 시험에 참여시키고, 나머지는 가상 환자로 채워도 된다는 이야기다.


---


 규제기관은 받아들일까?


이 기술이 실제로 상용화되려면 FDA나 EMA 같은 규제기관의 승인이 필요하다. 연구진은 "현재 이 방식은 개념증명(proof of concept) 단계이며, 규제기관과 협력해 실용화를 위한 가이드라인을 만들 예정"이라고 밝혔다.


특히, 데이터 생성 방식이 투명하고 반복 가능해야 하며, 가상 환자 집단이 실제와 동일한 결론을 도출함을 증명해야 한다. 다행히 이번 연구는 이러한 조건을 상당 부분 충족했다.


---


 인공지능이 여는 임상시험의 미래


이번 연구는 한마디로 말하자면, 인공지능을 이용해 임상시험의 비용을 줄이고, 사람의 참여 부담을 낮출 수 있다는 가능성을 증명한 사례다. 단순히 통계적 보조도구가 아닌, *제 시험 설계의 일부를 담당하는 가상 환자 생성기가 등장한 것이다.


앞으로는 제네릭 약 뿐 아니라 다양한 임상시험에서도 이 기술이 적용될 수 있을 것이다. 인공지능이 만든 가짜 사람, 진짜 사람을 대신하다니. 약물 임상시험의 세계도 이제 확실히 새로운 국면에 접어들고 있다.


---

**출처 논문**

Nikolopoulos, A.; Karalis, V.D.

*Artificial Intelligence Meets Bioequivalence: Using Generative Adversarial Networks for Smarter, Smaller Trials.* Mach. Learn. Knowl. Extr. 2025, 7, 47.