랜덤 포레스트 기반 머신러닝으로 바라본 위장관 암 예후 예측의 현재와 미래
서문
전 세계 암 사망 원인의 약 33%, 발병 건수의 25% 이상을 차지하는 위장관 암은 여전히 극복해야 할 난제다. 인구 고령화와 식생활 변화로 인해 2040년 위장관 암 사망자는 750만 명(58% 증가)과 560만 명(73% 증가)에 이를 것으로 예측된다(홀이 추정치).
기존의 병기(classical staging)나 종양표지자만으로는 개인별 예후를 정밀 예측하는 데 한계가 명확하다. 이에 머신러닝, 그중에서도 랜덤 포레스트(Random Forest, RF) 모델이 고차원·이질적 데이터를 통합해 예후 예측 정확도를 높일 대안으로 떠오르고 있다.
위장관 암 예후 예측의 필요성
위장관 암의 현황
- 식도암(Esophageal Cancer): 전 세계에서 8번째로 흔하면서 6번째 사망률이 높은 암으로, 5년 생존율은 20%에 불과하다.
- 위암(Gastric Cancer): 암 사망 원인 3위, 조기 진단·치료에도 높은 치명률을 유지한다.
- 대장암(Colon & Rectal Cancer): 미국에서 두 번째로 흔한 암 사망 원인이며, 서구권에서도 발병률이 급증 중이다.
전통적 통계 기법은 고차원·비선형적 변수 관계를 포착하기 어렵고, 임상현장의 다양한 변수 누락(missing data) 문제에도 취약하다. 반면 RF는 다수의 결정 트리를 앙상블해 과적합을 줄이고 중요한 변수를 추출하며, 결측치 대응 능력이 탁월하다.
랜덤 포레스트(Random Forest) 모델 개요
RF의 원리와 장점
- 앙상블 학습: 개별 트리를 랜덤 샘플링해 여러 모델을 만들고 투표 방식으로 최종 예측을 결정한다.
- 결측치 및 이상치에 강건: 데이터 전처리 과정이 덜 엄격해도 좋은 성능을 유지한다.
- 변수 중요도 평가: 각 피처(feature)의 예측 기여도를 산출해 주요 바이오마커나 임상 변수를 도출할 수 있다.
임상 데이터에의 적용
RF는 임상·유전·병리학적 데이터를 통합해 종양의 재발 위험, 생존율, 전이 가능성 등을 높은 정확도로 예측한다. 예컨대, 일부 연구에서는 생존율 예측 AUC가 0.80 이상으로 보고되었다.
체계적 문헌 검토 결과 요약
연구 선정 및 방법론
본 리뷰는 PRISMA 2020 지침을 준수해 PubMed, Scopus, Google Scholar, Web of Science를 2024년 5월 28일까지 검색했다. RAYYAN.ai를 활용한 중복 제거 및 5명의 독립 리뷰어가 1차 제목·초록, 2차 전문 검토를 수행했으며, 최종적으로 1846건 중 86건이 포함되었고, 풀텍스트 미확보 8건을 제외한 78건을 분석했다. 포함 연구의 질 평가는 QUIPS 도구로 수행하였다.
주요 연구 결과
- 예측 정확도: RF 모델은 기존 통계 모델 대비 전반적으로 5–15% 높은 예측 정확도를 보였으며, 다수 연구에서 AUC>0.80을 기록했다.
- 테이터 통합: 임상 혈액검사, 병리 슬라이드 이미지, 유전체 프로파일 등의 멀티모달 데이터를 융합해 예후 예측 성능을 향상시켰다.
- 암 종류별 성능:
- 식도암(EC): 예후 예측 AUC 평균 0.82–0.88
- 위암(GC): 전이·침윤 예측에 강점, AUC 0.85 이상
- 대장·직장암(CC/RC): 생존율 및 재발 예측에서 AUC 0.80–0.87
암 유형별 상세 예시
- 직장암(RC): 방사선화학요법 후 종양퇴축지수 예측에서 AUC 0.90 달성(200개 트리).
- 대장암(CC): 유전자 발현 데이터 기반 분류에서 RF+특성선택 기법 시 정확도·정밀도·재현율 모두 10% 이상 개선됨.
비판적 고찰 및 시사점
데이터 이질성 및 임상 적용성 문제
다양한 의료기관 간 데이터 획득 방식과 피처 변수 설정 차이로 모델 일반화가 어렵다. 후향적 연구 위주로 진행돼 실제 임상 환경에서는 예측 성능이 저하될 가능성이 크다. 향후 전향적 단일·다기관 연구 설계를 통해 외부 검증을 강화해야 한다.
해석 가능성 및 임상 수용성
RF는 비교적 해석이 용이하나, 여전히 ‘블랙박스’ 요소가 존재한다. SHAP, LIME 같은 설명 가능한 AI 기법 도입으로 주요 예측 인자를 시각화하고, 의료진의 신뢰도를 높이는 방안이 필요하다.
향후 연구 방향에 대한 제언
- 사용자 친화적 인터페이스 개발: 임상 의료진이 손쉽게 활용 가능한 웹 기반 도구나 EMR(전자의무기록) 연동 솔루션 구축
- 입력 변수 표준화: 국제 가이드라인 제정으로 변수 간 비교가능성 확보
- 하이브리드 모델 탐색: RF와 딥러닝(예: CNN) 결합해 복잡한 영상·유전체 데이터 예측력 강화
- 다기관 외부 검증 및 실제 유효성 평가: 환자 모집단 다양성 확보 및 실제 임상 흐름 중 성능 검증
개인적으로는 면역항암치료 반응 예측에 RF 모델을 적용해, PD-L1 발현·MSI 상태 같은 면역학적 변수를 통합하는 연구가 매우 흥미롭다고 본다. 이는 기존 임상 지표로 예측이 어려웠던 면역치료 성패를 사전 예측하는 데 기여할 수 있다.
결론
랜덤 포레스트 기반 예후 예측 모델은 위장관 암 환자 개개인에게 최적화된 치료 전략 수립과 생존율 향상에 기여할 유망한 도구다. 다만 데이터 이질성, 연구 설계 한계, 임상 통합성 등의 과제를 해결하기 위해 전향적·다기관 검증 연구와 설명 가능성 보강을 병행해야 한다. 향후 사용자 친화적 인터페이스와 하이브리드 AI 기법을 접목한 연구가 이루어진다면, 개인 맞춤 치료(patient-specific therapy) 시대를 앞당길 수 있을 것이다.
출처 논문:
Mohamadi, Z., Shafizadeh, A., Aliyan, Y., Shayesteh, S. F., Goudarzi, P., Khodabandeh, A., Vaghari, A., Ashrafi, H., Bahrami, O., ZarinKhat, A., Khodabandeh, Y., & Pouyan, K. (2025). The application of random forest-based models in prognostication of gastrointestinal tract malignancies: a systematic review. Frontiers in Artificial Intelligence, 8, 1517670. https://doi.org/10.3389/frai.2025.1517670