AI와 임상실험실 데이터로 한 번에 10대 암 잡는다: 저비용·비침습적 ‘클린라보믹스’ 범암종 스크리닝 시대 열렸다




최근 암 발병률은 고령화와 인구 증가로 꾸준히 상승하고 있다. 2020년 전 세계에서 유방암, 방광암, 대장암, 식도암, 위암, 간암, 폐암, 췌장암, 전립선암, 갑상선암 10종이 전체 신규 암의 62.2%, 사망의 66.6%를 차지했다. 암은 조기 발견 시 완치율이 높지만, 현행 스크리닝 기법(조직검사·내시경·저선량 CT 등)은 침습적이거나 비용·방사선 노출의 부담이 크다.


이런 문제를 해결하기 위해 ‘클린라보믹스(clinlabomics)’라는 개념이 제안됐다. 혈액·체액 등 임상검사 데이터를 AI로 분석해 체계적·비침습적 암 스크리닝에 활용하자는 아이디어다. 최근 장쑤성 소재 한 병원에서 실시된 연구는, 이러한 클린라보믹스 접근법을 활용해 저비용·고효율의 범암종(pan-cancer) 검출·분류 모델을 개발했다. 연구팀은 ‘CACI(Clinlabomics Assisted for Cancer Identification)’라는 지능형 시스템을 고안해 2011년부터 2020년까지 수집된 1만9199건(암 환자 1만152×, 비암 환자 9047×)의 임상검사 데이터를 분석했다.


검출 모델

우선 혈액 일반검사 결과(적혈구·백혈구·혈소판 분포지표 등 21개)와 성별·연령을 이용한 암 vs. 비암 이진 분류 모델을 구축했다. 앙상블 기반 트리 모델(랜덤 포레스트·GBM·XGBoost 등 7종)을 블렌딩해 메타 모델(랜덤 포레스트)로 결합한 결과, 외부 검증 세트에서 민감도 90.39%, 특이도 82.41%, AUC 0.9373을 달성했다.


분류 모델

암 의심군을 대상으로 혈액 생화학(γ-GGT·ALP·DBIL 등), 소변·대변 검사, 종양표지자(CEA·PSA·AFP·CA19-9 등) 등 총 79개 지표 중 상위 34개를 선별해 10개 암종(유방암·방광암·대장암·식도암·위암·간암·폐암·췌장암·전립선암·갑상선암)을 구분하는 다중 클래스 분류 모델을 구축했다. 최종 정확도는 72.57%로, 가볍고 비용 부담 없는 임상검사만으로도 유의미한 구분 능력을 보였다.


연구 의의 및 전망

이번 연구는 일반 병원에서 흔히 시행하는 혈액·생화학·소변·대변·종양표지자 검사를 기반으로, 고가의 유전체 분석 장비나 방사선 노출 없이 다종암을 탐지·분류할 수 있음을 증명했다. 대규모(1만9000명) 데이터로 비암성 질환(400종)까지 포함해 모델 일반화 능력을 높였고, 웹 기반 서비스(http://cppdd.cn/CACI/)로임상 활용 가능성을 확보했다.


향후 다기관·다인종 데이터를 추가해 성능을 더욱 검증하고, 암·비암 감별부터 조직·장기 예측까지 단계별 최적화가 기대된다. 조기 암 스크리닝의 비용·위험 부담을 획기적으로 낮춰 의료 접근성을 개선하고, 환자의 삶의 질을 높일 것으로 보인다.



출처논문:

Zhang, B., Li, L., Cheng, L., Liu, Y., Liu, Z., Wu, J., Zhang, P., Wang, J., Zhang, D., & Li, S. (2025). Clinlabomics‐Enabled Blending Ensemble Learning for Low‐Cost Pan‐Cancer Detection and Classification Using Routine Clinical Laboratory Data. Advanced Intelligent Systems, 2500247.