AI도 헷갈린다? 뇌동맥류 진단 AI, 환경이 바뀌면 오작동
영상 품질과 AI 판독 정확도의 관계를 보여주는 연구 일러스트 |
CT 촬영에서 방사선량이나 영상 재구성 방식만 달라져도 AI는 놓치거나 잘못 판단할 수 있다. 그러나 사람 전문의는 이런 변화에도 크게 흔들리지 않았다. 도대체 이 AI는 어디서부터 삐걱댄 걸까?
뇌동맥류, 왜 중요한가?
뇌동맥류는 뇌혈관 일부가 부풀어 오르는 질환으로, 전체 인구의 2~3%가 앓고 있다. 대부분 무증상이지만, 파열 시 생명이 위험할 수 있다.
CT 혈관조영술(CTA)은 이를 빠르고 정확하게 진단하는 주요 수단이고, 여기에 AI의 활용이 점점 늘고 있다. 하지만, AI가 실제 병원 환경에서도 정확할까?
뇌 모형으로 테스트한 AI, 놀라운 허점 드러내다
독일 연구진은 고정밀 팬텀(모형 환자)을 사용해 다양한 촬영 조건(방사선량 21단계 × 영상 재구성 2가지)에서 총 126장의 CT 영상을 만들고 AI의 성능을 테스트했다.
AI가 못 본 뇌동맥류, 의사는 거의 다 봤다
AI는 전체 126건 중 117건에서 뇌동맥류를 정확히 인식했지만, 9건은 놓쳤다. 특히, 작고 드문 위치에 있는 동맥류는 거의 못 찾았다.
반면, 신경방사선 전문의들은 100% 가까운 정확도로 병변을 판독했다. 사람은 환경 변화에 강했다는 뜻이다.
방사선량과 AI의 미묘한 관계
일반적인 생각과 달리, 방사선량이 높다고 AI 성능이 무조건 좋아지는 건 아니었다. 중간 방사선량(8~14mGy)에서 가장 안정적이었고, 그 외에는 예외와 오작동이 잦았다.
AI는 훈련된 대로만 본다
FDA 기준 AI는 5mm 이상 동맥류에 초점을 맞추도록 훈련됐다. 실험에 사용된 동맥류는 4mm, 2mm였기에 AI의 관심 밖 대상이었을 가능성이 크다.
위치나 해부학적 특이성도 AI 인식률을 낮추는 요소였다. 결국 AI는 훈련된 환경 밖에서는 불안정해진다.
영상 장비 바꾸기 전에, AI도 다시 점검해야
의료진 입장에서 사소한 장비 설정 변경이, AI에게는 완전히 다른 세상이 될 수 있다. AI를 사용하는 병원은 장비 변경 시마다 성능을 재검증할 필요가 있다.
결론: AI는 만능이 아니다, 꾸준한 검증이 답이다
AI는 훌륭한 도구지만, 완벽하지 않다. 사소한 변화에 민감하게 반응하며, 사람처럼 ‘직관’을 가진 것은 아니다.
진짜 스마트한 의료는, AI를 신뢰하되 정기적으로 검증하는 것이다.
출처 논문
Goelz, L., Laudani, A., Genske, U. et al. Inconsistency of AI in intracranial aneurysm detection with varying dose and image reconstruction. Scientific Reports 15, 19921 (2025).