목이 아픈 사람들 사이에, 인공지능이 끼어들었다
나이가 들수록 목이 뻐근하고 팔이 저린 사람이 늘어난다. 병원에 가면 “목 디스크” 혹은 “퇴행성 경추증”이라는 말을 듣곤 한다. 의사는 MRI 사진을 보여주며 어디가 좁아졌는지, 신경이 얼마나 눌리는지를 설명한다.
문제는 이 설명이 의사마다, 심지어 같은 환자를 두고도 제각각일 수 있다는 점이다. 누군가는 “심하다, 수술을 고려해야 한다”고 말하고, 다른 이는 “그 정도면 경미하다, 경과를 보자”고 말한다.
만약 이 애매함을 줄여줄 ‘공정한 심판’이 있다면 어떨까?
싱가포르 국립대병원과 컴퓨터공학 연구진이 바로 그 역할을 맡을 인공지능을 만들었다. 경추(목) MRI를 여러 방향으로 한 번에 읽어, 신경이 얼마나 눌려 있는지 자동으로 등급을 매기는 딥러닝 모델이다. 그리고 이 모델은 실제 척추외과 의사와 영상의학과 의사들과 정면 대결을 벌였다.
그 결과는? 꽤 놀랍다. 내부 시험에서는 대부분의 항목에서 인공지능이 인간 전문가들을 앞섰다.
MRI를 ‘위에서, 옆에서’ 동시에 보는 똑똑한 모델
먼저 이 병의 정체부터 짚고 가자.
퇴행성 경추증은 쉽게 말해, 목뼈와 디스크가 나이를 먹으면서 닳고 변형되면서 신경이 눌리는 상태다. 목에서 나오는 신경은 크게 둘로 나눠 볼 수 있다.
- 척수 자체가 지나가는 척추관(스파이널 캐널)
- 양옆으로 팔로 뻗어 나가는 신경이 빠져나가는 신경공(포라미나)
좁아지는 위치와 정도에 따라 증상이 다르고, 수술 여부도 달라진다. 그래서 MRI에서 “어느 높이의 디스크에서, 척추관과 신경공이 몇 단계로 좁아졌는지” 꼼꼼하게 보게 된다.
MRI에는 두 가지 시선이 있다
의사들이 보는 경추 MRI는 크게 두 방향이다.
- 시상면(sagittal): 옆에서 목 전체를 길게 1장으로 보는 사진
- 축면(axial): 목을 얇게 슬라이스처럼 한 단면씩 자른 사진
시상면은 전체적으로 어느 레벨이 가장 심하게 눌려 있나를 한눈에 볼 수 있고, 축면은 양쪽 신경공이 얼마나 좁은지를 자세히 보는 데 유리하다.
멀티플래너(multiplanar) 모델 등장
지금까지 발표된 딥러닝 연구들은 주로 축면 사진만 분석했다. 이번 연구팀은 한 단계 더 나아갔다. 축면에 더해 시상면까지 함께 학습하는 ‘멀티플래너’ 모델을 만든 것이다.
연구진이 만든 모델의 구조는 간단히 요약하면 다음과 같다.
- ResNet50 CNN으로 특징을 추출
- 트랜스포머(transformer)로 특징 간 관계를 분석
- 척추관·신경공 위치를 자동 탐지
- 0~3등급 협착 단계 분류
하나의 정답과 여러 후보를 비교하며 학습하는 최신 전략을 적용해 의료 영상의 난제를 해결하는 데 도움이 되도록 했다.
어떤 데이터로 학습했나?
- 학습·검증: 648건
- 내부 테스트: 75건
- 외부 테스트: 75건
라벨링은 6명의 영상·척추 전문의가 참여해 만들었고, 최종 정답은 근골격 영상 전문의 2명의 합의 결과다.
실제 의사와 붙여 보니… “의외로 목 디스크는 AI가 더 잘 본다?”
1. 협착 부위를 놓치지 않는 능력: 90~99%
AI의 리콜(놓치지 않는 비율)은 척추관에서 95~99%, 신경공에서 약 89%로 나타났다.
2. 등급 일치도: 카파값 0.8대, 전문가보다 높다
AI와 정답의 일치도는 다음과 같다.
- 축면 척추관: 0.80
- 시상면 척추관: 0.83
- 축면 신경공: 0.81
모든 항목에서 인간 전문가보다 더 높은 수치를 보였다.
3. 외부 병원 MRI에서는?
카파값은 약간 하락했지만 여전히 준수한 성능을 보여 주었다.
- 척추관(시상): 0.77
- 척추관(축면): 0.76
- 신경공: 0.68
AI 판독이 실제 진료에서 가져올 변화
1. 응급 환자 자동 식별
AI는 한 환자 MRI를 0.063초 만에 판독해 ‘심한 협착’을 즉시 표시할 수 있다.
2. 의사 간 판단 편차 감소
척추외과와 영상의학과 사이의 판독 기준 차이를 좁혀 주는 ‘공통 언어’ 역할을 한다.
3. 전체 경추를 한눈에 보여주는 자동 지도
시상면+축면을 함께 분석해 어느 레벨이 가장 문제가 큰지 자동으로 시각화한다.
아직 넘어야 할 산들
- 데이터 불균형(심한 협착 사례 부족)
- 정답 라벨의 한계(사람의 판단 기반)
- 더 다양한 병원·인종·기기에서의 추가 검증 필요
그럼에도 이번 연구는 분명한 메시지를 던진다.
“경추 MRI를 여러 방향에서 자동으로 읽어, 사람보다 일정하게 잘 보는 AI가 가능하다.”
앞으로 AI는 의사를 대체하는 존재라기보다, 영상 판단 기준을 표준화해 진료팀 전체가 같은 그림을 보게 해주는 ‘디지털 기록원’이 될 가능성이 크다.
출처
Lee, A., Wu, J., Liu, C., Makmur, A., Ting, Y. H., Lee, Y. J., Ong, W., Kuah, T., Huang, J., Ge, S., Teo, A. Q. A., Beh, J. C. Y., Lim, D. S. W., Low, X. Z., Teo, E. C., Yap, Q. V., Lin, S., Tan, J. J. H., Kumar, N., Ooi, B. C., Quek, S. T., & Hallinan, J. T. P. D. (2025). Transformer-based deep learning for multiplanar cervical spine MRI interpretation: Comparison with spine surgeons and radiologists. AI, 6, 308. https://doi.org/10.3390/ai6120308
