AI가 흉부 엑스레이를 읽는다

의료진과 AI가 함께 흉부 X-ray 영상을 판독하는 모습.AI와 인간이 협업하여 폐 질환을 분석하는 미래형 진단 현장. 6개 폐 구역이 분할된 고해상도 영상 위로 의료의 신뢰성과 기술의 정밀성이 교차한다.



폐질환 조기 진단을 위한 ViT 기반 디지털 판독 기술


중국의 산업현장에서는 지금도 수많은 노동자들이 광산, 건설, 제조업 현장에서 미세먼지를 마시며 일하고 있다. 그 결과로 나타나는 대표적인 직업병이 바로 진폐증(Pneumoconiosis).


이 질환은 폐 섬유화가 진행되며 호흡기능이 악화되는 만성 질환으로, 일단 발병하면 치료가 거의 불가능하다. 따라서 가장 중요한 건 조기 진단.


문제는 이것이 생각보다 어려운 진단이라는 점이다.

의사도 놓치기 쉬운 이 질환의 판독을 위해, 최근 중국 연구팀이 Vision Transformer(ViT) 기반 인공지능 모델을 활용해 디지털 흉부 엑스레이(DR) 판독 자동화에 성공했다.


---


 진폐증, 얼마나 흔하고 위험한가?


2021년 기준, 중국의 직업병 중 진폐증은 전체의 76.6%를 차지하며 1위를 기록했다.

보고된 환자만 91만 명, 실제 환자 수는 이보다 훨씬 많을 것으로 추정된다.


진폐증의 진단은 국제노동기구(ILO)의 기준에 따라 폐의 좌우, 상중하 6개 부위를 나눠 각 부위의 ‘혼탁도’와 ‘덩어리 크기’를 판별해야 한다.

하지만 이 과정은 고도로 숙련된 영상의학 전문의가 아니면 오진 가능성이 높고, 특히 0기~1기 초기 단계는 육안으로도 거의 구분이 불가능하다.


진폐증 환자의 DR 영상


---


ViT 모델이란?


이번 연구의 주역은 기존의 CNN이 아닌 Vision Transformer (ViT).


* 이미지를 16×16 패치로 나누고

* 각 패치를 벡터화한 후

* self-attention 기법으로 전역적 패턴을 학습한다.


즉, CNN처럼 국소적 특징만 보는 것이 아니라, 폐 전체의 구조적 변화나 섬유화 패턴을 ‘넓은 시야’에서 포착할 수 있는 장점이 있다.


---


어떻게 훈련시켰나?


1. U-Net으로 폐 영역 자동 분리


   * 좌우 폐를 정확히 추출하고, 각 폐를 상·중·하 3구역으로 나눔

   * 총 6개 구역(왼쪽 상, 중, 하 / 오른쪽 상, 중, 하)


2. Canny Edge + Region Segmentation


   * 윤곽선 기반으로 세밀한 폐 분할


3. 데이터 증강


   * Salt & Pepper 노이즈

   * 이미지 회전, 밝기 조절, 좌우 반전 등

   * 특히 데이터가 부족한 2기, 3기 환자 데이터를 집중 보완


4. 훈련 데이터


   * 총 934건의 DR 이미지

   * 0기(256명), 1기(545명), 2기(86명), 3기(28명), 3+기(19명)


이 데이터를 ResNet50과 ViT에 각각 학습시켜 **성능을 비교**했다.


---


 결과는 어땠을까?




거의 비슷해 보이지만, 일관성과 일반화 능력에서는 ViT가 더 우수했다.


* ResNet은 훈련 데이터에서는 성능이 빠르게 오르지만,

  테스트에서는 불안정한 손실 변동을 보이며 과적합 조짐

* ViT는 손실이 점진적으로 감소하면서도 안정적으로 수렴, 테스트와 훈련 손실이 거의 일치


---


구역별 분류까지 가능한가?


기존의 연구들은 진폐증을 단순히 ‘있다/없다’ 또는 0~3기 단순 분류로만 다뤘다.

하지만 이 연구는 6개 구역에 대해 각각 독립적으로 판별한 후,


* 가장 심각한 구역의 등급을 전체 등급으로 설정하는 임상적 진단 프로세스를 반영했다.


이를 통해 AI는 진짜 의사처럼,

“왼쪽 상부에는 2기 병변, 오른쪽 중부에는 1기 병변이 있음. 따라서 전체 등급은 2기”

라는 식의 정밀한 판단을 할 수 있게 되었다.


---


무엇이 정확도를 끌어올렸나?








→ 폐 세분화 + 증강 조합이 정확도를 28% 이상 향상시켰고,

→ 특히 ViT는 배경 노이즈를 억제하고 병변 위치를 더 정확히 포착함


---


ViT의 장점은?


* 국소 + 전역 패턴 동시 학습

* 위치 인코딩(Positional Encoding)으로 병변 분포까지 인식

* 적은 데이터에도 높은 일반화 성능

* 전통적 CNN보다 섬세한 질환 판별 가능


---


 하지만 아직 부족한 점은?


* 비교한 모델이 ViT와 ResNet만이라 다양한 모델 비교는 부족

* AI가 제시한 구역별 등급은 최종 진단이 아니라,

  → 의사의 최종 판단을 보조하는 참고 정보 수준임

* 데이터가 여전히 적음 (특히 고등급 환자 부족)

  → 향후 더 많은 임상 데이터 필요


---


결론: X-ray 판독, AI가 먼저 보고 의사가 판단한다


이 논문은 단순히 ViT가 ResNet보다 성능이 좋다는 것을 보여준 게 아니다.

진폐증처럼 장기적이고 미묘한 폐 변화를 구체적인 구역 단위로 정량 분석하면서,

의사의 업무를 보조하고, 조기 진단을 가능하게 하는 임상 보조형 AI 진단 모델의 가능성을 증명했다.


“AI가 단순히 질병을 예측하는 것이 아니라,

의사의 판단을 구조화하고 빠르게 지원할 수 있다면?”


이 연구는 그 질문에 매우 현실적인 답을 내놓았다.


---


키워드:

#진폐증 #VisionTransformer #흉부엑스레이AI #의료영상분석 #AI진단보조


---


출처 논문

Wei, Q., Song, W., Fu, L., Lei, Y., & Wang, Q.

*Digital Radiography-Based Pneumoconiosis Diagnosis via Vision Transformer Networks*.

Journal of Artificial Intelligence, 2025, 7.