미래의 실명 위험, AI가 예측한다

 


TV-LSTM으로 본 노인성 황반변성(AMD) 진행 예측의 혁신

노인성 황반변성(Age-related Macular Degeneration, AMD)은 선진국에서 실명의 주요 원인으로 꼽히며, 특히 고령 인구에서 급격히 증가하고 있다. 중심 시력을 담당하는 망막의 중심부인 황반(macula)에 퇴행성 변화가 생기며, 후기 단계에서는 회복이 거의 불가능한 시력 손실로 이어진다. 현재까지도 치료는 진행 속도를 늦추는 것에 머무르고 있으며, 조기 진단과 예측이 매우 중요하다. 이러한 배경에서 등장한 것이 바로 본 논문에서 소개하는 "TV-LSTM(Time-Varied Long Short-Term Memory)" 모델이다.



연구 배경: 시계열 이미지와 유전정보를 결합하다

기존의 AMD 예측 연구들은 대부분 단일 시점의 안저 영상 또는 유전자 정보를 기반으로 했다. 그러나 질병은 시간의 흐름에 따라 진행되며, 이를 반영하지 않는 예측은 정확도에 한계가 있다. 또 하나의 문제는, 실제 병원 방문 간격은 일정하지 않다는 점이다. 기존 LSTM(Long Short-Term Memory) 기반 모델들은 시간 간격이 고정되어 있다고 가정하기 때문에 실제 데이터를 효과적으로 활용하지 못한다는 제약이 있었다.

이 논문은 이러한 문제를 해결하고자, 시간 간격이 불규칙한 데이터를 처리할 수 있도록 고안된 "TV-LSTM"이라는 새로운 딥러닝 모델을 제안한다. 또한, 이미지 데이터만이 아니라 유전적 변이 정보까지 결합해 예측 정확도를 극대화했다.




방법론: Transformer + LSTM의 절묘한 조합

TV-LSTM은 크게 두 가지 구성 요소로 이루어진다. 첫 번째는 안저 이미지에서 특징을 추출하기 위한 Transformer 기반의 사전학습 모델인 RetFound다. 이 모델은 160만 장 이상의 망막 이미지로 사전 학습되었으며, 이를 통해 고차원적이고 일반화된 이미지 임베딩을 생성한다. 두 번째는 시간 간격을 반영할 수 있도록 설계된 LSTM 계열의 시계열 모델인 TV-LSTM이다. 기존 LSTM과 달리 각 시점의 방문 정보에 시간 가중치(time weight)를 부여해, 최근의 정보에 더 큰 영향을 주도록 설계되었다.

한 가지 흥미로운 점은 이 연구가 interpolation(보간법)을 사용하지 않았다는 것이다. 새로운 시점을 만들어 내는 것이 아니라, 기존 데이터를 시간 거리의 비율에 따라 정규화함으로써, 실제 임상 데이터의 시간 불균형성을 효과적으로 반영했다.



데이터: AREDS의 방대한 시계열 안저 이미지와 유전자 정보

연구에 사용된 데이터는 미국 국립안연구소(NEI)의 AREDS(Age-Related Eye Disease Study)에서 수집한 4,628명의 환자 데이터를 기반으로 한다. 이들은 최대 13년에 걸친 추적 관찰 데이터를 보유하고 있으며, 약 18만 장에 이르는 안저 사진과 유전자형 정보를 포함한다. 이는 단일 연구로는 매우 방대한 양으로, 딥러닝 모델 학습에 최적의 조건을 제공한다.

이미지 전처리는 macula 중심 영역을 잘라내고 224x224 픽셀로 정규화하는 방식으로 수행되었으며, AREDS의 수작업 라벨링을 기준으로 단계별 AMD 진행 정도를 이진 분류(후기 AMD vs. 그 외)로 재분류하였다.




주요 결과: AUC-PR 0.8591, 기존 모델을 압도하다

TV-LSTM 모델은 4번의 병원 방문 데이터를 기반으로 2년 이내 후기 AMD 진행을 예측하는 실험에서 AUC-ROC 0.9479, AUC-PR 0.8591의 성능을 기록했다. 이는 Yan et al.의 기존 모델(AUC-ROC 0.85)이나 Ganjdanesh 등의 모델(AUC-ROC 0.896)을 모두 뛰어넘는 결과다. 특히 AUC-PR 점수는 불균형 데이터에서 모델의 실제 예측력을 평가하는 데 더 적합하다는 점에서 의미가 크다.

개인적으로 주목할 만한 점은, 방문 횟수가 많아질수록 예측 정확도가 향상되지만 일정 시점 이후에는 오히려 오래된 정보가 노이즈로 작용해 성능이 저하된다는 분석이다. 이는 시계열 예측에서 매우 현실적인 문제이며, TV-LSTM의 시간 가중치가 그 해결책으로 제시될 수 있음을 시사한다.



잠재적 확장성: OCT, AO 영상으로의 확장 가능성

현재 모델은 컬러 안저 사진을 기반으로 하지만, 향후에는 더 정밀한 영상기법인 OCT(광간섭단층촬영)나 AO(Adaptive Optics)로 확장될 가능성도 있다. 이들 영상은 세포 수준의 구조 변화까지 포착할 수 있기 때문에, TV-LSTM이 제공하는 시간 기반 예측의 정확도는 더욱 향상될 수 있다. 단, 이를 위해서는 대규모의 정제된 시계열 데이터 확보가 필수적이다.




임상적 시사점과 한계

TV-LSTM은 환자의 마지막 몇 차례 안과 방문 기록만으로도 향후 2년 내 실명 위험을 높은 정확도로 예측할 수 있다. 이는 조기 개입과 맞춤형 치료의 가능성을 열며, 노인성 황반변성의 관리 패러다임을 근본적으로 바꿀 수 있다.

하지만 이 모델이 실제 임상에 적용되기 위해서는 몇 가지 과제가 남아 있다. 특히 외부 독립 검증 코호트의 부재는 모델 일반화에 있어 큰 제약이다. 또한 유전체 데이터를 활용한다는 점에서 개인정보 보호와 비용 문제도 함께 고려되어야 한다.



결론: 시간의 흐름을 읽는 AI, 그 가능성은 무궁무진하다

이번 연구는 단순히 정확한 예측 모델을 제시하는 데 그치지 않는다. "시간의 흐름"이라는 현실 데이터를 정확히 반영하고, 이를 통해 AI 예측 모델의 실제 활용 가능성을 한 단계 끌어올렸다는 점에서 큰 의미를 가진다. 향후에는 안과뿐만 아니라 암, 신경질환, 만성질환 등 시간에 따른 진행이 중요한 질환 전반에 이 접근법이 응용될 수 있을 것이다.



출처논문: Zhang, J., Zhao, C., Zeng, L., Huang, H., Ding, Y., & Chen, W. (2025). *TV-LSTM: Multimodal Deep Learning for Predicting the Progression of Late Age-Related Macular Degeneration Using Longitudinal Fundus Images and Genetic Data*. AI Sensors, 1(1), 6. https://doi.org/10.3390/aisens1010006