스마트폰과 인공지능으로 시력 검사를? 저소득 국가를 위한 '딥러닝 시력 스크리닝' 기술의 가능성

 




서론: 안경 하나로 바뀌는 삶, 그러나 그것조차 어려운 현실

전 세계적으로 약 15억 명이 시력 문제를 겪고 있으며, 그 중 1억 5천만 명은 단순한 굴절 이상(근시, 원시 등)이 교정되지 않은 상태로 살아가고 있다. 안경이나 콘택트렌즈 같은 저비용 치료법이 있음에도 불구하고, 많은 이들이 시력 교정을 받지 못하는 이유는 '진단의 부재' 때문이다. 특히 저소득 국가에서는 전문 인력 부족, 진단 장비 부족, 인식 부족 등의 복합적인 요인으로 인해 시력 검사가 쉽지 않다.

이러한 문제를 해결하기 위해 최근 한 연구진이 매우 흥미로운 접근법을 제안했다. 스마트폰 카메라로 눈 사진을 찍고, 인공지능(CNN: 합성곱 신경망)이 이를 분석해 굴절 이상을 자동으로 진단하는 시스템이다. 특히 이 연구는 동남아시아 실제 환자 데이터를 활용해, 현장 적용 가능성까지 고려했다는 점에서 주목할 만하다.


본론: 연구의 핵심 – 스마트폰과 다중 분기 CNN의 만남

1. 문제 정의와 접근 방식

연구팀은 굴절 이상을 크게 네 가지로 분류했다: 1) 유의한 근시, 2) 유의한 원시, 3) 비유의미한 굴절 이상, 4) 분류 불가. 이들을 정확히 분류하기 위해 '다중 분기 CNN (multi-branch CNN)' 구조를 제안했다. 이 구조는 이미지를 서로 다른 해상도와 시각적 관점으로 병렬 처리해, 미세한 차이를 보다 효과적으로 인식할 수 있도록 설계됐다.

2. 데이터 수집과 전처리

데이터는 인도네시아 공공 안과 병원에서 952명의 환자에게서 수집된 2,139장의 홍채 이미지로 구성됐다. 이 이미지는 어두운 방에서 스마트폰(iPhone 6s)으로 촬영되었고, 빛 반사(레드 리플렉스)의 모양에 따라 굴절 이상을 분류했다. 예를 들어, 오른쪽에 초승달 모양의 반사가 보이면 근시를, 왼쪽에 있으면 원시를 의미한다.

3. 모델 구조와 성능

총 세 가지 모델이 실험에 사용되었고, 이 중 3-분기 CNN이 최고 성능을 보였다. 정확도 91%, 정밀도 96%, 재현율 98%, AUC 0.9896이라는 높은 수치를 기록했다. 특히, Grad-CAM을 활용해 인공지능이 어떤 부분을 중점적으로 보았는지를 시각화함으로써, 임상 신뢰성도 확보했다.



독창적인 통찰과 비판적 고찰

1. 기술의 가능성과 실용성

이 기술의 가장 큰 장점은 '접근성'이다. 스마트폰만 있으면 어디서든 시력 검사가 가능하다는 점은, 시골 마을이나 의료 취약 지역에서도 큰 의미를 가진다. 이는 기존의 고가 장비나 훈련된 검안사가 필요한 방식과 비교해 월등한 접근성을 제공한다.

2. 데이터 편향과 일반화 한계

그러나 본 연구는 주로 말레이계 인도네시아인을 대상으로 했기 때문에, 다른 인종이나 연령대에 대한 일반화에는 한계가 있다. 이는 특히 홍채의 색상, 반사도, 안구 구조가 다양할 수 있는 글로벌 환경에서는 중요한 고려사항이다. 향후 연구에서는 다양한 인종 데이터를 포함한 다기관 연구가 필요하다.

3. 스마트폰 모델 종속성과 표준화 문제

이 연구는 iPhone 6s만을 사용해 데이터를 수집했기 때문에, 다른 기기에서는 레드 리플렉스의 위치나 밝기 등이 달라질 수 있다. 예컨대, 플래시 위치가 다른 스마트폰에서는 반사 형태가 달라질 수 있다. 따라서 실제 응용에서는 촬영 프로토콜의 표준화가 매우 중요하다.

4. 실시간 응용과 확장 가능성

모델은 TensorFlow Lite로 변환되어 모바일에서도 실시간 적용이 가능하도록 설계되었다. 이는 향후 학교, 보건소, NGO 활동 등 다양한 현장에 응용될 수 있는 가능성을 제시한다. 특히 동남아시아와 같은 안과 자원이 부족한 지역에서, 이 기술은 공공 보건에 큰 기여를 할 수 있을 것으로 기대된다.



결론: 안경보다 중요한 것은 진단

이 연구는 단순히 기술적으로 우수한 인공지능 모델을 개발했다는 것을 넘어, 실질적으로 현장 적용 가능한 시력 검사 도구를 제시했다는 점에서 의의가 크다. 스마트폰과 AI가 결합한 이 시스템은, 진단의 장벽을 낮추고 더 많은 사람들이 시력을 되찾을 수 있게 만드는 '게임 체인저'가 될 수 있다. 그러나 이를 위해서는 다양한 인종, 환경, 기기에 대한 추가 연구가 필요하며, 실제 임상 현장에서의 적용과 검증이 뒤따라야 한다.




출처논문

Syauqie, M., Patria, H., Hastono, S. P., Siregar, K. N., & Moeloek, N. D. F. (2025). Deep learning for vision screening in resource-limited settings: development of multi-branch CNN for refractive error detection based on smartphone image. Frontiers in Computer Science, 7, 1576958. https://doi.org/10.3389/fcomp.2025.1576958