"빈혈인가? 유전병인가? 혈액 속 단서로 구분하는 새 알고리즘 등장"
아이처럼 피곤해 보이는 사람, 혹시 단순한 빈혈이 아닐 수도 있다!
이라크 바스라 대학 연구진이 개발한 ‘바스라 점수(Basrah Score)’는 일반적인 혈액 검사 수치만으로 철결핍성 빈혈(IDA)과 베타 지중해빈혈 보인자(BTT)를 정확히 구별해낸다. 인공지능의 힘을 빌린 이 진단 도구는 기존 방식보다 정확도도 높고, 비용도 훨씬 적게 든다.
빈혈의 두 얼굴: 철분 부족 vs. 유전적 요인
빈혈은 전 세계 16억 명이 겪고 있는 흔한 질병이다. 그중 절반 이상은 철이 부족해서 생기는 '철결핍성 빈혈(IDA)'이지만, 유전적 요인으로 생기는 '베타 지중해빈혈 보인자(BTT)'와 외형상 거의 차이가 없다. 둘 다 피로감, 창백한 얼굴, 숨 가쁨 같은 증상을 보이고, 혈액 검사에서도 적혈구가 작고 색이 옅은 '소구성 저색소성 빈혈' 형태로 나타난다.
하지만 치료는 완전히 다르다. IDA는 철분 보충으로 회복되지만, BTT는 철분을 줘봐야 효과가 없고 오히려 해로울 수도 있다. 특히 BTT는 유전적 질환으로, 양쪽 부모가 보인자일 경우 자녀가 중증 지중해빈혈에 걸릴 수 있어 결혼 전 진단이 중요하다.
그런데 이 둘을 정확히 구분하는 건 생각보다 쉽지 않다. 기존에 사용되던 여러 진단 공식들(멘처 지수, 이흐사니 지수 등)은 인구나 환경에 따라 정확도가 들쭉날쭉했고, 특히 여성이나 어린이, 혹은 두 질환이 동시에 있는 경우에는 거의 무용지물이었다.
혈액 속 힌트를 AI가 해석하다
바스라 대학 연구팀은 이 복잡한 문제를 기계학습(머신러닝)을 이용해 풀기로 했다. 그들이 고안한 '바스라 점수(Basrah Score)'는 기존 수학 공식을 넘어, 수천 개의 혈액 데이터를 학습한 알고리즘이 직접 진단 기준을 만들어낸 모델이다.
사용한 기법은 '엘라스틱넷 로지스틱 회귀(ENLR)'라는 머신러닝 알고리즘이다. 이 방식은 기존 변수들 간에 복잡하게 얽혀 있는 관계(다중공선성)를 자동으로 조정하면서도, 모델의 해석 가능성을 유지하는 데 강점을 갖고 있다.
연구진은 2017년부터 2020년까지 이라크 바스라 암혈액센터에서 수집한 2,120명의 혈액 데이터를 활용했다. 이 중 1,080명은 IDA, 1,040명은 BTT였다. 환자의 성별, 나이, 헤모글로빈 수치(Hb), 적혈구 수(RBC), 평균 적혈구 용적(MCV), 평균 혈색소량(MCH), 평균 혈색소 농도(MCHC) 등 7가지 주요 수치를 기반으로 모델을 학습시켰다.
기존 진단 공식을 압도한 성능
그 결과는 눈부셨다. 바스라 점수는
- 정확도 96.7%
- 민감도(진짜 IDA를 잘 찾는 능력) 95.0%
- 특이도(진짜 BTT를 잘 걸러내는 능력) 98.6%
- AUC(전체 판별력) 0.99
기존 공식들, 예를 들어 멘처 지수의 정확도는 고작 45%, Sirdah 지수도 53%에 그쳤다. 어떤 공식은 아예 한쪽 질환을 전혀 구분하지 못하는 수준이었다. 심지어 높은 민감도를 보여도, 반대로 특이도가 0%인 경우도 있었다. 반면 바스라 점수는 균형 잡힌 성능을 보여줬다.
혈액검사 하나로 가능한 빠르고 저렴한 진단
바스라 점수는 일반적인 혈액검사(CBC) 결과만으로도 계산 가능하다. 복잡한 유전자 검사나 고가의 장비가 없어도 된다. 특히 의료 자원이 부족한 지역이나 1차 진료 환경에서 활용도가 높다.
연구진은 이 알고리즘을 기존 혈액분석기(RBC Analyzer)에 탑재하거나, 웹 인터페이스로 구축하면, 의사들이 손쉽게 사용할 수 있을 것이라고 밝혔다. 또한 SHAP 분석을 통해 어떤 혈액 수치가 진단에 가장 크게 기여했는지도 명확히 밝혀, 임상가들이 그 결과를 신뢰할 수 있도록 했다.
다음 목표는 ‘현장 적용’
물론 한계도 있다. 이 모델은 한 지역(이라크 바스라)의 데이터만을 사용해 만들어졌기에, 다른 지역이나 인종, 연령대, 또는 복합질환이 있는 환자에게는 여전히 검증이 필요하다. 연구팀도 이를 인정하며, 앞으로 데이터 수집 대상을 더 넓히고, ferritin 수치나 유전자 정보 등 추가 정보를 포함시켜 모델을 보완할 계획이다.
AI 기술이 의료 현장에서 점점 자리를 잡고 있는 요즘, 바스라 점수는 '인공지능이 어떻게 실제 진료에 도움을 줄 수 있는가'에 대한 하나의 답이 될 수 있다. 복잡한 질환이라도 단순한 혈액 수치만으로, 정확히 구별해낼 수 있는 시대. 그 시작점이 이 논문이 될지도 모르겠다.
출처
Mahmood, S. A., Khalaf, A. A., & Hamadi, S. S. (2025). Basrah Score: a novel machine learning-based score for differentiating iron deficiency anemia and beta thalassemia trait using RBC indices. Frontiers in Big Data, 8, 1634133. https://doi.org/10.3389/fdata.2025.1634133