인공지능 기반 향상된 다층 퍼셉트론을 활용한 심장병 조기 진단 프레임워크

AI로 심장병을 예측하는 시대가 도래했다.


 서론


심장병은 전 세계적으로 주요 사망 원인 중 하나로, 매년 수백만 명의 생명을 앗아가고 있습니다. 심혈관 질환의 복잡성과 다양성으로 인해 조기 진단이 매우 중요한 요소로 작용하며, 이는 치명적인 결과를 줄이는 데 큰 영향을 미칩니다. 기존의 진단 방법은 의료 전문가의 수동 평가에 의존하는 경우가 많아, 일관성 부족과 오류가 발생할 가능성이 큽니다. 


인공지능(AI)과 머신러닝(ML)의 발전은 보다 정확하고 신뢰할 수 있으며 효율적인 진단을 위한 유망한 대안을 제공하고 있습니다. 본 논문에서는 심장병 진단의 정확성을 향상시키기 위해 설계된 향상된 다층 퍼셉트론(EMLP) 프레임워크를 탐구합니다. 본 연구는 EMLP 모델이 다른 기존 모델과 비교하여 얼마나 우수한 예측 성능을 보이는지 평가하며, CDC 심장병 데이터셋을 활용하여 실험을 수행하였습니다.


 관련 연구


 전통적인 방법


심장병 진단을 위한 초기 방법은 주로 통계 모델과 전문가 기반 평가에 의존했습니다. 이러한 방법에는 로지스틱 회귀, 의사결정 트리 및 간단한 규칙 기반 시스템이 포함되었습니다. 그러나 이러한 모델들은 심혈관 데이터 내의 복잡한 비선형 관계를 완전히 포착하는 데 한계가 있었습니다.


 앙상블 방법


개별 모델의 한계를 극복하기 위해 랜덤 포레스트 및 그래디언트 부스팅과 같은 앙상블 방법이 널리 사용되었습니다. 이러한 방법은 여러 의사결정 과정을 결합하여 분류 정확도를 향상시키며, 연구 결과에 따르면 앙상블 학습은 분산과 편향을 효과적으로 줄여 진단 정밀도를 높이는 데 기여했습니다.


딥러닝 접근 방식


최근의 딥러닝 발전은 심장병 탐지 정확도를 더욱 향상시켰습니다. 특히 컨볼루션 신경망(CNN)과 장단기 기억 네트워크(LSTM)는 의료 영상 분석에서 높은 효율성을 보이며, CNN과 전통적인 머신러닝 기법을 결합한 하이브리드 모델도 예측 정확도를 개선하는 데 기여하고 있습니다.


 연구 방법


 연구 방법론


본 연구에서는 여러 머신러닝 분류 알고리즘을 적용하였으며, 특히 향상된 다층 퍼셉트론(EMLP)에 중점을 두었습니다. 이 모델은 최적화된 가중치 초기화, 적응형 학습률, 드롭아웃 정규화와 같은 기술을 통합하여 과적합을 방지하고 분류 성능을 개선합니다.


 데이터셋


본 연구에서는 미국 질병통제예방센터(CDC) 데이터베이스에서 제공하는 30만 명 이상의 건강 관련 데이터를 포함하는 데이터셋을 사용하였습니다. 이 데이터셋에는 BMI, 흡연 여부, 음주 습관, 신체 활동 수준, 기존 질환 등의 다양한 위험 요인이 포함됩니다.


 데이터 전처리


데이터 전처리는 모델 정확도를 높이는 데 중요한 역할을 합니다. 누락된 값을 처리하고, 수치형 특징을 정규화하며, 범주형 변수를 숫자로 변환하는 과정이 포함됩니다. 또한, 최적의 계산 효율성을 확보하기 위해 특성 선택 기법을 활용하여 가장 관련성이 높은 속성만 유지하였습니다.


 분류 알고리즘


 의사결정 트리(DT)

트리 구조를 기반으로 데이터를 분류하는 규칙 기반 모델.


나이브 베이즈(NB)

베이즈 정리를 활용하여 심장병 발생 확률을 예측하는 확률적 분류기.


 K-최근접 이웃(KNN)

유클리드 거리 측정을 기반으로 가장 가까운 데이터 포인트의 다수를 고려하여 분류하는 방법.


 랜덤 포레스트(RF)

여러 개의 의사결정 트리를 결합하여 예측 안정성을 높이는 앙상블 학습 기법.


 서포트 벡터 머신(SVM)

최적의 초평면을 찾아 데이터를 분류하는 지도 학습 모델.


 다층 퍼셉트론(MLP)

여러 은닉층을 통해 데이터의 패턴을 학습하는 피드포워드 신경망 모델.


향상된 다층 퍼셉트론(EMLP)

기존 MLP보다 추가 은닉층, 최적화된 활성화 함수, 개선된 정규화 기법을 적용하여 성능을 향상시킨 모델.


 평가 지표


모델의 성능은 다음과 같은 주요 성능 지표를 기준으로 평가되었습니다:

- 정확도(Accuracy): 올바르게 분류된 샘플의 비율.

- 정밀도(Precision): 실제 양성 중 올바르게 예측된 양성의 비율.

- 재현율(Recall): 실제 양성 데이터 중 올바르게 분류된 비율.

- F1-점수(F1-Score): 정밀도와 재현율의 조화 평균으로, 모델 성능의 균형을 측정하는 지표.


 결과 및 논의


실험 결과, 향상된 다층 퍼셉트론(EMLP)이 정확도, 정밀도, 재현율 및 F1-점수 측면에서 모든 다른 모델을 능가하는 성능을 보였습니다. EMLP 모델은 92%의 정확도를 기록하며, 의사결정 트리(86%) 및 나이브 베이즈(84%) 모델보다 우수한 결과를 보였습니다.


또한, 본 연구는 AI 기반 진단 도구를 의료 환경에 통합함으로써 고위험 환자를 조기에 식별하고 의료 전문가의 부담을 줄이는 데 기여할 수 있음을 강조합니다.


 결론


본 연구에서 제안한 AI 기반 프레임워크는 심장병 조기 진단을 위한 매우 효율적인 방법을 제시합니다. 향상된 다층 퍼셉트론(EMLP) 모델은 기존 머신러닝 기법보다 우수한 정확도를 보이며, 임상 환경에서 가치 있는 도구로 활용될 수 있습니다.


향후 연구에서는 딥러닝 아키텍처, 실시간 데이터 처리, 클라우드 기반 의료 솔루션을 통합하여 진단 정확도를 더욱 향상시키는 방향을 고려할 수 있습니다. 또한, 설명 가능한 AI(XAI) 기법을 도입하여 머신러닝 기반 의료 진단의 투명성을 높이는 것이 중요합니다.


 참고문헌

1. Abdullah, M. (2025). "Artificial intelligence-based framework for early detection of heart disease using enhanced multilayer perceptron." Frontiers in Artificial Intelligence, 7:1539588.

2. Alghamedy, F. H., et al. (2022). "Machine learning-based multimodal computing for medical imaging for classification and detection of Alzheimer disease." Comput. Intell. Neurosci.

3. Bilal, A., et al. (2024). "Deep learning-based approach for detecting and classifying vision-threatening diabetic retinopathy." Comp. Syst. Sci. Eng.

4. Kumar, G. (2022). "Analysis of accuracy in heart disease diagnosis system using decision tree classifier." ECS Trans.

5. Shafiq, M., et al. (2023). "Smart e-health system for heart disease detection using artificial intelligence." J. Sensors.