신용카드 사기, AI가 막는다 – ‘하이브리드 특성 선택’의 비밀

 



온라인 결제의 시대가 열리면서, 편리함 뒤에는 그림자가 따라왔다. 바로 ‘신용카드 사기’다. 2020년 전 세계 신용카드 사기 피해액은 약 285억 달러. 앞으로 10년간 누적 피해액은 4,000억 달러를 넘을 것으로 전망된다. 이쯤 되면 단순한 범죄 문제가 아니라, 글로벌 경제의 혈액 순환을 위협하는 대형 질병이라 해도 과언이 아니다.


최근 발표된 한 연구가 이 문제 해결에 새로운 가능성을 제시했다. 방글라데시, 말레이시아, 호주 등 국제 연구진이 개발한 ‘하이브리드 특성 선택(Hybrid Feature Selection) 프레임워크’가 바로 그 주인공이다.


문제는 ‘불균형 데이터’

신용카드 사기 탐지는 겉보기엔 단순하다. 거래 데이터 중 정상 거래와 사기 거래를 구분하면 된다. 하지만 현실은 정반대다. 사기 거래 비율은 대부분 1% 미만, 심지어 0.17%에 불과한 경우도 있다. 이런 불균형 데이터에서는 AI가 정상 거래에만 ‘올인’하는 경향이 생겨, 사기를 제대로 잡아내지 못한다.


게다가 신용카드 데이터는 방대하고 복잡하다. 거래 시간, 금액, 위치, 사용자 패턴… 수십 개의 변수 중 어떤 것이 사기 탐지에 결정적으로 중요한지 가려내는 것 자체가 어렵다. 기존 연구들은 주로 한두 가지 성능 지표만 보고 모델을 평가하거나, 데이터 불균형 문제를 충분히 해결하지 못했다.



세 가지 무기를 합친 ‘하이브리드’ 전략

연구팀이 제시한 해법은 세 가지 특성 선택 기법을 결합하는 것이었다.

  1. 피어슨 상관계수(Pearson Correlation) – 서로 너무 닮은 변수(상관계수 0.95 이상)를 제거해 중복을 줄인다.
  2. 정보 이득(Information Gain) – 각 변수가 ‘사기 여부’를 얼마나 잘 구분하는지 평가한다.
  3. 랜덤 포레스트 중요도(Random Forest Importance) – 트리 기반 모델이 뽑은 변수 중요도를 활용한다.

이렇게 세 가지 필터를 통과한 변수들을 ‘합집합’으로 묶으면, 불필요한 데이터는 줄이고 중요한 신호는 놓치지 않는 특성 집합이 완성된다.


데이터 다섯 세트를 정복하다

연구팀은 유럽 카드 결제 데이터(2013·2023년), 독일·호주 신용카드 거래, 그리고 추상화된 소규모 데이터까지 총 다섯 개의 서로 다른 데이터셋을 실험에 사용했다. 데이터 규모와 불균형 정도도 제각각이었지만, 모두 동일한 절차를 거쳤다.

  1. 전처리 – 결측치 제거, 범주형 변수 인코딩, 거래 금액 정규화
  2. 불균형 해결 – SMOTE, ADASYN, SMOTE-ENN 등 오버샘플링 기법 적용
  3. 하이브리드 특성 선택 – 중복 제거 후 핵심 변수 선별
  4. 머신러닝 학습 – 랜덤포레스트, 엑스트라트리, XGBoost, CatBoost, AdaBoost, 그리고 이들을 조합한 앙상블
  5. 성능 평가 – 정확도, 정밀도, 재현율, F1 스코어, AUC, MCC 총 6개 지표로 검증



성과는? 숫자가 말해준다

가장 극단적으로 불균형한 유럽 2013 데이터(사기 비율 0.17%)에서, ADASYN+Extra Trees 조합은 정확도 99.97%, AUC 98.72%라는 압도적인 성적을 기록했다.


완전히 균형 잡힌 유럽 2023 데이터에서는 정확도 99.99%, AUC 100%에 도달했다.

흥미로운 점은 데이터셋마다 ‘최고 성능 조합’이 달랐다는 것이다.

  • 호주 데이터: AdaBoost가 최고 (정확도 89.86%)
  • 독일 데이터: 앙상블 다수결 방식이 최고 (정확도 84%)
  • 추상 데이터: 앙상블과 AdaBoost가 비슷하지만 앙상블이 F1 점수에서 근소 우위

이는 연구팀의 방법이 ‘한 가지 모델만 밀어붙이는 전략’이 아니라, 데이터 특성에 따라 유연하게 대응한다는 것을 보여준다.


숫자 뒤의 ‘이유’를 찾다 – SHAP 분석

AI 모델이 왜 그런 판단을 내렸는지 설명하는 건 금융권에서 매우 중요한 문제다. 연구팀은 SHAP(Shapley Additive Explanations) 기법을 활용해 변수의 중요도를 시각화했다. 거래 금액, 거래 유형, 거래 시간, 사용자 연령 등이 모든 데이터셋에서 꾸준히 중요한 변수로 나타났다. 이 덕분에 금융기관은 모델의 판단 근거를 납득하고, 규제 기관에도 설명할 수 있다.


의미와 미래

이 연구가 제안한 하이브리드 특성 선택 프레임워크는 단순히 성능을 높이는 기술이 아니다. 실제 금융권에서 실시간 사기 탐지 시스템에 적용할 수 있는 현실적이고 적응력 있는 도구다. 연구팀은 앞으로 딥러닝, 생성형 적대 신경망(GAN), 연합 학습(Federated Learning) 등을 결합해 더 강력하고 프라이버시 친화적인 시스템으로 발전시킬 계획이다.


다시 말해, 이 기술은 ‘범죄와의 전쟁’에서 금융권이 쓸 수 있는 강력한 방패이자 창이다.




출처:
Siam, A. M., Bhowmik, P., & Uddin, M. P. (2025). Hybrid feature selection framework for enhanced credit card fraud detection using machine learning models. PLOS ONE, 20(7), e0326975.