정전, 이제는 예측할 수 있다?
전력 손실을 막기 위한 AI의 비밀 병기, ‘설명 가능한 스택 앙상블 모델’의 등장
전기가 갑자기 끊기는 경험, 누구나 한 번쯤은 겪어봤을 것이다. 특히 여름철이나 겨울철 전력 사용량이 급증할 때면, 뉴스에서 ‘예기치 못한 정전’이란 말을 어렵지 않게 접하게 된다. 그런데 이런 정전, 특히 ‘발전소의 설비 이상으로 인한 정전’은 정말로 예측이 불가능한 걸까?
남아프리카공화국의 전력회사인 Eskom은 수년간 정전 문제로 골머리를 앓아왔다. 특히 예고 없이 발생하는 정전은 설비에 대한 신뢰도를 떨어뜨리고, 전체 전력망에도 악영향을 끼친다. 이를 막기 위해 요하네스버그 대학교 연구팀이 팔을 걷어붙였다. 그들이 주목한 것은 “데이터”였다. 그리고 머신러닝(기계 학습).
결과는? ‘예기치 못한 설비 고장’을 예측하는 AI 모델이 탄생했다. 그것도 단순한 모델이 아닌, 성능은 높이고 신뢰성까지 확보한 설명 가능한 스택 앙상블(Explainable Multilayer Stack Ensemble, EMSE) 방식이다. 이 모델은 발전소의 ‘고장 전조’를 사전에 감지하고, 필요한 설비 점검을 미리 유도하는 도구가 될 수 있다.
AI가 정전을 예측한다고?
이 연구는 2017년부터 2022년까지 5년간의 Eskom 발전소 운영 데이터를 기반으로 했다. 대상은 남아프리카에 위치한 6개의 대형 발전소. 연구진은 여기서 총 97,986건의 전력 손실 기록을 수집해 분석했다. 각각의 기록에는 언제, 어떤 설비에서, 어떤 문제가 있었는지에 대한 정보가 포함되어 있다.
연구팀의 목표는 간단했다. 이전 데이터를 학습시켜 미래의 전력 손실을 미리 예측하는 것. 하지만 현실은 녹록치 않았다. 데이터는 불균형했고, 설비 고장은 다양한 이유로 발생했다. 이를 해결하기 위해 다층(멀티레이어) 앙상블 모델을 고안했다. 간단히 말해, 여러 개의 AI 모델을 층층이 쌓아 조합함으로써 각각의 약점을 보완하고, 전체적인 예측 정확도를 높인 것이다.
여기서 한 발 더 나아가, “왜 그런 예측이 나왔는지”를 설명해주는 기능도 포함했다. 기존 머신러닝의 문제점 중 하나는 “블랙박스”라는 점이었다. 즉, 어떤 결과가 나왔는지는 알 수 있지만, 왜 그런 결과가 나왔는지는 알 수 없었다. 이를 해결하기 위해 연구팀은 SHAP(Shapley Additive Explanations) 기법을 도입, 모델의 예측 근거를 시각적으로 분석할 수 있도록 했다.
무엇을 어떻게 했길래?
연구진은 다음과 같은 순서로 연구를 수행했다:
- 데이터 정리와 전처리
발전소별, 설비별 오류 기록에는 오타나 중복 데이터가 많았다. 예를 들어, 같은 고장을 어떤 기록자는 "feeder"라고 쓰고, 다른 이는 "fdr" 또는 "feeeder"라고 입력했다. 연구진은 이러한 표현들을 정규화하고, 일관된 범주로 묶었다. 또한 불필요한 컬럼을 제거하고, 중복된 데이터도 정리했다. - 학습 모델 선정 및 조합
총 6개의 머신러닝 모델(로지스틱 회귀, 결정트리, 랜덤포레스트, KNN, XGBoost, 가우시안 나이브 베이즈)을 사용해 1차 예측을 진행한 후, 그 결과를 다시 조합하는 다층 앙상블 구조를 만들었다. - 클래스 불균형 문제 해결
불균형 데이터셋(UCLF: 92%, PCLF: 1.5%)을 다루기 위해 각 클래스에 가중치를 부여하고, 정확도 외에도 정밀도, 재현율, ROC, PR-AUC 등 다양한 평가 지표를 사용해 성능을 비교했다. - 모델 해석
EMSE 모델의 예측 결과에 대해 SHAP를 활용, 어떤 변수(예: 시간 손실, 전력 손실, 발전소 위치 등)가 가장 큰 영향을 끼쳤는지를 시각화했다.
성능은 어땠을까?
- 일반 정확도는 모든 모델이 90% 이상을 기록.
- 하지만 데이터가 워낙 불균형한 탓에 단순 정확도보다는 균형 정확도(balanced accuracy)가 더 중요했다.
- 최종적으로 EMSE 모델에서 Gaussian Naïve Bayes를 제외하자 성능이 더욱 향상되었다.
주요 지표 (개선된 EMSE 모델)
- 정확도: 96.2%
- 정밀도: 0.9968
- 균형 정확도: 0.8819
- PR-AUC: 0.9989
즉, 단순히 여러 모델을 조합하는 것이 아니라, 성능이 떨어지는 모델은 과감히 제외한 것이 핵심이었다.
예측만이 아니라, '설명'도 한다
이 연구가 특별한 이유는 단순히 ‘잘 맞추는 AI’에 머물지 않았다는 점이다. 연구진은 SHAP 기법을 활용해 “왜 이 설비가 문제가 생길 것으로 예측되었는가?”를 설명할 수 있었다.
가장 큰 영향을 미친 요소는 다음과 같았다:
- MW 손실량
- 설비 중단 시간(Hours Loss)
- Lethabo 및 Camden 발전소의 설비 상태
- 보일러와 가스 정화 시스템
특히, 전력 손실이 150 MW 이상, 중단 시간이 30시간 이상인 경우, 향후 UCLF(예기치 못한 정전)의 가능성이 급격히 상승하는 경향을 보였다.
앞으로의 의미
이 연구는 단순히 "AI가 정전을 예측했다"는 데 그치지 않는다. 오히려 발전소 관리자들에게 강력한 도구를 제공한다는 점에서 의미가 크다.
예를 들어, 특정 설비가 문제가 생길 가능성이 높다는 예측이 나온다면, 사전 정비를 계획적으로 진행함으로써 불필요한 긴급 정전(즉, UCLF)을 줄일 수 있다. 이는 국가 전체의 전력 안정성 확보와도 연결된다.
무엇보다, 이 모델은 “왜 그런 결론이 나왔는지”를 설명할 수 있기 때문에 관리자들이 신뢰할 수 있는 도구로 활용할 수 있다.
결론적으로...
정전은 단순히 전기가 끊기는 일이 아니다. 사회의 모든 인프라가 전기에 의존하는 시대에서 한 번의 정전은 병원 수술, 산업 생산, 교통, 통신 모든 것을 마비시킬 수 있다.
이제 AI는 단순한 보조 수단이 아니라, 전력 시스템의 핵심적인 의사결정 파트너가 되고 있다. 이번 연구처럼, 머신러닝과 설명 가능한 AI를 결합한 접근은 더 똑똑한 발전소, 더 안정적인 전력 공급을 위한 디딤돌이 될 수 있다.
Boshoma, B. M., Akinola, O. S., & Olukanmi, P. (2025). Classification prediction of load losses in power stations using machine learning multilayer stack ensemble. Frontiers in Artificial Intelligence, 8, 1592492. https://doi.org/10.3389/frai.2025.1592492