사물인터넷(IoT) 침입 탐지를 위한 연합 학습 프레임워크
탭 트랜스포머와 자연 기반 하이퍼파라미터 최적화 기법 적용
본 연구는 기존의 중앙 집중형 침입 탐지 시스템(IDS)의 한계를 극복하기 위해 **개인정보 보호를 중심으로 한 연합 학습(Federated Learning, FL) 기반의 IDS 프레임워크**를 제안한다. 핵심 기술은 다음과 같다:
* Tab Transformer(TTF): 범주형 및 연속형 데이터를 효과적으로 처리하기 위한 트랜스포머 기반 모델
* 전기뱀장어 포획 최적화(EEFO, Electric Eel Foraging Optimization): 자연에서 영감을 얻은 하이퍼파라미터 튜닝 알고리즘
연구 배경 및 문제 인식
기존의 IDS는 대부분 중앙 서버에 데이터를 수집하여 분석하는 구조이다. 이 구조는 다음과 같은 문제점을 가진다:
* 데이터 프라이버시 침해 위험
* 서버 과부하 및 통신 비용 증가
* IoT 환경 특유의 분산성과 이질적 데이터 처리 미흡
이에 대한 대안으로, 연합 학습 기반 IDS가 주목받고 있다. 그러나 현재의 대부분 FL 기반 IDS는 다음과 같은 한계를 가진다:
* 고정된 하이퍼파라미터로 인해 성능 저하
* 모델 구조가 복잡한 IoT 데이터의 패턴을 충분히 포착하지 못함
제안된 프레임워크의 핵심 요소
1. Tab Transformer (TTF)
* 범주형 및 연속형 특성을 동시에 다룰 수 있는 트랜스포머 기반 구조
* 복잡한 데이터 간 상호작용을 셀프 어텐션(self-attention)으로 파악
* 자동 특성 추출 기능으로 기존 MLP보다 높은 정확도 제공
2. EEFO 알고리즘
* 전기뱀장어의 포획 행동(탐색, 휴식, 사냥, 이동)을 수학적으로 모델링
* 기존 그리드 서치 대비 낮은 계산 비용으로 효율적인 하이퍼파라미터 튜닝 가능
3. 연합 학습 구조
* 클라이언트가 자체 데이터로 TTF 모델을 훈련하고 가중치만 서버에 공유
* EEFO를 통해 각 클라이언트는 자신에게 맞는 최적의 학습률, 에포크 수, 배치 크기 설정
* 서버는 클라이언트 가중치를 집계해 글로벌 모델을 업데이트하고 다시 배포
---
성능 평가
세 가지 주요 IoT 침입 탐지 데이터셋을 활용해 실험을 진행하였다:
| 데이터셋 | 종류 | 샘플 수 | 클래스 수 |
| ---------- | ----------- | ------ | ----- |
| N-BaIoT | 보안 침입 | 7백만+ | 11 |
| UNSW-NB15 | 혼합 공격 시뮬레이션 | 250만 | 9 |
| CICIoT2023 | 대규모 IoT 공격 | 4천6백만+ | 34 |
성능 지표
* 정확도(Accuracy), 정밀도(Precision), 재현율(Recall), F1 점수
* 제안된 프레임워크는 기존 대비 최대 5% 이상 정확도 향상, 훈련 시간 단축, **오차 감소**
* 특히 CICIoT2023 데이터셋에서 99.86%의 정확도 달성, 기존 대비 약 4.5% 향상
---
### 기존 연구와 비교
| 모델 | 데이터셋 | 정확도(%) | F1 점수(%) |
| --------- | -------------- | --------- | --------- |
| 기존 DWKAFL | UNSW-NB15 | 91.38 | - |
| 기존 FedMSE | N-BaIoT | 94.74 | - |
| 제안 모델 | **N-BaIoT** | **99.02** | **98.87** |
| 제안 모델 | **UNSW-NB15** | **98.02** | - |
| 제안 모델 | **CICIoT2023** | **95.47** | **95.65** |
제안된 모델은 모든 비교 모델 대비 높은 성능을 달성하였다.
---
한계 및 향후 연구 방향
* TTF의 연산 요구가 IoT 엣지 디바이스에 과부하를 줄 수 있음
* EEFO 최적화는 클라이언트 수가 증가할수록 연산 시간이 늘어날 수 있음
* 불균형 데이터셋 처리, 적대적 공격 탐지 성능 등에 대한 후속 연구 필요
---
결론
본 연구는 TTF와 EEFO 알고리즘을 결합한 연합 학습 기반 침입 탐지 시스템을 제안하였다. 이 프레임워크는 다음과 같은 장점을 지닌다:
* 데이터 프라이버시 보호
* 고차원 데이터에 대한 높은 탐지 정확도
* FL 구조에 적합한 **경량화된 하이퍼파라미터 최적화**
* 향후 5G/B5G 네트워크 대응 가능성
---
키워드:
#연합학습 #탭트랜스포머 #침입탐지시스템 #EEFO알고리즘 #사물인터넷보안
---
원제: Federated learning framework for IoT intrusion detection using tab transformer and nature-inspired hyperparameter optimization
저자: Mohamed Abd Elaziz(Zagazig University, Galala University, Ajman University), Ibrahim A. Fares(Zagazig University), Abdelghani Dahou(Zhejiang Normal University), Mansour Shrahili(King Saud University)
날짜: 2025년 5월 14일
플랫폼: Frontiers in Big Data (Creative Commons)