사물인터넷(IoT) 침입 탐지를 위한 연합 학습 프레임워크

 


탭 트랜스포머와 자연 기반 하이퍼파라미터 최적화 기법 적용


본 연구는 기존의 중앙 집중형 침입 탐지 시스템(IDS)의 한계를 극복하기 위해 **개인정보 보호를 중심으로 한 연합 학습(Federated Learning, FL) 기반의 IDS 프레임워크**를 제안한다. 핵심 기술은 다음과 같다:


* Tab Transformer(TTF): 범주형 및 연속형 데이터를 효과적으로 처리하기 위한 트랜스포머 기반 모델

* 전기뱀장어 포획 최적화(EEFO, Electric Eel Foraging Optimization): 자연에서 영감을 얻은 하이퍼파라미터 튜닝 알고리즘



연구 배경 및 문제 인식


기존의 IDS는 대부분 중앙 서버에 데이터를 수집하여 분석하는 구조이다. 이 구조는 다음과 같은 문제점을 가진다:


* 데이터 프라이버시 침해 위험

* 서버 과부하 및 통신 비용 증가

* IoT 환경 특유의 분산성과 이질적 데이터 처리 미흡


이에 대한 대안으로, 연합 학습 기반 IDS가 주목받고 있다. 그러나 현재의 대부분 FL 기반 IDS는 다음과 같은 한계를 가진다:


* 고정된 하이퍼파라미터로 인해 성능 저하

* 모델 구조가 복잡한 IoT 데이터의 패턴을 충분히 포착하지 못함



제안된 프레임워크의 핵심 요소


 1. Tab Transformer (TTF)


* 범주형 및 연속형 특성을 동시에 다룰 수 있는 트랜스포머 기반 구조

* 복잡한 데이터 간 상호작용을 셀프 어텐션(self-attention)으로 파악

* 자동 특성 추출 기능으로 기존 MLP보다 높은 정확도 제공


2. EEFO 알고리즘


* 전기뱀장어의 포획 행동(탐색, 휴식, 사냥, 이동)을 수학적으로 모델링

* 기존 그리드 서치 대비 낮은 계산 비용으로 효율적인 하이퍼파라미터 튜닝 가능


3. 연합 학습 구조


* 클라이언트가 자체 데이터로 TTF 모델을 훈련하고 가중치만 서버에 공유

* EEFO를 통해 각 클라이언트는 자신에게 맞는 최적의 학습률, 에포크 수, 배치 크기 설정

* 서버는 클라이언트 가중치를 집계해 글로벌 모델을 업데이트하고 다시 배포


---


성능 평가


세 가지 주요 IoT 침입 탐지 데이터셋을 활용해 실험을 진행하였다:


| 데이터셋       | 종류          | 샘플 수   | 클래스 수 |

| ---------- | ----------- | ------ | ----- |

| N-BaIoT    | 보안 침입       | 7백만+   | 11    |

| UNSW-NB15  | 혼합 공격 시뮬레이션 | 250만   | 9     |

| CICIoT2023 | 대규모 IoT 공격  | 4천6백만+ | 34    |


성능 지표


* 정확도(Accuracy), 정밀도(Precision), 재현율(Recall), F1 점수

* 제안된 프레임워크는 기존 대비 최대 5% 이상 정확도 향상, 훈련 시간 단축, **오차 감소**

* 특히 CICIoT2023 데이터셋에서 99.86%의 정확도 달성, 기존 대비 약 4.5% 향상


---


### 기존 연구와 비교


| 모델        | 데이터셋           | 정확도(%)    | F1 점수(%)  |

| --------- | -------------- | --------- | --------- |

| 기존 DWKAFL | UNSW-NB15      | 91.38     | -         |

| 기존 FedMSE | N-BaIoT        | 94.74     | -         |

| 제안 모델 | **N-BaIoT**    | **99.02** | **98.87** |

| 제안 모델 | **UNSW-NB15**  | **98.02** | -         |

| 제안 모델 | **CICIoT2023** | **95.47** | **95.65** |


제안된 모델은 모든 비교 모델 대비 높은 성능을 달성하였다.


---


한계 및 향후 연구 방향


* TTF의 연산 요구가 IoT 엣지 디바이스에 과부하를 줄 수 있음

* EEFO 최적화는 클라이언트 수가 증가할수록 연산 시간이 늘어날 수 있음

* 불균형 데이터셋 처리, 적대적 공격 탐지 성능 등에 대한 후속 연구 필요


---


결론

본 연구는 TTF와 EEFO 알고리즘을 결합한 연합 학습 기반 침입 탐지 시스템을 제안하였다. 이 프레임워크는 다음과 같은 장점을 지닌다:


* 데이터 프라이버시 보호

* 고차원 데이터에 대한 높은 탐지 정확도

* FL 구조에 적합한 **경량화된 하이퍼파라미터 최적화**

* 향후 5G/B5G 네트워크 대응 가능성

---


키워드:

#연합학습 #탭트랜스포머 #침입탐지시스템 #EEFO알고리즘 #사물인터넷보안

---

원제: Federated learning framework for IoT intrusion detection using tab transformer and nature-inspired hyperparameter optimization

저자: Mohamed Abd Elaziz(Zagazig University, Galala University, Ajman University), Ibrahim A. Fares(Zagazig University), Abdelghani Dahou(Zhejiang Normal University), Mansour Shrahili(King Saud University)

날짜: 2025년 5월 14일

플랫폼: Frontiers in Big Data (Creative Commons)