P2P 연합학습이 주목받는 이유, 중앙 서버 없는 AI 학습의 가능성과 한계를 정리한 최신 리뷰

이미지
중앙 서버 없이도 AI를 학습시키는 새로운 방식은 어디까지 현실화됐을까 최근 영국 허트퍼드대학교(University of Hertfordshire)와 그리스 아메리칸 칼리지(The American College of Greece) 연구진은 Peer-to-Peer Federated Learning: A Comprehensive Survey 라는 리뷰 논문을 발표했다. 이번 연구는 최근 빠르게 발전하고 있는 P2P(Peer-to-Peer) 연합학습 분야를 종합적으로 분석한 논문이다. 특히 기존 연합학습(Federated Learning)의 가장 큰 특징인 중앙 서버를 완전히 제거한 구조가 실제 환경에서 얼마나 효과적으로 동작할 수 있는지를 다양한 연구 결과를 바탕으로 검토했다. 인공지능이 발전하면서 데이터는 점점 더 민감해지고 있다. 의료기록, 스마트폰 데이터, 금융정보처럼 외부로 보내기 어려운 데이터를 활용하면서도 AI를 학습시키려는 요구가 커지고 있다. 이러한 문제를 해결하기 위해 등장한 것이 연합학습(Federated Learning) 이다. 하지만 기존 연합학습도 중앙 서버가 반드시 필요하다는 한계가 있었다. 이번 리뷰는 이러한 중앙 서버마저 제거한 P2P 연합학습 이 실제 대안이 될 수 있는지를 다양한 연구를 통해 살펴본다. 중앙 서버가 없는 연합학습은 어떻게 작동하는가 기존 연합학습에서는 스마트폰이나 병원, 기업 등 여러 장치가 각각 자신의 데이터를 이용해 AI 모델을 학습한 뒤, 학습 결과만 중앙 서버로 전송한다. 중앙 서버는 여러 결과를 합쳐 새로운 모델을 만든 후 다시 참여자에게 배포한다. 이 과정에서는 개인정보를 직접 수집하지 않는다는 장점이 있지만 중앙 서버는 여전히 시스템의 핵심이 된다. 서버 장애가 발생하거나 공격 대상이 될 가능성도 존재한다. P2P 연합학습은 이러한 중앙 서버를 완전히 없앤다. 모든 참여 노드가 서로 직접 통신하며 모델을 공유하고 업데이트한다. 다시 말해 모든 참여자가 동시에 ...

팔레스타인 기상 데이터로 확인한 인공지능 날씨 예측의 미래: 머신러닝 vs 딥러닝

이미지
최근 팔레스타인 아랍 아메리칸 대학교 연구진은 10년(2015-2025) 동안 수집된 5개 기상 관측소 데이터를 바탕으로 다양한 인공지능 모델의 날씨 예측 성능을 비교 분석했다. 이번 연구는 전통적인 통계 모델과 머신러닝, 그리고 최신 딥러닝 기법이 기온, 습도, 강수량 등 다변수 기상 예측에서 각각 어떤 강점과 한계를 가지는지 명확히 규명했다.  연구 결과, 상황에 따라 최적의 모델이 다를 수 있다는 점이 밝혀졌으며, 특히 복합적인 기상 변수를 동시에 다룰 때 모델 선택의 중요성이 입증됐다. 머신러닝과 딥러닝, 기상 예측의 새로운 기준 이번 연구는 기상 예측 모델의 성능을 체계적으로 비교하기 위해 10년 치의 다변수 기상 데이터를 분석했다. 연구진은 기온, 상대 습도, 풍속, 강수량, 기압, 일조 시간 등 총 6가지 기상 변수를 대상으로 실험을 진행했다. 기존 통계 모델이 비선형적인 기상 데이터를 충분히 설명하지 못한다는 한계를 극복하기 위해, 머신러닝과 딥러닝 알고리즘을 도입하여 예측 정확도를 높이고자 했다. 특히 이번 연구는 시간적 데이터 오염(temporal leakage)을 방지하기 위해 데이터를 연대순으로 분할하는 엄격한 평가 방식을 채택하여 결과의 신뢰성을 확보했다. 연구진이 확인한 모델별 예측 성능 연구진은 XGBoost와 같은 고전적 머신러닝 모델과 CNN-LSTM 등 하이브리드 딥러닝 모델의 성능을 비교했다. 실험 결과는 다음과 같이 정리할 수 있다. • XGBoost의 우수한 성능: 기온과 상대 습도 예측에서는 XGBoost 모델이 결정계수(R²) 기준 각각 0.953과 0.670을 기록하며 가장 뛰어난 정확도를 보였다. • 랜덤 포레스트(Random Forest)의 강점: 강수량과 기압 예측에서는 랜덤 포레스트 모델이 안정적인 성능을 발휘했다. • 딥러닝 모델의 복합적 강점: 일조 시간 예측에서는 LSTM(Long Short-Term Memory) 모델이 R²=0.831로 가장 우수한 성과를 거두었다. • CNN-LS...

LLM 기반 시계열 데이터 특징 엔지니어링, 데이터 누수를 막으면서 예측 성능을 높인 새로운 AI 프레임워크

이미지
시간 정보를 고려한 특징 생성으로 주가와 스포츠 경기 예측 정확도를 개선한 최신 연구 최근 호주 Australian Catholic University 와 Sydney International School of Technology and Commerce 연구진이 발표한 연구에 따르면, 대규모 언어모델(LLM)을 활용한 자동 특징 엔지니어링(feature engineering)에 시간 정보(Temporal Information) 를 명시적으로 반영하면 시계열 데이터 예측의 정확도를 높이면서도 데이터 누수(Data Leakage) 를 효과적으로 방지할 수 있는 것으로 나타났다. 이번 연구는 MDPI 학술지 AI 에 게재됐으며, 주가 예측과 스포츠 경기 결과 예측이라는 서로 다른 분야에서 제안한 프레임워크의 성능을 검증했다. 인공지능 모델의 성능은 알고리즘 자체보다 입력 데이터의 품질에 더 크게 영향을 받는 경우가 많다. 특히 금융시장, 의료, 에너지, 스포츠처럼 시간이 흐르면서 데이터가 축적되는 시계열 데이터(Time Series Data) 에서는 어떤 정보를 모델에 입력하느냐가 예측 결과를 크게 좌우한다. 문제는 기존의 자동 특징 생성 기술들이 시간의 흐름을 충분히 고려하지 못했다는 점이다. 미래에만 알 수 있는 정보를 현재 예측에 사용하면 실제 환경에서는 절대 얻을 수 없는 정보를 학습하게 되고, 이로 인해 모델 성능이 과대평가되는 문제가 발생한다. 연구진은 이러한 한계를 해결하기 위해 LLM이 시간의 순서를 이해하도록 설계한 새로운 특징 엔지니어링 프레임워크를 제안했다. 시계열 데이터에서는 왜 데이터 누수가 발생하는가 머신러닝에서 Feature Engineering 은 원본 데이터를 그대로 사용하는 대신 예측에 도움이 되는 새로운 변수를 만드는 과정이다. 예를 들어 주가 데이터를 이용한다면 최근 5일 평균 가격, 지난 20일 최고가, 이동평균선 같은 새로운 변수를 만들어 모델에 입력한다. 하지만 시계열 데이터에서는...

폐기물 자동 분류 기술, 저전력 기기에서도 가능할까?

이미지
모로코의 시디 모하메드 벤 압델라 대학교(Sidi Mohamed Ben Abdellah University) 연구진은 제한된 메모리와 연산 능력을 갖춘 엣지 기기(Edge devices)에서 높은 정확도로 폐기물을 분류할 수 있는 경량 CNN 프레임워크를 개발했습니다. 연구진은 MobileNetV4 모델을 교사 모델로 활용하여 LCNet-0.5 등 세 가지 경량 모델을 학습시켰으며, 그 결과 LCNet-0.5가 0.58MB의 매우 작은 모델 크기로도 94.18%의 높은 정확도를 기록함을 확인했습니다.  이 연구는 복잡한 서버 없이도 스마트 쓰레기통 등 현장에서 실시간 폐기물 분류를 가능하게 하는 기술적 토대를 마련했다는 점에서 의미가 큽니다. 쓰레기 분류 자동화, 왜 경량화 기술이 필요한가 쓰레기 분류 자동화는 도시 환경 개선과 재활용률 향상을 위한 핵심 기술이지만, 기존의 강력한 합성곱 신경망(CNN) 모델은 많은 메모리와 높은 컴퓨팅 자원을 요구해 저사양 엣지 기기에 탑재하기 어렵다는 한계가 있습니다.  특히 스마트 쓰레기통이나 이동형 분류 장치와 같은 'TinyML'급 환경에서는 모델의 크기가 수 메가바이트(MB) 이하로 제한되어야 하므로, 정확도와 모델 크기 사이의 최적 균형점을 찾는 것이 매우 중요합니다. 폐기물 분류 정확도와 모델 크기, 어떤 관계인가 이번 연구에서 테스트한 모델들 중 LCNet-0.5는 모델 크기를 1MB 미만으로 유지하면서도 94.18%라는 높은 분류 정확도를 달성하여 가장 효율적인 후보로 선정되었습니다.  연구진은 EfficientNet-Lite0, LCNet-0.5, MobileNetV3-Small-0.5 세 가지 모델을 TrashNet 데이터셋으로 평가한 결과, 모델의 파라미터 수가 적을수록 메모리 점유율이 획기적으로 낮아지면서도 정확도는 충분히 실무에 적용 가능한 수준으로 유지됨을 입증했습니다. 지식 증류(Knowledge Distillation)는 정확도 향상을 보장하는가 지식 증류 기법은 고성능...

보행 인식 스푸핑은 어떻게 막을까? GaitSpoofNet 연구가 제시한 새로운 비전 기반 탐지 기술

이미지
  보행(Gait) 생체인식은 사람의 걸음걸이만으로 신원을 확인할 수 있는 비접촉식 생체인식 기술이다. 하지만 옷을 바꾸거나 가방을 드는 것처럼 외형을 의도적으로 바꿔 인증 시스템을 속이는 '프레젠테이션 공격(Presentation Attack)'에는 취약하다는 한계가 있었다.  이번 연구에서는 이 문제를 해결하기 위해 GaitSpoofNet 이라는 비전 기반 보행 스푸핑 탐지 프레임워크를 제안하고, GRU·LSTM·Mamba 등 최신 시공간 딥러닝 모델을 비교 평가했다. 연구 결과 공개 환경에서는 GRU 기반 모델이 검증 정확도 98.40%, ROC-AUC 0.9983 을 기록했고, 제한된 출입 환경에서는 LSTM 기반 모델이 가장 우수한 일반화 성능 을 보였다. 이러한 결과는 보행 생체인식 시스템의 보안성을 높이는 실질적인 기준을 제시했다. 왜 보행 생체인식은 스푸핑 공격에 취약할까? 보행 생체인식은 얼굴이나 지문과 달리 멀리 떨어진 거리에서도 사람을 식별할 수 있다는 장점이 있다. CCTV만으로도 인식이 가능하기 때문에 공항, 공공시설, 스마트시티, 국방 분야에서 활용 가능성이 높다. 하지만 공격자가 두꺼운 외투를 입거나 가방을 들고 걷는 등 외형을 의도적으로 변경하면 실루엣이 달라지면서 인증 시스템을 속일 수 있다. 이러한 공격은 Presentation Attack(PA) 으로 분류되며, 기존 연구에서는 얼굴이나 지문 분야에서는 활발히 연구됐지만 보행 인식에서는 상대적으로 연구가 부족했다. 특히 기존 보행 스푸핑 연구 대부분은 스마트폰 센서나 웨어러블 장치의 가속도 데이터를 활용했으며, 실제 CCTV 영상처럼 카메라 기반 환경을 대상으로 한 딥러닝 기반 스푸핑 탐지 모델은 거의 존재하지 않았다. 이번 연구는 이러한 공백을 메우는 것을 목표로 했다. 연구진은 어떤 방식으로 보행 스푸핑을 탐지했을까? 이번 연구는 기존 보행 인식 데이터셋인 CASIA-B 를 스푸핑 탐지용으로 재구성했다. 총 124명...

인공지능 도입한 스마트 그리드 보안, 데이터 수명 주기 전반을 관리해야 한다

이미지
AI 에너지 관리 시스템을 안전하게 지키는 PALH 프레임워크의 구조와 역할 전 세계 에너지 산업은 지속가능성과 효율성을 극대화하기 위해 기존의 전력망을 디지털화된 스마트 그리드로 빠르게 전환하고 있다. 인공지능은 이러한 스마트 그리드에서 수요를 예측하고 에너지를 효율적으로 분배하는 핵심 기술로 자리 잡았다. 하지만 인공지능이 통합되면서 시스템은 복잡한 사이버-물리 체계가 되었고, 이로 인해 기존에는 경험하지 못한 새로운 형태의 데이터 보안 위협이 발생했다. 연구진은 시스템 구축 이후에 보안을 강화하는 방식으로는 오늘날의 복잡한 에너지망을 안전하게 지킬 수 없다고 판단하여, 시스템 설계 초기 단계부터 보안을 통합하는 수명 주기 관리 체계인 *PALH 프레임워크*를 개발했다. 왜 스마트 그리드에 인공지능을 도입하면 보안 문제가 더 심각해질까. 과거의 에너지 인프라 보안은 물리적인 공격이나 신뢰성 문제에 집중했다면, 현대의 스마트 그리드는 사물인터넷 기기와 클라우드 컴퓨팅, 대규모 데이터 흐름이 복잡하게 얽혀 있다. 인공지능 모델의 학습 데이터를 변조하는 데이터 오염이나, 인공지능의 판단을 잘못된 방향으로 유도하는 적대적 공격, 그리고 모델을 역추적하여 시스템 내부 정보를 탈취하는 공격은 스마트 그리드의 안정성을 치명적으로 위협하는 요소들이다. 이러한 위협은 단순히 기술적 오류를 넘어 에너지 공급 중단이나 시장 조작 같은 사회적, 경제적 피해로 이어질 수 있다. 연구진은 이러한 보안 문제를 해결하기 위해 시스템의 전 과정을 데이터 수명 주기로 정의했다. 데이터가 생성되는 시점부터 센서를 통한 수집, 모델 개발, 최종 배포에 이르는 모든 경로에서 보안 위협이 존재할 수 있기 때문이다. 이들은 디자인 사이언스 연구 방식을 통해 데이터를 보호하고 시스템의 탄력성을 유지할 수 있는 4단계 메커니즘을 제시했다. 인공지능 기반 에너지 관리 시스템이 안전하게 운영되기 위해서는 예방, 감사, 학습, 강화라는 네 가지 단계를 상호 보완적으로 운영해야 한다는 것이 ...

GPS가 끊겨도 길을 잃지 않는 농업 로봇, 카메라가 대신 운전하는 새로운 기술

이미지
사과나무에 가려 GPS가 사라져도 로봇은 멈추지 않았다. AI가 길을 보고 스스로 주행을 이어가는 방법을 소개한다. 과수원에서 일하는 농업 로봇은 대부분 RTK GPS 라는 매우 정확한 위치 측정 기술을 이용한다. 일반 내비게이션보다 훨씬 정밀해 몇 센티미터 오차만으로도 사과나무 사이를 안전하게 지나갈 수 있다. 하지만 과수원에서는 한 가지 문제가 있다. 나뭇잎과 가지가 하늘을 가리면 위성 신호가 약해지고, RTK가 몇 초 동안 끊기는 일이 자주 발생한다. 사람이라면 눈으로 길을 보며 계속 걸어갈 수 있지만, 로봇은 길을 잃거나 멈추는 경우가 많다. 최근 발표된 연구는 바로 이 문제를 해결했다. GPS가 잠시 사라지면 카메라가 대신 길을 보고 운전하도록 만드는 새로운 시각 기반 내비게이션 기술 을 제안했다. 과수원에서는 왜 GPS가 자주 끊길까? 자동차는 넓은 도로를 달리기 때문에 GPS 신호가 비교적 안정적이다. 반면 과수원은 상황이 다르다. 사과나무가 빽빽하게 심어져 있다. 잎과 가지가 하늘을 가린다. 나무 그림자 때문에 카메라 영상도 복잡하다. 길 양쪽에는 풀과 흙이 섞여 있다. 이런 환경에서는 위성 신호가 잠깐 사라지는 일이 흔하다. 연구진은 이러한 상황을 Short-term RTK Failure 라고 정의했다. 즉, RTK가 몇 초 정도만 끊기는 상황이다. 문제는 바로 이 짧은 시간이다. 몇 초만 방향을 잘못 잡아도 로봇은 나무에 가까워지거나 작업 경로를 벗어날 수 있다. 연구진은 사람처럼 생각하는 방법을 선택했다 사람은 산책하다가 휴대폰 GPS가 꺼져도 크게 당황하지 않는다. 눈으로 길을 보기 때문이다. 연구진도 같은 아이디어를 적용했다. 평소에는 RTK가 운전을 담당하고, RTK가 잠시 사라지는 순간에는 카메라가 길을 찾아 대신 운전한다. RTK 신호가 다시 들어오면 다시 GPS가 주행을 맡는다. 평소 RTK GPS │ ▼ 정확한 위치 확인 ...