위성 사진만으로 도시 기후를 예측한다고?

우주에서 본 복잡한 도시 풍경 위로 다양한 색의 기후대가 겹쳐진 지도 형태. 중앙에는 SSMMRL 모델 아이콘이 빛나며 배경은 데이터 스트림처럼 보이는 패턴으로 구성.

레이블이 거의 없는 상황에서도 가능한 놀라운 AI 모델이 등장했다

‘도시는 스스로의 기후를 만든다’는 말, 들어본 적 있는가?

도시의 형태와 재료, 식생의 유무에 따라 미세한 기후 변화가 발생하는데, 이를 지역기후대(Local Climate Zone, LCZ)라고 부른다.

하지만 문제는 여기 있다.

이 LCZ를 정확히 분류하려면 엄청난 양의 라벨링된 위성 이미지가 필요한데, 사람이 일일이 하나씩 데이터에 라벨을 붙이는 작업은 시간도 돈도 많이 든다.

그래서 연구자들은 새로운 접근을 택했다.

“라벨 없이 스스로 학습하는 인공지능(Self-Supervised Learning, SSL)은 가능하지 않을까?”

이제 주목하라.

레이블은 거의 없지만 놀라운 성능을 보여주는 새로운 AI 모델, SSMMRL(Restricted Label-Based Self-Supervised Multi-Modal Representation Learning)이 등장했다.

이 기술이 위성 데이터 기반 도시 기후 분석을 어떻게 바꿀 수 있을지 궁금하다면, 계속 읽어라.

---

📄 원문 정보

```

SAR 및 다중분광 영상을 활용한 지역기후대 분류를 위한 제한적 라벨 기반 자가지도학습 (Restricted Label-Based Self-Supervised Learning Using SAR and Multispectral Imagery for Local Climate Zone Classification) (CC BY)

저자: Amjad Nawaz 외 (Beihang University)

출판일: 2025년 4월 8일

저널: Remote Sensing

```

---

🌆 도시를 기후로 분류하는 기술, 왜 필요할까?

지역기후대 분류(LCZC)는 도시를 ‘기후 특성’ 기준으로 구분하는 기술이다.

건물 밀도, 표면 반사율, 식생 등 다양한 요소를 반영해 도시 기후를 17가지로 나눈다(LCZ 1~10: 도시, LCZ A~G: 자연 지역). 이 분류는 열섬현상 분석, 도시계획, 지속가능성 연구에 꼭 필요하다.

하지만 기존 방식은 대량의 라벨링된 학습 데이터에 의존한다. 도시별 위성 이미지에 사람이 일일이 지역기후대를 표시하는 작업은 너무나 비효율적이다.

이 한계를 해결하기 위해 연구진은 SAR(합성개구레이더)와 다중분광(Multispectral, MS) 이미지를 결합한 새로운 자가지도학습 모델을 제안했다.

---

핵심 기술: SSMMRL이란 무엇인가?

이 연구에서 제안한 SSMMRL은 기존 SSL 기법들과 다르게 오직 ‘양성 샘플(positive sample)’만을 활용해 학습하는 방식이다.

핵심 구성은 다음과 같다:

- 세 개의 브랜치: Online, Target, Fusion으로 구성 (BYOL보다 확장됨)

- SAR + MS 이미지 융합: 18개 밴드(Sentinel-1, 2) 데이터를 통합 분석

- 주의(attention) 기반 융합: 두 개의 양성 샘플에서 중요한 특징만 뽑아내는 방식

- 동적 컨볼루션: 다양한 입력 크기에 적응 가능

- 레이블 없이 사전학습 → 일부 레이블로 파인튜닝

이 모델은 라벨 없이도 위성 이미지에서 의미 있는 특징을 뽑아내며, 극소량의 라벨만으로도 높은 정확도를 달성했다.

---

📊 실험 결과: 레이블 거의 없어도 정확도 ‘65%’ 달성

데이터셋:

- So2Sat-LCZ42: 전 세계 6개 도시(시드니, 뮌헨, 우한 등)에서 수집된 SAR/MS 위성 이미지

- 총 352,366개 훈련 샘플, 48,307개 테스트 샘플

주요 결과:

- 10% 라벨만 사용했을 때도 기존 SSL 기법들(MoCo, DINO, MAE, Data2vec 등)보다 우수

- 전체 라벨 사용 시, SSMMRL은 Output Accuracy 65.5%, Kappa 0.62로 최고 성능

- 훈련 시간 6시간으로 가장 빠름 (ViT, MAE 대비 약 1.5~3배 빠름)

비교 그래프:

- MAE, MoCo, DINO 등 SOTA 모델과 비교해 SSMMRL이 항상 상위권 유지

- 특히 few-shot 학습 성능에서 압도적 우위

---

🔍 왜 이 방식이 유효했을까?

1. 양성 샘플만 사용해도 충분한 특징 학습 가능

→ 불필요한 음성 샘플 대비로 인한 학습 불안정성 제거

2. 주의 기반 융합(fusion)을 통해 정보 손실 최소화

→ SAR은 형상, MS는 색상·반사 정보. 서로 보완됨

3. 조합된 다중 손실 함수(L1 + L2 + L3)

→ 각 브랜치의 표현 학습을 정교하게 유도

4. Ablation Study에서도 구성 요소 하나하나가 성능 향상에 기여함이 입증됨

---

🌍 실사용 가능성은?

- 도시 열섬 분석: 고온 지역 탐지 → 그늘, 녹지계획 가능

- 지속가능 도시계획: 도심 밀도 파악 → 환기 전략 수립

- 기후 재해 대응: 홍수 위험 지역, 지형 정보 분석에 SAR 이미지 활용 가능

실제로 연구진은 맞춤형 데이터셋을 구축해 실험했을 때도 62% 이상의 정확도를 유지함으로써 도메인 확장성도 보여줬다.

---

마무리하며: 라벨이 적어도 괜찮다

이 연구는 ‘데이터 라벨이 적어서 못한다’는 고정관념을 깼다.

정교한 모델 설계와 적절한 융합 전략만 있다면, 레이블 없는 데이터조차 강력한 학습 자원이 될 수 있다.

SSMMRL은 자가지도학습의 새로운 장을 열었고, 도시 기후 예측, 위성 영상 활용, 기후 AI 응용 분야에 강력한 한 수가 될 가능성이 크다.

하지만 과연, 다른 도시와 다른 기후권에서도 똑같이 잘 작동할까?

이 기술의 진짜 가능성은, 이제 막 시작되었을지도 모른다.

---

🔍 키워드

#자가지도학습기후분류, #SAR다중분광융합, #지역기후대분류, #SSMMRL모델, #레이블없이학습

---