“AI가 위성사진을 보는 방식, 사실은 ‘눈’보다 ‘색감’이 더 중요”
우리는 흔히 인공지능 성능이 좋아지면 모든 문제가 해결될 거라고 생각한다. 더 거대한 모델, 더 복잡한 구조, 더 많은 파라미터. 하지만 위성사진을 분석하는 AI 세계에서는 조금 다른 결론이 나오고 있다. 최근 발표된 한 연구는 놀라운 사실을 보여준다. 토지 이용을 분석하는 AI에서 가장 중요한 건 “모델을 얼마나 복잡하게 만들었는가”보다, “위성사진의 어떤 파장을 입력했는가”였다는 점이다. 쉽게 말하면 이렇다. AI에게 사람 눈처럼 보이는 RGB 사진만 보여주는 것보다, 인간은 볼 수 없는 적외선·단파적외선 정보까지 함께 보여주는 편이 훨씬 중요했다는 이야기다. 그리고 그 효과는 최신 트랜스포머 AI보다도 더 컸다. 이 연구는 세르비아와 서부 발칸 지역의 위성 데이터를 활용해, “어떤 위성 밴드 조합이 가장 안정적인가”, “CNN과 트랜스포머 중 누가 더 강한가”, “지역이 바뀌면 AI는 얼마나 무너지는가”를 체계적으로 분석했다. 위성사진은 단순한 사진이 아니다 우리가 스마트폰으로 보는 사진은 빨강(R), 초록(G), 파랑(B) 세 가지 색만 담는다. 하지만 유럽우주국의 Sentinel-2 위성은 훨씬 더 많은 정보를 본다. 가령 식물은 적외선 반사를 강하게 일으키고, 도시의 콘크리트는 단파적외선(SWIR)에서 독특한 반응을 보인다. 물은 또 다른 파장 패턴을 가진다. 즉, 위성은 단순히 “색”을 찍는 게 아니라, 지표면의 물리적 성질을 읽어내는 셈이다. 연구진은 이런 다양한 파장 조합을 AI에게 입력했다. 실험군은 다음과 같았다. RGB만 사용한 3개 밴드(3B) RGB + 근적외선(NIR) 여기에 단파적외선(SWIR)을 추가한 6B 적색경계(red-edge)까지 포함한 9B·10B NDVI 같은 지수(index) 기반 입력 그리고 이 데이터를 여러 종류의 AI 모델에 학습시켰다. RGB만 본 AI는 의외로 형편없었다 결과는 꽤 극적이었다. RGB만 사용했을 때 AI의 평균 성능(mIoU)은 약 54.6%였다. 그런데 근적외선과...