미래를 읽는 인공지능, 숫자 속에 감춰진 비밀을 찾아내다

 


기상예보, 주식시장, 에너지 소비량, 와인 판매량. 얼핏 보면 전혀 관련 없어 보이지만, 이들에겐 공통점이 있다. 바로 ‘시간에 따라 변화하는 데이터’라는 것. 과학자들은 이런 데이터를 ‘시계열 데이터’라고 부른다. 그런데 이런 데이터는 단순히 과거를 기록하는 데만 쓰이지 않는다. 잘만 분석하면, 미래를 예측할 수도 있다.


그런데 문제는 이 시계열 데이터가 아주 까다롭다는 데 있다. 계절 따라 변하기도 하고, 중간에 갑자기 방향을 바꾸기도 하며, 데이터가 빠지거나 틀리기도 한다. 특히 여러 개의 시계열 데이터가 동시에 얽혀 있을 땐 그 복잡함이 몇 배로 뛴다. 그래서 전문가들이 머리를 싸매고 분석에 수십, 수백 시간씩 투자한다.


그런데 여기, 그런 고생을 줄여줄 똑똑한 알고리즘이 등장했다. 미국 플로리다대학교의 연구진이 만든 GRU 기반 AutoML 시스템이다. 이건 마치 “누구나 쉽게 사용할 수 있는 시계열 예측 비서”다. 복잡한 수학이나 프로그래밍을 몰라도, 클릭 몇 번이면 미래를 예측할 수 있게 해준다.


이 알고리즘, 도대체 어떻게 그런 일을 해내는 걸까?


예측은 ‘기계’가, 아이디어는 ‘사람’이

기존의 시계열 예측 방식은 보통 다음과 같다. 사람이 데이터를 직접 살펴보고, 어디에 계절성이 있는지, 어디서 추세가 바뀌는지 확인한 뒤, 적절한 수식을 골라 집어넣는다. 이런 수식엔 ‘ARIMA’나 ‘VAR’ 같은 어려운 이름이 붙어 있다. 물론 이런 방식도 효과는 있다. 단, 사람이 시간을 아주 많이 써야 한다는 단점이 있다.


그래서 인공지능을 이용한 방법들이 등장했다. 대표적인 게 LSTM이나 GRU라는 신경망 알고리즘이다. 이들은 뇌처럼 과거의 정보를 기억하며 예측을 수행한다. 특히 GRU(Gated Recurrent Unit)는 구조가 간단하면서도 똑똑해서, 복잡한 시계열 예측에 아주 잘 맞는다.


이번 연구의 핵심은 여기에 AutoML, 즉 ‘자동화된 머신러닝 시스템’을 결합했다는 점이다. 쉽게 말해, 사용자가 따로 모델을 설계하거나 튜닝하지 않아도 자동으로 최적의 모델을 찾아주는 똑똑한 시스템이라는 뜻이다.



GRU가 진짜 똑똑한 이유

GRU는 이전의 데이터를 기억하면서, 무엇을 잊고 무엇을 기억해야 할지를 스스로 결정한다. 이 과정은 마치 사람이 “이건 중요하니 기억해야지” 하는 것과 비슷하다. 그런데 GRU는 사람보다 훨씬 빠르고 정확하게 이 판단을 내린다.


이번 연구에선 GRU를 기반으로 한 AutoML 시스템이 어떤 상황에서도 잘 작동하는지를 실험했다. 예를 들면 다음과 같은 경우다:

  • 여러 시계열 데이터가 서로 영향을 줄 때
  • 중간에 데이터가 비거나 잘못됐을 때
  • 갑자기 추세가 뒤바뀔 때
  • 앞으로 6개월, 12개월 같은 장기 예측이 필요할 때

놀랍게도 GRU 기반 AutoML은 대부분의 상황에서 기존 방식보다 더 정확하고 더 빠르게 예측해냈다. 특히 데이터들 간에 상관관계가 높을수록, 더 좋은 예측 성능을 보였다.


직접 실험해봤더니... 진짜 잘 맞네?

연구진은 두 가지 데이터를 통해 실험을 진행했다.

  1. 미국 에너지 수입량 데이터 (천연가스, 석탄, 전기)
  2. 호주 와인 판매량 데이터 (레드, 스파클링, 화이트 와인)

이 데이터들은 매달 수집되며, 서로 어느 정도 상관관계를 가지고 있다. 게다가 중간에 추세가 바뀌기도 하고, 계절성도 존재한다.


이 데이터를 기존 방식과 GRU-AutoML 방식으로 각각 예측해봤다. 결과는? GRU-AutoML이 대부분의 경우에서 더 낮은 예측 오차를 기록했다. 특히 변화가 많은 시계열일수록 GRU의 예측 정확도는 더욱 빛을 발했다.


이 기술이 열어줄 미래

이 연구가 갖는 진짜 가치는 단순한 숫자 예측 그 이상이다. 이제까지는 전문가들만 다룰 수 있었던 복잡한 시계열 분석을, 이제는 누구나 할 수 있는 시대가 열린 것이다.


예를 들어, 농부가 작황 데이터를 넣고 다음 해 수확량을 예측하거나, 작은 가게 사장이 지난 3년 매출 데이터를 기반으로 향후 매출을 미리 확인할 수 있다. 또 환경 관련 기관은 대기 오염 데이터를 분석해 향후 추이를 예측할 수 있다.


그리고 이 모든 것이 복잡한 코딩 없이, 단순한 인터페이스를 통해 가능하다. 과거에는 데이터 과학자와 프로그래머가 해야 했던 일을, 이제는 누구나 할 수 있게 되는 것이다.


물론 아직 해결해야 할 과제도 있다. 예를 들어, 예측 결과가 왜 그렇게 나왔는지 설명하는 ‘해석 가능성’은 여전히 부족하다. 하지만 그럼에도 불구하고, 예측을 민주화한다는 점에서 이 연구의 의의는 매우 크다.


숫자 뒤에 숨은 미래를 읽는 기술

숫자는 거짓말을 하지 않는다. 하지만 그 의미를 읽어내는 건 결코 쉽지 않다. 이번에 소개한 GRU 기반 AutoML 시스템은 바로 그런 일을 대신해주는 기술이다.


이 기술은 숫자 뒤에 숨은 패턴을 읽어내고, 그 패턴을 바탕으로 미래를 조용히, 그러나 정확하게 예측한다. 어쩌면 가까운 미래엔, 우리 모두가 이런 시스템 하나쯤은 곁에 두고 살아가게 되지 않을까?


미래를 준비하는 가장 좋은 방법은, 그것을 예측하는 것. 이제 그 예측을 인공지능에게 맡길 차례다.



출처
Su, Y., & Wang, M. C. (2025). An AutoML Algorithm: Multiple-Steps Ahead Forecasting of Correlated Multivariate Time Series with Anomalies Using Gated Recurrent Unit Networks. AI, 6(267). https://doi.org/10.3390/ai6100267