LLM으로 시간의 흐름을 읽는 기술, ADTime
데이터 몇 줄로도 예측이 된다?
예측은 항상 복잡했다. 날씨, 주식, 공정 제어… 모든 시간 시계열 예측은 방대한 데이터와 고도화된 알고리즘이 있어야만 가능하다고 여겨졌다. 그런데 이제, 단 몇 줄의 데이터만으로도 복잡한 산업 데이터를 예측할 수 있다면? 게다가 별도의 학습 없이도 말이다.
중국과학원과 SINOPEC의 공동 연구팀은 이런 가능성을 현실로 만들었다. 그들이 개발한 예측 프레임워크 **"ADTime"**은 대규모 언어 모델(LLM)을 기반으로, 적은 데이터로도 정확한 시계열 예측을 가능하게 한다. 그야말로 “덜 보고 더 안다”는 말이 어울리는 기술이다.
기존 예측 모델의 한계
기존의 시계열 예측 모델, 특히 트랜스포머 기반 모델들은 장기 패턴을 잘 잡아내지만, 훈련을 위해선 수많은 데이터와 복잡한 구조가 필요했다. 게다가:
* 여러 변수 간 관계를 잘 파악하지 못하고
* 각각의 변수만 따로따로 분석하거나
* 특정 도메인에서는 아예 동작이 불안정해지기도 한다.
이런 문제는 특히 공정 제어, 에너지 관리, 의료 모니터링처럼 **도메인 특화 데이터**에서 더 심각하게 드러난다. 그렇다고 모든 경우에 대해 새 모델을 훈련시킬 수는 없는 노릇이다.
그래서 나온 해답: ADTime
ADTime은 이러한 문제를 해결하기 위해 만들어졌다. 핵심 아이디어는 이렇다.
"복잡한 모델 대신, 잘 훈련된 LLM을 똑똑하게 활용하자."
ADTime은 GPT-2나 LLaMA 같은 사전학습된 언어 모델에 시간 정보와 변수 관계를 텍스트 형태로 입력하고, LLM이 그 의미를 파악하도록 한다. 단순히 수치를 예측하는 게 아니라, 시간 흐름과 변수 간 상호작용을 언어적으로 해석하게 만드는 셈이다.
ADTime의 세 가지 비밀 무기
1. 적응형 시계열 처리
* 변수들 간의 상관관계를 분석해 비슷한 변수끼리 묶고(클러스터링),
* 각 변수의 주기성을 판단해서 주기적이면 분해하고, 그렇지 않으면 원본을 유지한다.
2. 시간-텍스트 정렬
* 수치 데이터를 LLM이 이해할 수 있도록 텍스트 임베딩과 정렬한다.
* 마치 수치 데이터가 하나의 문장처럼 읽히도록 만든다.
3. 적응형 프롬프트 설계
* 단순한 지시가 아니라, 해당 데이터의 통계적 특징과 도메인 정보를 담은 맞춤형 프롬프트를 구성한다.
* LLM이 무엇을 해야 할지 정확히 인지하게 도와준다.
실험 결과가 말해준다
* 공개 데이터셋 7종과 실제 정유 공정 데이터에서 테스트한 결과,
ADTime은 평균적으로 기존 모델보다 최대 17.1% 낮은 오차율(MSE)을 보였다.
* 5%의 데이터만으로도 우수한 성능을 유지했으며,
제로샷 환경(학습 없이 예측)에서도 놀라운 결과를 보여줬다.
* 특히 기존 LLM 기반 모델들과 비교해도 항상 상위권 성능을 기록했고,
산업용 데이터에서의 일반화 능력이 탁월했다.
왜 이 기술이 중요한가?
앞으로 예측은 더욱 복잡한 환경에서 필요해질 것이다. 기후 변화, 산업 자동화, 에너지 효율화 등에서는 방대한 데이터를 일일이 수집하거나 학습할 수 없는 상황이 많다.
이럴 때 필요한 건 유연하게 적응하고, 적은 데이터로도 똑똑하게 예측할 수 있는 시스템이다. ADTime은 바로 그런 시대를 위한 솔루션이다.
게다가 이 기술은 단순한 예측을 넘어, LLM을 활용한 시계열 분석과 추론의 시작점이 될 수도 있다.
아직 남은 과제는?
연구팀도 인정했듯, 완벽한 기술은 아니다.
* 도메인 전이에 따른 성능 저하
* 모델 선택과 프롬프트 설계의 자동화
같은 문제가 여전히 남아 있다.
하지만 이 논문은 명확한 방향성을 제시했다.
"LLM과 시계열 데이터를 어떻게 연결할 것인가?"
그 해답 중 하나가 바로 ADTime이다.
키워드:
#시계열예측 #LLM #적응형모델 #정유데이터 #프롬프트엔지니어링
출처 논문
Pei, J.; Zhang, Y.; Liu, T.; Yang, J.; Wu, Q.; Qin, K. *ADTime: Adaptive Multivariate Time Series Forecasting Using LLMs*. Mach. Learn. Knowl. Extr. 2025, 7, 35.