양자역학에서 배운 인공지능, 시계열 데이터를 꿰뚫다
양자 역학에서 영감을 얻은 인공지능, 시간의 흐름을 읽다: 주식 그래프부터 공기 오염 예측까지, AI의 새로운 가능성 |
양자역학이 시계열 데이터를 분석한다고?
다소 생소하게 들릴 수 있지만, 과학계는 지금 진지하게 이런 시도를 하고 있다. 그리고 놀랍게도, 그 성과가 꽤나 흥미롭다.
헝가리 엘떼 로란드 대학교의 두 물리학자, 졸탄 우드바르노키(Zoltán Udvarnoki)와 가보르 파트(Gábor Fáth)는 복잡한 시계열 데이터를 분석하는 완전히 새로운 방식을 제시했다.
이름하여 ‘양자 영감 모델(Quantum-Inspired Models)’. 양자물리학의 대표적인 수학 도구인 ‘행렬곱 상태(Matrix Product State, MPS)’를 빌려와, 경제지표나 공기오염 같은 현실 세계의 데이터를 분석하는 데 사용한 것이다.
놀라운 점은, 이 방식이 단순한 흉내가 아니라 기존 머신러닝 모델로는 설명하기 힘들었던 패턴을 드러낸다는 것이다.
---
“양자역학을 왜 시계열에 사용하나?”
우리가 흔히 다루는 시계열 데이터는 시간에 따라 변하는 숫자의 흐름이다. 주식 가격, 온도 변화, 심장 박동 등 모두 그렇다. 그런데 이런 데이터는 단순히 숫자 나열이 아니라, 서로 영향을 주고받는 복잡한 패턴을 내포한다.
기존의 ARIMA 모델이나 딥러닝은 이 패턴을 특정 함수나 신경망을 통해 파악하려 하지만, 데이터가 아주 복잡하거나 연속성과 비선형성이 강할 경우 한계가 생긴다. 이때 양자계의 ‘스핀 체인(Spin Chain)’을 응용하면, 복잡한 상관관계를 단순한 행렬 구조로 압축 표현할 수 있다.
양자물리학에서는 아주 복잡한 입자 간 얽힘을 MPS로 표현한다. 이 방식은 계산량을 줄이면서도 물리적 성질을 거의 정확히 재현할 수 있어 양자계 해석에서 매우 중요한 기법이다. 연구진은 바로 이 MPS 개념을 시계열 분석에 접목시켰다.
---
시계열 데이터를 ‘스핀 체인’처럼 다루다
이 논문에서 제안한 방식은 다음과 같다.
1. 먼저 시계열 데이터를 ‘노이즈’(즉, 변화량)의 흐름과 그 누적값(예: 주가, 온도 등)으로 나눈다.
2. 그런 다음, 노이즈 데이터를 2진(binary) 값으로 바꿔 마치 스핀 체인의 업(↑)과 다운(↓)처럼 해석한다.
3. 여기에 양자계에서 사용하는 MPS 모델을 적용해, 데이터를 생성하거나 예측한다.
이 접근법의 핵심은, 단순한 0과 1의 나열이 수백 가지의 패턴과 상관관계를 품고 있다는 점이다. 양자 시스템에서 스핀의 조합이 전체 상태를 결정하듯, 시계열에서도 작은 변화의 조합이 전체 흐름을 좌우한다.
연구진은 이 모델이 기존 방식보다 훨씬 적은 파라미터로, 더 복잡한 패턴을 설명할 수 있음을 보여줬다.
---
실제로 써보니 어땠을까?
이론만으로는 부족하다. 연구진은 이 모델을 실제 데이터에 적용해 검증했다.
1. 공기 오염 데이터 (예, 서울 서초구)
2017년부터 2019년까지의 PM10 농도를 기준으로, 하루치 데이터를 ‘좋음(0)’과 ‘나쁨(1)’으로 이진화했다. 이 데이터를 가지고 양자 모델을 훈련시킨 결과, 기존 방식으로는 포착하지 못한 장기 상관관계(long-range correlation)를 MPS 모델이 더 정확히 반영했다.
2. 패턴 반복 실험
짧은 이진 패턴을 반복 생성한 후, MPS가 이 패턴을 얼마나 잘 학습하고 재현할 수 있는지를 실험했다. 놀랍게도, 단 몇 개의 행렬로도 원래의 패턴을 거의 완벽히 복원할 수 있었다.
이것은 MPS 모델이 단순 반복뿐 아니라 패턴의 ‘규칙성’ 자체를 학습하고 일반화할 수 있다는 걸 보여준다.
---
기존 AI 모델과 뭐가 다를까?
딥러닝이나 RNN 같은 기존 시계열 모델은 데이터의 과거 일부를 기억하고 미래를 예측하는 방식이다. 반면, MPS 기반 양자 모델은 전체 패턴을 압축된 수학 구조로 표현한 뒤, 그 구조 내에서 예측한다.
이 말은 즉,
* 예측력이 좋아지고,
* 메모리 사용량이 줄고,
* 오버피팅(과잉학습) 위험이 낮아진다는 뜻이다.
특히 중요한 건, 이 모델은 시계열의 ‘전체 모양’을 한 번에 보는 방식이라는 것. 마치 양자 상태 전체를 파악하는 것처럼 말이다.
---
실시간 예측도 가능할까?
연구진은 모델을 실시간 데이터에도 적용할 수 있도록 설계했다. 시계열 데이터를 한 번에 집어넣는 게 아니라, 앞에서부터 순차적으로 데이터를 집어넣고 예측하는 식이다. 실제 구현은 TensorFlow와 GPU 환경에서 이루어졌고, 샘플 10만 개를 생성하는 데 필요한 시간은 선형적으로 증가했다. 실시간 분석도 가능하다는 이야기다.
---
한계는 없을까?
물론 있다. 이 모델은 이산형(0 또는 1) 데이터에 최적화돼 있어, 실제 금융 데이터처럼 연속적인 값에는 먼저 적절한 전처리가 필요하다. 또한, 양자계와의 정확한 대응이 항상 명확하지는 않다.
예를 들어, 양자계에서는 시간의 흐름 개념이 없지만, 시계열에서는 과거에서 미래로의 흐름이 필수다. 이를 해결하기 위해 연구진은 MPS 구조를 ‘왼쪽에서 오른쪽으로’ 샘플링하는 방식으로 조정했다.
---
“양자 인공지능”은 결국 어디까지 갈 수 있을까?
양자계에서 온 인공지능 모델이 시계열 데이터 분석에까지 진출한 지금, 우리는 새로운 패러다임의 시작점에 서 있다.
이 모델은 아직 초기 단계다. 하지만 이미 보인 결과만으로도, 앞으로 금융시장, 날씨 예측, 질병 진단, 소셜 미디어 분석 등 다양한 분야에서 강력한 도구가 될 가능성이 크다.
그리고 그 시작은, 아주 작고 단순한 ‘업(↑)’과 ‘다운(↓)’ 신호에서 비롯됐다.
---
출처 논문
Udvarnoki, Z.; Fáth, G.
*Quantum-Inspired Models for Classical Time Series.*
Mach. Learn. Knowl. Extr. 2025, 7, 44.
---