AI, 이제는 ‘계획 세우는 법’도 가르친다
“어떤 길로 가야 가장 좋을까?”
누구나 살면서 이런 고민을 한다. 여행 경로를 짤 때도, 시험 공부 계획을 세울 때도 우리는 계획을 세우고 선택을 한다. 그런데 복잡한 상황에서 좋은 계획을 세우는 건 생각보다 어렵다. 사람은 본능적으로 불확실한 정보를 싫어하고, 한정된 시간과 에너지로 모든 경우의 수를 따지기란 쉽지 않기 때문이다.
최근 독일 막스 플랑크 연구소와 UCLA 심리학과 공동 연구팀은 이 문제를 풀기 위해 인공지능(AI)을 활용한 새로운 ‘지능형 튜터’를 개발했다. 이 튜터는 단순한 문제풀이를 넘어, 복잡한 상황에서도 더 나은 계획을 세우도록 사람을 훈련시킨다.
---
불확실한 세상, AI가 짜주는 ‘계획의 기술’
사실 AI가 사람보다 계획을 더 잘 세우는 건 새삼스러운 일이 아니다. 문제는 AI가 대신 계획을 세워주면 사람은 배우지 못한다는 점이다. 연구팀은 그래서 사람 스스로 계획을 잘 세우게 만드는 AI 튜터를 만들었다. 특히 이번에는 현실 세계처럼 ‘정보가 불완전하고 불확실한 상황’에 집중했다.
연구팀은 복잡한 결정 상황을 수학적으로 모델링했다. 예컨대 여러 갈래 길 중 하나를 선택해 목표에 도달해야 하는데, 각 길의 보상과 위험은 처음엔 확실하지 않다. 대신 일부 정보를 탐색하면서 점점 더 정확한 판단을 내리는 구조다. 이를 위해 연구진은 ‘부분 관찰 마르코프 결정 과정(POMDP)’이라는 이론을 활용했다. 어려운 말 같지만, 쉽게 말해 ‘알 수 없는 정보를 조금씩 밝혀가며 최선의 길을 찾는 과정’을 AI로 흉내 낸 것이다.
---
실험으로 증명한 AI 튜터의 효과
연구팀은 이렇게 만들어낸 AI 전략을 사람에게 가르치기 위해 온라인 실험을 진행했다. 참가자 330명은 항공 노선 설계 시나리오를 풀었다. 예컨대 여러 공항(노드)을 조사해 가장 이익이 큰 노선을 선택하는 방식이다. 참가자들은 AI 튜터의 도움을 받는 그룹, 엉터리 튜터를 받는 그룹, 아무런 도움을 받지 않는 그룹으로 나뉘었다.
결과는 놀라웠다. AI 튜터를 받은 그룹은 계획 효율성이 2배 가까이 높아졌다. 무작정 클릭해보는 대신, 먼저 목표를 정하고(먼 공항부터 조사), 그 뒤에 세부 경로를 살펴보는 식으로 체계적인 전략을 따랐다. AI가 보여준 전략을 그대로 따라 했다는 얘기다.
---
더 복잡한 계획도 가능할까
이 연구의 핵심은 사람이 AI에게서 ‘계획하는 법’을 배웠다는 점이다. 연구진은 이번 실험에서 사용한 방법이 앞으로 시간 관리, 수학 문제 풀이, 프로그래밍 같은 다양한 학습에도 적용될 수 있다고 본다. 실제로 연구에 사용된 알고리즘(MGPO)은 사람이 제한된 시간과 정보로 최선의 결정을 내리는 과정을 세밀하게 모방한다.
물론 아직 한계도 있다. 복잡한 시나리오일수록 연산량이 늘고, 이를 실시간으로 튜터링하려면 강력한 컴퓨팅 자원이 필요하다. 그래도 AI가 단순한 문제풀이를 넘어 사람의 ‘생각법’까지 코칭하는 시대가 멀지 않았다.
---
계획을 잘 세운다는 건 무엇일까
‘계획은 세웠는데 지키지 못했다.’ 누구나 이런 경험이 있을 것이다. 좋은 계획을 세운다는 건, 불확실성을 줄이고 정보에 기반해 합리적으로 선택한다는 뜻이다. 이제 AI는 사람에게 그 기술을 가르쳐준다. 이 연구는 그런 가능성을 한 발짝 더 현실로 끌어왔다.
언젠가는 학교에서도, 직장에서도 AI 튜터가 우리 곁에 앉아 “이 길이 더 나을 수도 있어!” 하고 조언해줄지 모른다. 계획이 늘 무너져서 고민이었다면, 이제 AI에게 한 수 배워보는 건 어떨까!
---
출처 논문
Heindrich, L.; Consul, S.; Lieder, F. An Intelligent Tutor for Planning in Large Partially Observable Environments. *Int J Artif Intell Educ* 2025.