“수학 선생님이 AI라고?” GPT가 만든 ‘맞춤형 힌트’, 얼마나 똑똑할까



대학생들이 수학 문제를 풀다 틀릴 때, “왜 틀렸는지”, “어떻게 고쳐야 할지” 알려주는 똑똑한 튜터가 있다. 그런데 그 튜터, 알고 보니 인간 선생님도 아니고, 사전에 짜놓은 규칙도 아닌, 바로 GPT-4였다. 요즘 핫한 생성형 인공지능이 실시간 피드백 선생님 역할까지 해낸다는 이야기다.

그렇다면 과연 AI는 실제 수업 현장에서 학생들에게 유용한 피드백을 줄 수 있을까? 조지아 공대 연구팀은 이 질문에 대한 답을 찾기 위해 흥미로운 실험을 벌였다. 이름하여, "GPT가 수학 튜터가 될 수 있을까?"


수학 문제 틀렸을 때, GPT가 대신 설명해준다면?

이 연구의 무대는 미국 조지아주의 한 전문대학 수학 수업. 학생들은 대수학 문제를 푸는 온라인 튜터 시스템을 사용했다. 이 시스템은 각 문제를 몇 단계로 나눠 학생이 한 걸음씩 문제를 풀도록 유도한다.

연구팀은 이 시스템에 접속한 학생들의 오답 데이터 약 1,300건을 분석했다. 그리고 그 중에서 GPT-4에게 이렇게 물었다:

“이 학생이 틀린 이유가 뭐야? 그리고 어떻게 고치라고 말해줄 수 있을까?”

그 결과는 꽤 인상적이었다. GPT-4는 학생이 무엇을 잘못했는지 87.8%의 정확도로 진단해냈고, 그에 맞는 개인화된 피드백도 생성할 수 있었다.



그냥 “틀렸습니다”는 이제 그만

기존의 지능형 튜터 시스템은 대부분 미리 정해놓은 규칙에 따라 피드백을 제공한다. 이런 방식은 오류를 자동으로 처리할 수 있어서 편리하지만, 학생의 다양한 오답을 유연하게 받아들이지는 못한다.

GPT-4는 이 한계를 돌파할 수 있을까? 연구진은 오답을 다음과 같이 5가지 유형으로 나누었다:

  • 논리 오류 – 계산 순서나 수학 개념을 잘못 적용
  • 문법 오류 – 맞는 답이지만 형식이 잘못된 경우
  • 불완전한 입력 – 답을 다 입력하지 않음
  • 잘못된 칸에 입력 – 맞는 답인데 엉뚱한 칸에 써버림
  • 다른 데서 틀림 – 해당 칸은 맞았지만 전체 문제는 틀린 경우


“다시 생각해보자!” GPT가 알려주는 스마트 피드백

흥미로운 건 GPT-4가 만들어낸 피드백 대부분이 사람의 손길이 느껴질 정도로 친절하고 구체적이었다는 점이다. 예를 들어, 괄호 하나를 빠뜨린 학생에게 GPT는 이렇게 말했다:

“괄호도 수학의 일부야! 식 전체의 구조를 명확히 표현하려면 괄호를 꼭 써야 해. 다시 한번 확인해보자.”

정답을 바로 알려주는 게 아니라, 학생이 스스로 실수를 인식하고 수정할 수 있도록 돕는 데 초점을 맞춘다.



감정까지 챙긴 힌트, 과연 AI가 쓴 걸까?

AI가 만든 피드백은 문법이나 내용뿐 아니라, 감정적인 톤까지 고려됐다. 대부분의 힌트가 “좋은 시도야!”, “잘하고 있어!” 같은 긍정적인 말투로 끝났고, 읽기 쉬운 문장 구조를 갖추고 있었다.

정답에 변수 하나가 빠졌을 때는 이렇게 말했다:

“숫자는 맞았어! 이제 변수 x를 포함한 식으로 표현해보자.”


AI 튜터의 미래는 어디로?

이번 연구는 GPT 같은 생성형 AI가 실제 교육 현장에서 피드백 역할을 충분히 수행할 수 있음을 보여준 실험이었다. 물론 완벽한 정답 진단이나 오류 없는 피드백을 보장하진 않는다. 하지만 GPT는 기존 시스템보다 훨씬 유연하고 인간적인 피드백을 제공할 수 있다는 점에서 주목할 만하다.

교육 기술이 진화하면서, AI가 학생의 실시간 행동을 분석하고, 그에 맞춰 설명하고 방향을 제시하는 시대가 오고 있다. GPT-4는 그 미래의 시작점일지 모른다.





출처
Reddig, J. M., Arora, A., & MacLellan, C. J. (2025). Generating In-Context, Personalized Feedback for Intelligent Tutors with Large Language Models. International Journal of Artificial Intelligence in Education. https://doi.org/10.1007/s40593-025-00505-6