인공지능 지원 학습이 STEM 교육 성과에 미치는 영향과 최적의 활용 조건

AI 기반 수학·과학 교육의 실제 성적 상승 효과와 인지적 메커니즘 분석

교실에서 인공지능을 활용해 과학과 수학을 가르치면 학생들의 성적이 정말로 올라갈까. 인공지능 기술이 교육 현장에 빠르게 도입되면서 많은 교사와 학부모가 이에 대한 의문을 품기 시작했다. 특히 수학, 과학, 기술, 공학을 아우르는 STEM 교육 분야는 추상적인 개념과 복잡한 문제 해결 과정을 포함하고 있어 학생들의 진입 장벽이 높은 편이다. 전통적인 수업 방식으로는 이해하기 어려운 분자 상호작용이나 물리적 힘의 역학 관계를 디지털 시뮬레이션으로 시각화하거나, 학생 개개인의 성취도에 맞춰 문제 난이도를 실시간으로 조절하는 지능형 대화 시스템 등은 교육 패러다임의 혁신을 이끌고 있다.

이러한 배경 속에서 튀르키예의 디즐레대학의 유누스 도안 교수가 이끄는 연구진은 2005년부터 2025년 사이에 발표된 35편의 실험 연구 데이터를 종합하여 인공지능 지원 학습이 STEM 성과에 미치는 영향을 객관적으로 증명하고자 메타분석을 실시했다.

분석 결과에 따르면, 인공지능을 수업에 도입했을 때 학생들의 학업 성취도는 전통적인 수업 방식을 적용했을 때보다 명확하게 향상되는 효과를 보였다. 이번 대규모 통계 분석 연구는 인공지능이 실제 교육 효과를 얼마나 만들어내는지, 그리고 어떤 연령대와 기간에서 학습 효과가 가장 극대화되는지를 구체적인 수치로 밝혀냈다는 점에서 매우 중요한 교육적 단서를 제공한다.

인공지능 기반 학습이 학습자의 인지적 성장을 돕고 성적 상승을 견인하는 핵심 요인은 개인 맞춤형 피드백과 가상 실험 환경의 제공에 있다.

연구진은 단순히 기술을 도입하는 것만으로 모든 교육 문제가 해결되는 것은 아니며, 학습 환경의 설계와 학생의 연령대별 특성에 맞춰 기술을 정밀하게 결합해야만 부작용 없이 학습 능력을 끌어올릴 수 있다고 설명한다. 본 글에서는 이번 메타분석 논문에 제시된 구체적인 통계 결과와 함께 인공지능이 교실 안에서 학습 효과를 높이는 구체적인 메커니즘을 상세히 분석해보고자 한다.

인공지능 기반 STEM 수업은 전통적인 교실 교육보다 얼마나 더 효과적일까

검색 사용자들이 교육용 인공지능의 효용성을 판단할 때 가장 먼저 던지는 질문은 인공지능이 전통적인 수업 방식보다 실제로 우수한 성과를 내는가이다. 연구진이 35편의 엄격한 비교 실험 연구를 바탕으로 효과 크기를 계산한 결과, 인공지능 지원 학습의 전체 효과 크기는 랜덤 효과 모형 기준으로 g=0.670이라는 통계적 수치를 기록했다.

이는 통계학적으로 중간 이상의 큰 효과에 해당하며, 인공지능을 활용해 학습한 학생들이 일반적인 강의식 수업을 들은 학생들에 비해 학업 성취도 면에서 뚜렷하게 우위를 점했다는 사실을 명백히 보여준다.

인공지능이 이처럼 높은 교육 성과를 기록한 이유는 지능형 튜터링 시스템과 적응형 학습 플랫폼이 지닌 독특한 상호작용 방식 덕분이다. 과거의 표준화된 교육 방식은 학급 전체의 평균적인 진도에 맞춰 수업을 진행할 수밖에 없어 상위권 학생에게는 지루함을, 하위권 학생에게는 과도한 좌절감을 주기 쉬웠다. 반면 교육용 인공지능은 학생이 문제를 푸는 과정에서 보이는 오답 패턴과 소요 시간 등의 대규모 교육 데이터를 실시간으로 분석한다.

이를 통해 개별 학생이 막히는 지점을 정확히 파악하여 맞춤형 힌트를 제공하고, 난이도와 학습 속도를 역동적으로 조절함으로써 학생이 지치지 않고 학습에 몰입할 수 있도록 인지적 지지대 역할을 수행한다.

왜 고등학생들이 인공지능 지원 수업에서 가장 비약적인 성적 상승을 보였을까

논문의 조절 효과 분석 결과 중 가장 주목할 만한 부분은 학생들의 학교급에 따라 인공지능의 학습 효과가 매우 다르게 나타났다는 점이다. 연구진의 분석에 따르면 인공지능 지원 학습은 고등학교 수준에서 g=1.099라는 압도적으로 높은 효과 크기를 나타냈다. 이에 반해 대학생 집단에서는 g=0.578로 중간 수준의 효과를 보였으며, 초등학교 집단은 g=0.465, 중학교 집단은 g=0.392 수준에 머물렀다. 이러한 집단 간 차이는 통계적으로 유의미한 수준으로 확인되었다.

왜 고등학교 시기에 인공지능의 교육적 영향력이 이토록 극대화되는 것일까. 이에 대한 원인은 학습자의 자기조절 능력과 교과 내용의 복잡성이라는 두 가지 요인의 결합에서 찾을 수 있다. 인공지능 학습 기기는 학생에게 자율성을 부여하지만, 스스로 학습 과정을 모니터링하고 집중력을 유지하는 최소한의 자기통제력이 뒷받침되지 않으면 무의미한 클릭이나 기계적인 답변 입력으로 이어져 오히려 학습 효율이 떨어질 위험이 존재한다.

초등학생과 중학생의 경우 디지털 기기를 활용한 자기 주도적 학습 경험과 디지털 리터러시가 상대적으로 부족하여 시스템이 제공하는 피드백을 깊이 있게 소화하지 못할 가능성이 크다. 반면 고등학생은 어느 정도 정립된 자기조절 능력을 갖추고 있으면서도, 대학생에 비해 교실 안에서 주어지는 시스템 기반의 구조화된 학습 안내에 더 높은 순응도를 보이기 때문에 최적의 성과를 거둔 것으로 해석된다. 아울러 고등학교 STEM 교과 특유의 높은 추상성과 난이도를 인공지능이 효과적으로 보완해 주었기 때문이기도 하다.

수학과 과학 교과에서 디지털 시뮬레이션이 인지적 장벽을 대폭 낮추는 메커니즘

수학과 과학은 눈에 보이지 않는 미시적인 세계나 고차원의 추상적 개념을 다루기 때문에 많은 학생이 중간에 학습을 포기하곤 한다. 논문은 인공지능이 이러한 과목 특유의 인지적 장벽을 어떻게 허무는지 잘 보여준다. 세부 교과별 분석에서 과학과 수학 분야는 기술 및 공학 분야에 비해 약간 더 높은 효과 크기를 기록했다. 비록 교과별 효과 크기의 통계적 차이가 아주 결정적이지는 않았지만, 인공지능이 과학과 수학적 사고력을 키우는 데 매우 훌륭한 촉매제가 될 수 있음은 분명하다.

과학 교육에서 인공지능과 결합된 가상 실험실은 물리적인 예산과 자원의 제약, 혹은 실험실 안전사고의 위험성 때문에 학교 현장에서 포기해야 했던 수많은 실습 기회를 무제한으로 복제하여 제공한다. 학생들은 가상 환경에서 분자들의 결합을 눈으로 관찰하거나 중력의 크기를 자유롭게 바꾸어가며 실험을 반복 수행할 수 있다.

이 과정에서 인공지능은 학생이 세운 가설과 실험 절차를 실시간으로 모니터링하며 인지적 오류를 교정하는 데이터 기반의 피드백을 건넨다. 이처럼 즉각적인 반응을 제공하는 시각적 자극은 단순 암기식 수업에 비해 개념적 이해도를 깊게 만들며, 수학적 난제를 해결하는 과정에서 생기는 불안감과 좌절감을 줄여주고 학습 동기를 크게 고취하는 긍정적인 심리적 효과를 유도한다.

학습 기간이 무조건 길어진다고 해서 인공지능의 교육 효과가 계속 상승하지 않는 이유

학교 현장이나 가정에서 인공지능 교육 프로그램을 도입할 때 범하기 쉬운 가장 큰 오류 중 하나는 장기간 사용하면 할수록 성적이 계속해서 정비례하며 상승할 것이라는 믿음이다. 그러나 연구진이 인공지능 지원 수업의 지속 기간에 따른 효과를 정밀하게 분석한 결과, 기간이 길어진다고 해서 효과 크기가 선형적으로 증가하는 일관된 패턴은 관찰되지 않았다. 학습 효과가 가장 강하게 나타난 기간은 1달 초과 2달 이하 동안 집중적으로 학습을 진행한 경우였다.

오히려 장기적인 관점에서 기술 기반 수업을 무분별하게 연장할 경우 예기치 못한 부작용이 발생할 수 있음이 실증적으로 제기되었다.

첫째는 새로운 디지털 학습 환경에 처음 접했을 때 반짝 상승하는 신기 효과의 소멸이다. 초기에는 인공지능 챗봇이나 가상 시뮬레이션 시스템이 주는 참신함 덕분에 학생들의 몰입도가 비약적으로 상승하지만, 시간이 흐르고 기기 조작에 익숙해지면 학습 동기가 평이한 수준으로 수렴하게 된다.

둘째는 과도한 시스템 의존증이다. 인공지능이 매 단계마다 정답으로 가는 힌트와 자동화된 안내를 지나치게 상세하게 제공하면, 학생들은 스스로 깊이 고민하고 논리적 추론을 전개하려는 노력을 멈춘 채 시스템의 보조에 전적으로 의존하는 수동적인 학습 태도를 형성하게 된다.

결국 학습 성과를 장기적으로 유지하기 위해서는 인공지능을 상시적으로 켜놓는 것이 아니라, 특정 단원의 개념을 다지거나 고난도 과제를 해결하는 결정적인 시기에 맞춤형 인터벤션 형태로 밀도 있게 결합하는 설계 전략이 요구된다.

인공지능의 교육적 부작용인 인지 과부하와 가짜 정보 유포를 제어하는 설계 규칙

본 메타분석 논문은 인공지능 교육이 지닌 장점만을 나열하는 편향된 시각을 경계하며, 잘못 설계된 디지털 학습 환경이 유발할 수 있는 기술적 한계와 제한 사항을 묵직하게 경고한다. 최근 각광받는 생성형 인공지능 기술은 학생들의 질문에 척척 답해주는 편리함을 제공하지만, 때때로 실재하지 않는 사실을 진짜처럼 꾸며내어 답변하는 할루시네이션 현상을 일으킨다.

만약 비판적 사고력이 완성되지 않은 학생이 인공지능이 도출한 잘못된 수학적 증명이나 왜곡된 과학적 사실을 무비판적으로 수용하게 된다면, 오히려 잘못된 개념인 오개념을 학습하게 되는 치명적인 결과를 초래할 수 있다.

또 다른 잠재적 위험 요인은 인지 과부하이다. 학생의 사전 지식 수준을 고려하지 않은 채 화려한 3D 시뮬레이션 환경이나 복잡한 사용자 인터페이스를 갖춘 인공지능 시스템을 무리하게 투입하면, 학생의 뇌는 교과 내용 자체를 이해하는 데 신경을 쓰기보다 소프트웨어를 조작하고 다루는 방식을 익히는 데 더 많은 인지적 에너지를 소모하게 된다.

이러한 현상은 학습 본연의 성과를 오히려 떨어뜨리는 역효과를 낳는다. 따라서 학교 교육과정을 설계하는 정책 입안자들과 에듀테크 개발자들은 인공지능이 제시하는 정보의 교차 검증 장치를 철저히 마련해야 하며, 학습자의 수준에 맞게 단계별로 기능을 개방하는 스캐폴딩 구조를 꼼꼼하게 설계해야만 교육 격차의 확대를 막고 기술의 교육적 가치를 안전하게 보전할 수 있다.

인공지능은 인간 교사를 대체하는 것이 아니라 보조할 때 강력해진다

이번 연구 결과를 종합해 볼 때, 인공지능은 교실에서 인간 교사를 완전히 밀어내고 대체하는 독립적인 존재가 아니라 교사의 교수 지도를 정밀하게 보조하는 강력한 조력자로 정의될 때 가장 이상적인 결과물을 만들어낸다. 인공지능은 학생들의 대규모 데이터를 실시간으로 감시하고 분석하여 어떤 학생이 낙오할 위험이 있는지, 특정 단원에서 학급 전체가 공통적으로 가지는 오개념이 무엇인지를 교사에게 대시보드 형태로 일목요연하게 제공해 준다.

교사는 인공지능 덕분에 단순 반복적인 채점 업무나 행정적 리소스 소모에서 벗어나, 데이터가 가리키는 위험군 학생들을 직접 찾아가 정서적 교감을 나누고 맞춤형 대면 지도를 제공하는 등 인간 고유의 고차원적 교육 행위에 온전히 집중할 수 있게 된다.

인공지능 지원 교육의 성공 여부는 최첨단 알고리즘의 도입 여부가 아니라, 그 기술을 교실이라는 역동적인 공간 안에서 교사가 어떻게 기존 교육과정과 유기적으로 융합해 내는가에 달려 있다. 디지털 리터러시와 자기조절 능력의 차이로 인해 발생할 수 있는 학습 격차를 세심하게 조율하는 교사의 전문성이 결합될 때 비로소 인공지능은 미래 STEM 교육을 승리로 이끄는 진정한 혁신의 도구가 될 것이다.

출처

Doğan, Y., Kılıç, Z., Kalınkara, Y., & Talan, T. (2026). The impact of artificial intelligence-supported instruction on student learning in STEM: A systematic review and meta-analysis. Journal of Intelligence, 14(6), 109. https://doi.org/10.3390/jintelligence14060109