AI 시대의 대학 글쓰기 평가, 표절 적발에서 학습 과정 중심으로 전환해야 한다

인공지능과 공존하는 고등교육을 위한 새로운 작문 평가 패러다임과 제도적 과제

인공지능 기술의 급격한 발전은 대학 교육, 그중에서도 학생들의 비판적 사고와 논리력을 평가하는 핵심 수단인 학술적 글쓰기 환경을 근본적으로 뒤흔들고 있다. 대학 강의실에서 생성형 AI 프로그램의 사용이 일상화되면서 기존의 과제 제출형 평가는 심각한 타격을 받게 되었다. 인공지능이 몇 초 만에 그럴듯한 에세이를 작성해내는 상황에서, 학생이 제출한 최종 결과물만 보고 그의 실제 작문 실력과 학업 성취도를 정밀하게 측정하는 것은 더 이상 불가능에 가깝다. 이제 교육 현장은 단순히 인공지능 활용을 금지하거나 표절 검사 프로그램에 의존해 부정행위를 적발하는 수동적 방식에서 벗어나야 한다는 거센 요구에 직면해 있다.

심리학 및 교육학 학술지 Frontiers in Psychology에 발표된 최신 메타분석 연구인 'AI 시대를 위한 글쓰기 평가의 재구상: AI 지원과 실제 기술 성장 간의 균형에 대한 체계적 문헌고찰'은 이러한 혼란을 해결할 실전적인 대안을 제시한다. 모하메드 사이드 압델라티프(Mohamed Sayed Abdellatif) 교수 연구진은 2020년부터 2025년 사이에 발표된 19편의 엄격한 실증 연구 데이터를 정밀하게 종합하여 분석했다. 이 논문은 전 세계 대학생들과 교수진이 실제로 인공지능을 어떻게 활용하고 있는지 구체적인 통계를 보여주는 동시에, 인공지능의 편리함에 가려진 인간 고유의 인지 능력 저하 메커니즘을 과학적으로 분석했다. 나아가 인공지능을 학습의 방해꾼이 아닌 강력한 교육적 파트너로 바꾸기 위한 대학 평가 체제 개편 방안을 다각도로 다루고 있다.

연구 결과에 따르면 대학생들은 이미 다양한 인공지능 도구를 작문의 각 단계마다 고도로 전략적인 방식으로 배치하여 사용하고 있다. 특히 챗지피티(ChatGPT)의 학생 이용률은 무려 88.8%에 달해 생성형 인공지능 모델 중 압도적인 1위를 기록했으며, 전통적인 디지털 글쓰기 비서인 그래머리(Grammarly) 역시 67.4%의 높은 활용도를 나타냈다. 학생들은 인공지능을 단순한 대필 도구로 쓰는 것이 아니라, 자신의 뇌가 처리해야 할 인지적 과부하를 줄이기 위한 수단으로 영리하게 분담하고 있다. 이 글에서는 논문의 분석 결과를 바탕으로 학생들이 인공지능에 과도하게 의존할 때 발생하는 인지적 역효과를 살펴보고, 대학 평가 체제가 어떤 방식으로 변화해야 하는지 구체적인 원인과 메커니즘을 밝혀내고자 한다.

대학생들은 인공지능을 어떤 방식으로 글쓰기 단계에 활용할까

대학 현장에서 인공지능은 글쓰기의 모든 과정을 깊숙이 파고들었다. 연구진의 분석에 따르면 학생들은 작문의 인지적 요구도와 성격에 따라 서로 다른 인공지능 도구를 교차하여 활용하는 영리한 전략을 구사한다. 인공지능 도구는 크게 챗지피티, 제미나이(Gemini), 딥시크(DeepSeek) 같은 거대언어모델 기반의 생성형 AI와 그래머리, 퀼봇(Quillbot) 같은 자동 글쓰기 평가 시스템으로 나뉜다. 학생들은 이 두 가지 카테고리의 기술을 작문 단계별로 철저하게 다르게 적용하고 있다.

먼저 글쓰기의 시작 단계인 아이디어 구상과 개요 작성, 그리고 초기 초안을 작성하는 과정에서는 생성형 AI인 챗지피티 계열의 도구가 완전히 지배한다. 주제를 어떻게 잡아야 할지 막막할 때 인공지능에게 질문을 던져 아이디어를 얻거나 문단을 확장하는 식이다. 반면 최종 글을 다듬는 수정 및 편집 단계로 넘어가면 자동 글쓰기 평가 시스템의 활용도가 급격히 높아진다. 이 단계에서 학생들은 그래머리 등을 활용하여 철자 오류를 잡고 문법을 교정하며, 문체와 어휘를 세련되게 다듬는 기계적인 작업들을 처리한다.

이러한 단계별 도구 선택은 인간의 뇌가 가진 인지적 한계를 극복하려는 시도와 맞닿아 있다. 인지부하 이론에 따르면 인간의 작업 기억 용량은 한정되어 있어, 핵심적인 학습 목표 외에 부차적인 스트레스가 가해지면 복잡한 사고를 전개하기 어려워진다. 학술적 글쓰기에서 맞춤법 검사나 단순 문장 패러프레이징 같은 반복적인 기계적 작업은 고도의 수사학적 판단이나 논리적 추론을 요구하지 않으면서도 작업 기억을 불필요하게 소모시킨다. 따라서 학생들은 이러한 단순 반복 업무를 인공지능에게 전적으로 위임함으로써, 절약된 뇌의 에너지를 논리 구조 구축이나 핵심 주장 전개 같은 더 가치 있는 영역에 집중시키려는 효율적인 선택을 내리는 것이다.

단순 작업 위임이 인간의 고차원적 비판 사고력을 무너뜨리는 과정

인공지능을 활용해 인지적 에너지를 절약하는 행위는 겉보기에는 매우 효율적인 학습 전략처럼 보이지만, 치명적인 인지 과학적 함정이 숨어 있다. 교육학에서 널리 쓰이는 블룸의 교육목표 분류학에 따르면, 인간의 인지 능력은 기억하기, 이해하기, 적용하기 같은 하위 단계부터 분석하기, 평가하기, 창조하기 같은 상위 단계로 이어지는 위계적 구조를 지닌다. 문제는 학생들이 복잡한 학술적 글쓰기 과정을 인공지능에 맡길 때, 하위 인지 기능뿐만 아니라 논리적 주장을 구성하고 다양한 출처를 종합하는 고차원적 인지 영역까지 점진적으로 인공지능에게 넘겨주게 된다는 점이다.

연구진의 분석 결과, 인공지능의 지원을 적극적으로 받은 학생들은 단기적인 정보 회상이나 개념 이해, 단순한 규칙 적용 같은 하위 인지 기능 영역에서는 유의미한 성과 향상을 보였다. 인공지능이 훌륭한 튜터 역할을 하며 문장의 가독성을 높이고 정보의 구조화를 도왔기 때문이다. 그러나 비판적 사고, 심층적 데이터 분석, 독창적인 이론적 종합 같은 상위 인지 기능 영역은 인공지능을 사용하면 할수록 심각하게 퇴화하는 현상이 관찰되었다. 이를 인지 과학에서는 인지적 오프로딩, 즉 뇌의 생각 기능을 외부 장치에 통째로 넘겨버려 발생하는 부작용으로 설명한다.

생성형 AI는 기본적으로 그럴듯한 문장을 이어 붙이는 통계적 모델이기 때문에, 블룸의 최상위 단계인 창조 영역이나 정교하고 일관된 논리적 논증을 구축하는 작업에서는 심각한 약점을 드러낸다. 그럼에도 불구하고 학생들이 깊은 인지적 노력 없이 인공지능이 뱉어낸 답변을 그대로 과제물로 채택하는 동반자적 관계가 아닌 정답 제공자로만 대할 경우, 스스로 문제를 해결하고 장기 기억에 지식을 저장하는 두뇌의 신경 메커니즘이 원천적으로 차단된다. 생각하는 훈련을 인공지능에게 양도한 대가로 학생들의 내면에는 비판적 판단력 대신 인지적 게으름이 깊숙이 자리 잡게 되는 원인이다.

대학생들은 왜 교수 몰래 인공지능 과제 대필의 유혹에 빠져들까

교수진은 학생들이 단순히 부정행위를 저지르기 위해 악의적인 의도를 품고 인공지능을 이용해 과제를 베낀다고 생각하기 쉽다. 하지만 연구진이 분석한 실증 데이터의 결과는 전혀 달랐다. 학생들이 대학 당국의 눈을 피해 인공지능을 부적절하게 대필이나 전면적인 과제 생성에 사용하는 근본적인 배경에는 학생 개인의 도덕적 결함보다는 대학 사회의 구조적 취약성과 제도적 공백이 강하게 작용하고 있었다.

가장 직접적인 원인은 학업과 일상의 과도한 압박이다. 학기 말에 쏟아지는 방대한 과제량, 학점 경쟁에 대한 극심한 스트레스, 아르바이트나 취업 준비로 인한 시간 부족에 직면한 학생들에게 몇 초 만에 고품질의 텍스트를 생산해내는 인공지능의 기술적 편의성은 거부하기 힘든 강력한 유혹이 된다. 게다가 인공지능이 작성한 글은 기존의 표절 적발 시스템으로 쉽게 잡아내기 어렵고 적발 위험성도 낮다는 인식이 퍼지면서, 이를 일종의 합리적인 지름길로 여기는 심리가 자연스럽게 형성된다.

더 큰 문제는 무엇이 허용되고 무엇이 부정행위인지 명확히 구별해주는 기준이 없는 정책적 진공 상태에 있다. 많은 대학이 인공지능 활용에 대한 명확하고 세부적인 가이드라인을 제공하지 못하고 있으며, 이로 인해 학생들은 윤리적 모호함 속에서 방치되어 있다. 실제로 대다수의 학생이 수행하는 비밀스러운 인공지능 문장 수정이나 패러프레이징 행위는 교수를 속이려는 고의적 사기 행위가 아니라, 단순한 도움과 부정행위 사이의 경계를 정확히 인지하지 못해 발생하는 혼란에서 비롯된다. 교육 기관이 올바른 사용법을 가르치지 않은 채 최종 결과물만으로 학생들을 처벌하려 들 때, 학생들은 학습 대신 적발을 피하기 위한 기술적 꼼수만을 최적화하게 된다.

대학 구성원들이 바라보는 인공지능에 대한 거대한 시각 차이

대학 사회를 구성하는 학생, 교수, 행정가들은 인공지능의 도입을 바라보는 관점에서 매우 극명한 대립을 보인다. 이러한 이해관계의 충돌은 인공지능 시대에 맞는 새로운 교육 프레임워크를 정착시키는 데 있어 가장 큰 걸림돌이 되고 있다. 각 주체가 중요하게 생각하는 핵심 가치가 완전히 다르기 때문에 대학 내부의 소통은 평행선을 달리기 십상이다.

학생 집단은 철저하게 생산성과 접근성 중심의 긍정적인 태도를 취한다. 과제 작성 시간을 획기적으로 줄여주고, 글의 구조를 즉각적으로 잡아주는 인공지능을 유용한 학업 보조자로 인식하는 것이다. 특히 영어가 모국어가 아닌 유학생이나 다국어 학습자들에게 인공지능은 언어적 장벽을 허물어주고 자신의 학술적 목소리를 당당하게 낼 수 있도록 돕는 강력한 지원군 역할을 한다. 물론 대학원생 고년차로 갈수록 인공지능의 획일적인 문체가 자신만의 고유한 학술적 개성과 목소리를 지워버릴 수 있다는 정체성 상실의 우려를 표하기도 하지만, 전반적인 유용성에 대해서는 깊이 공감하고 있다.

반면 교수진은 학문적 정직성과 평가의 유효성을 최우선으로 두는 완강한 거부감을 나타낸다. 이들은 학생들이 인공지능을 통해 텍스트를 무단 복제하는 행위를 새로운 형태의 표절로 규정하며, 이로 인해 비판적 사고력과 창의성이 완전히 고갈될 것을 심각하게 우려한다. 학생이 직접 쓴 글과 인공지능이 만들어낸 글을 기술적으로 구별하기 어렵다는 현실적인 무력감 역시 교수들이 인공지능 도입을 보수적으로 바라보게 만드는 핵심 요인이다. 한편 대학 본부의 대학 행정가들은 학교의 대외적 평판과 규제 프레임워크 구축에만 몰두하며 전면 금지 대신 교수 개인의 재량에 책임을 떠넘기는 조심스러운 개방 태도를 유지하고 있다.

표절 검사를 포기하고 글쓰기 수정 과정을 추적해야 하는 이유

인공지능의 텍스트 생산 능력이 인간 전문가 수준에 도달한 이상, 사후에 인공지능 사용 여부를 감별해내는 적발 중심의 평가 모델은 완전히 수명을 다했다. 논문은 대학이 평가의 신뢰성을 회복하기 위해 과제라는 최종 생산물 중심의 평가에서 벗어나, 학생이 글을 작성하는 일련의 동적인 경로를 평가하는 과정 중심 평가 시스템으로 완전히 대전환해야 한다고 강력히 주장한다.

과정 중심 평가의 핵심 메커니즘은 학생이 인공지능을 어떻게 활용하고, 그 과정에서 어떤 주도적인 수사학적 결정을 내렸는지 기록을 남기게 만드는 것이다. 예를 들어 컴퓨터 워드 프로그램의 변경 내용 추적 기능이나 클라우드 문서의 편집 히스토리를 제출하도록 하여, 문장이 시간에 따라 어떻게 수정되고 발전했는지 논리적 전개 과정을 직접 확인하는 방식이다. 학생에게 단순히 에세이를 제출하라고 요구하는 대신, 인공지능이 초기에 제안한 거친 텍스트를 정밀하게 비판하고 오류를 찾아내어 직접 수정한 비교 분석 보고서를 과제로 설계할 수도 있다.

이러한 방식은 인공지능을 단순한 유령 작가가 아닌 피드백을 주고받는 논쟁 파트너로 격상시킨다. 학생은 인공지능의 제안을 무비판적으로 수용하지 않고 이를 평가하고 선별하는 과정에서 고차원적인 메타인지 능력을 강제로 발휘해야만 한다. 결과적으로 최종 에세이 한 장으로 성적을 매기던 과거의 관행에서 탈피하여 자기 평가, 동료 피드백, 인공지능 분석 데이터, 그리고 담당 교수의 심층적 인간적 판단이 유기적으로 결합된 다원적 평가 생태계를 구축할 때 비로소 인공지능 시대의 교육적 정당성을 확보할 수 있다.

인공지능 교육의 불평등을 해결하기 위한 대학 당국의 과제

인공지능을 고등교육 마당으로 끌어안기 위해 선행되어야 할 긴급한 과제는 대학의 자원 배분 불균형 문제를 해결하고 포괄적인 인공지능 리터러시 교육을 제도화하는 것이다. 현재 전 세계 많은 대학은 인공지능이라는 거대한 해일 앞에서 인프라와 정책 모두 심각한 빈곤 상태를 겪고 있다.

조사 결과 대학 행정 당국의 자원 예산 배분은 매우 기형적으로 치우쳐 있었다. 관련 지침과 예산의 무려 67%가 교수들을 교육하고 통제하는 가이드라인 개발에만 집중된 반면, 정작 기술을 매일 사용하는 학생들을 위한 직접적인 지원이나 인공지능 활용법 교육 프레임워크에는 고작 17.8%의 자원만이 할당되어 있었다. 학생들이 윤리적 경계선과 올바른 프롬프트 작성법을 배울 기회가 원천적으로 부족할 수밖에 없었던 구조적 원인이 여기에 있다. 교육 인프라의 양극화는 국가 간, 학교 간 불평등으로도 이어진다. 자원이 풍부한 북반구 글로벌 선진 대학들이 인공지능 교육 인프라를 빠르게 흡수하는 동안, 재정이 열악한 남반구 글로벌 사우스 지역의 대학들은 기본적인 디지털 인프라 부족과 서구 중심, 영어 중심의 인공지능 기술 설계 장벽에 가로막혀 교육 격차가 더욱 심각하게 벌어지고 있다.

따라서 인공지능 시대의 고등교육 개혁은 단순히 평가 기법을 바꾸는 지엽적인 대책을 넘어, 기술 정의와 교육적 형평성에 기반한 거시적 재설계로 나아가야 한다. 대학은 학생들을 단순한 부정행위 감시 대상자로 보지 말고, 인공지능 기술을 비판적으로 통제하고 활용할 수 있는 역량인 인공지능 리터러시 교육과정을 필수 교양으로 지정하여 전면적으로 가르쳐야 한다. 궁극적으로 인공지능이 제공하는 가짜 지식 속에서 무엇이 진실인지 판별하는 윤리적 추론 능력과 비판적 판단력이라는 가장 인간다운 고유의 인지적 영토를 지켜내고 키워내는 것, 그것이 인공지능 시대에 대학이 여전히 존재해야 하는 유일한 이유이다.

출처

Abdellatif, M. S., Alshehri, M. A., Lamouchi, A., Rahmath, M., & Nemt-allah, M. A. (2026). Reimagining writing assessment for the AI era: a systematic review on balancing AI support and authentic skill growth. Frontiers in Psychology, 17, 1809174. https://doi.org/10.3389/fpsyg.2026.1809174