"내가 뭘 놓쳤지?"… 학생의 ‘읽기 습관’을 해독하는 인공지능, LECTOR의 등장

 

LECTOR의 등장
학생의 읽기 행동을 주제별로 해석하는 AI, LECTOR의 작동 원리전자책 플랫폼에서 수집된 학습 로그를 바탕으로, AI가 핵심 주제를 추출하고 개인 맞춤형 피드백을 제공하는 과정


"이 학생은 수업 자료를 충분히 읽었는데 왜 점수가 낮을까?"

디지털 교재가 대세가 된 요즘, 교수자들이 흔히 던지는 질문이다. 

페이지를 넘긴 횟수, 읽은 시간까지 꼼꼼히 기록되지만, 정작 중요한 건 '무엇을 읽었는가'다.

 이 질문에 답을 주기 위해 등장한 것이 바로, 일본 큐슈대학교 연구팀이 개발한 AI 모델 "LECTOR"다.


---


 강의 슬라이드도 ‘의미’를 갖는다


대학 강의는 점점 더 디지털화되고 있다. ‘BookRoll’ 같은 전자책 플랫폼을 통해 학생들은 언제 어디서든 강의 자료를 볼 수 있고, 그 로그는 연구자들에게 귀중한 데이터가 된다. 


하지만 기존 분석은 주로 ‘얼마나 오래 읽었는가’, ‘어디를 클릭했는가’ 같은 행위에 초점이 맞춰져 있었다. 정작 무엇을 읽었는지, 그 내용은 무시되기 일쑤였다.


LECTOR는 바로 이 ‘내용’을 분석 대상으로 삼았다. 논문에 따르면 LECTOR는 강의 슬라이드에 담긴 텍스트를 스스로 요약하고, 주제별로 정리한 뒤, 이를 학생의 행동 로그와 연계해 분석한다. 쉽게 말해, 단순히 '5페이지를 읽었다'가 아니라, '자료구조(data structure)'라는 주제를 다룬 5페이지를 집중적으로 읽었는지를 파악하는 것이다.


---


 어떻게 작동할까? 슬라이드와 주제를 연결하는 AI


LECTOR는 슬라이드 하나하나를 분석해 어떤 주제를 담고 있는지 자동으로 태깅한다. 이때 일반적인 자연어 처리 모델보다 한 발 더 나아간다.


* 슬라이드의 제목 구조를 이용해 문맥을 이해하고,

* 각 단어가 얼마나 중요한지, 어떤 주제와 연결되는지를 계산한다.


여기서 핵심은 두 가지다.

첫째, 중요도(importance): 어떤 단어가 슬라이드 내에서 얼마나 주목받는지.

둘째, 유사도(similarity): 특정 주제와 얼마나 가까운 의미를 가지는지.


이 두 점수를 조합해, LECTOR는 슬라이드와 주제 간의 관계를 수치로 나타낸다. 그렇게 만들어진 ‘슬라이드-주제 관계 행렬’을 통해, 학생이 어떤 슬라이드를 읽었을 때 어떤 주제에 더 집중했는지를 알 수 있다.


---


 성능은 어땠을까? 사람보다 똑똑해졌다


연구팀은 두 가지 실험으로 LECTOR의 성능을 검증했다.


첫 번째는 요약 정확도 실험.

총 2,255장의 강의 슬라이드에서 핵심 키워드를 추출해, 기존 모델들과 비교했다.

그 결과:


* 기존 교육용 도구 기반 모델보다 F1-score 기준 5% 향상,

* 학생 28명이 참여한 실험에서는 사람 평가 기준으로도 평균 21% 더 정확한 키워드 추출 결과를 보였다.


두 번째는 학생 성적 예측 실험.

218명의 학생, 60만 건이 넘는 로그 데이터를 분석해, ‘낙제할 가능성이 높은 학생’을 예측했다. 단순히 ‘얼마나 읽었는가’만 본 기존 모델에 비해, LECTOR를 통합한 모델은 예측 정확도가 개선되는 경향을 보였다.


흥미로운 점은, 학생의 총 독서 시간이 같더라도 특정 주제(예: 재귀함수)에 얼마나 집중했는지가 성적과 더 밀접한 관련이 있었다는 것이다. 예를 들어, 성적이 높은 학생은 '자료구조'나 '디자인 방법론' 같은 핵심 주제에 고르게 집중했고, 그렇지 않은 학생은 특정 주제에만 몰입하거나, 중요 주제를 아예 건너뛰는 경향이 있었다.


---


 "이 학생은 왜 위험한가?"를 설명해주는 AI


LECTOR의 가장 큰 강점은 ‘해석 가능성’이다. 대부분의 인공지능은 결과만 알려줄 뿐, 왜 그런 결과가 나왔는지는 설명하지 못한다. 하지만 LECTOR는 다르다.


예를 들어, 어떤 학생이 낙제 위험군으로 분류되었다면, LECTOR는 그 학생이 '조건문'과 '리스트 구조' 주제를 덜 읽었다는 점을 구체적으로 보여준다. 또 다른 학생은 '문제 풀이'에만 치중해 기본 개념을 소홀히 했다는 사실이 드러난다.


이 정보는 단순한 성적 예측을 넘어, 개별 학생에게 맞춤형 피드백을 제공할 수 있는 근거가 된다.


---


 향후 과제는? 이미지 인식, 구조 없는 슬라이드 보완


LECTOR는 분명 기존 방식보다 우수하지만, 한계도 있다.


* 슬라이드 제목이 불명확하거나 계층 구조가 없는 자료에서는 효과가 떨어진다.

* 이미지 중심의 슬라이드는 분석이 어렵다.

* 슬라이드 간 문맥 연결이 부족하다는 점도 있다.


연구팀은 앞으로 이 한계를 극복하기 위해 이미지 처리, 인접 슬라이드 연결, 멀티모달 분석 등을 연구할 계획이라고 밝혔다.


---


 “학생이 읽은 것”과 “학생이 배운 것” 사이의 간극을 메우다


학생의 학습 과정을 분석하는 기술은 계속 발전하고 있다. 하지만 많은 시스템이 ‘행동만’ 추적할 뿐, 그 안에 담긴 **의미와 문맥**을 놓치는 경우가 많았다.


LECTOR는 이 틈을 메우는 모델이다.

단순한 페이지 클릭 로그를 넘어서, 학생이 무엇을 어떻게 읽었는지를 주제 기반으로 분석하고,

그 결과를 바탕으로 맞춤형 지원을 설계할 수 있는 기반을 마련했다.


AI 기술이 단순한 ‘감시자’에서 ‘조력자’로 나아가는 전환점이 될 수 있을지, 앞으로의 연구가 기대된다.


---


#AI교육 #키워드추출 #학습분석 #낙제예측 #강의요약


---


출처 논문

López Zapata, E.D.; Tang, C.; Švábenský, V.; Okubo, F.; Shimada, A.

LECTOR: Summarizing E-book Reading Content for Personalized Student Support.

*Int J Artif Intell Educ* (2025).