인공지능으로 되살리는 고대 그리스어: 언어 모델의 혁신적 적용

AI와 철학의 조우 — 고대 그리스어를 마주한 인공지능, 시간과 지식의 경계를 넘다



고대 언어, 현대 기술과 만나다

고대 그리스어는 오늘날까지 철학, 수학, 의학 등 수많은 분야에 지대한 영향을 끼친 언어다. 그러나 복잡한 문법 체계와 원어민 부재 등으로 학습과 연구에 많은 어려움을 동반하며, 전 세계적으로 교육 현장에서의 입지도 점점 줄어들고 있다. 이에 대한 새로운 대안으로 최근 각광받고 있는 것이 바로 대규모 언어 모델(LLMs, Large Language Models)이다.

이번에 리뷰된 논문은 “Harnessing Language Models for Studying the Ancient Greek Language: A Systematic Review”이라는 제목으로, 2025년 7월 발표된 체계적 문헌 분석 연구다. 이 논문은 지금까지 고대 그리스어에 적용된 인공지능 기술들, 특히 Transformer 기반 언어 모델의 활용 사례들을 종합적으로 정리했다.


왜 고대 그리스어에 언어 모델이 필요한가?

고대 그리스어는 문법적 복잡성, 다양한 방언, 단어의 다의성, 조각난 문헌 등으로 인해 기계적 분석이 어려운 언어 중 하나다. 따라서 언어 모델은 단순 번역기 이상의 정교함이 요구된다. 논문에서는 이러한 문제점을 극복하기 위해 최근 수년간 적용된 27개의 학술 연구를 체계적으로 정리했다.



형태소 분석부터 번역까지: 어떤 모델들이 쓰였을까?

가장 두드러진 성과는 BERT 기반의 특화 모델들이다. 예를 들어, Ancient-Greek-BERT, GRεBERTA, PHILTA 등의 모델은 고대 그리스어 문헌에 특화된 데이터를 기반으로 훈련되어, 형태소 분석 정확도가 95~97%에 달할 정도로 성능이 우수하다. 반면, 범용 모델인 ChatGPT, Claude 3, Gemini 등은 번역 및 문법 피드백에 유용하지만, 정밀한 NER 작업에서는 한계가 있었다.

개인적으로는 Rapacz and Smywiński-Pohl의 연구에서 시도된 형태 정보 임베딩 추가 방식이 특히 흥미로웠다. 이는 단순히 단어를 나열하는 방식이 아니라, 단어의 문법적 역할까지 모델에 학습시켜 번역 성능을 크게 향상시킨 사례다.


고전문헌의 감정 읽기와 저자 분석도 가능할까?

최근 연구는 고대 문학의 감정 분석(emotion analysis)에도 LLM을 활용하고 있다. Pavlopoulos et al.의 연구에서는 『일리아드』 제1권을 기반으로 감정 주석 데이터를 만들고, 모델이 긍정/부정 감정 및 감정 유형(분노, 슬픔 등)을 자동으로 예측하게 했다.

또한 Schmidt et al.은 고대 수사학 텍스트의 저자 분석에 LLM을 활용했다. 이를 통해 『수사학 기술서』가 여러 저자의 문체가 혼합된 가능성을 제기하며, 고전 문헌의 필자 추정에도 AI가 기여할 수 있음을 보여줬다.



실전 적용: 교육에서의 활용 가능성은?

가장 현실적인 응용 분야는 교육이다. ChatGPT 같은 LLM은 고대 그리스어의 문장을 번역하거나 문법 구조를 설명하는 데 활용되며, 특히 자기주도 학습이나 가상 튜터로 활용 가치가 높다. 그러나 Ross (2024)와 Abbondanza (2025)의 연구에 따르면, 이러한 모델의 답변은 종종 부정확하거나 모호하며, 교사의 검토 없이는 오히려 혼란을 줄 수 있다는 점도 지적된다.


비판적 관점: 우리가 놓치고 있는 것은?

언어 모델의 발전은 분명 고대 언어 연구에 혁신을 가져왔다. 그러나 이번 논문은 중요한 비판점도 함께 제시하고 있다.

  • 데이터 편향: 대부분의 모델은 아티카 혹은 호메로스어에 집중되어 있다.
  • 윤리 문제: 고대 문헌 자체가 성차별적, 제국주의적 시각을 내포할 수 있다.
  • 오픈소스 부족: 많은 연구가 코드나 데이터를 비공개로 유지하여 재현 가능성이 낮다.


결론: 언어의 미래를 위한 과거 탐험

요약하자면, 대규모 언어 모델은 고대 그리스어라는 역사적 언어를 디지털 시대에 되살리는 중요한 도구로 자리 잡고 있다. 향후에는 더 다양한 문헌을 포괄하는 데이터셋 구축, 교육 친화적인 인터페이스 개발, 윤리 가이드라인 수립 등이 병행되어야 한다.



출처 논문

Tzanoulinou, D., Triantafyllopoulos, L., & Verykios, V. S. (2025). Harnessing Language Models for Studying the Ancient Greek Language: A Systematic Review. Machine Learning and Knowledge Extraction, 7(3), 71. https://doi.org/10.3390/make7030071