인공지능, 아랍어 비유 이해 정복

인공지능의 뇌가 거미줄처럼 복잡하게 연결된 그래프 구조를 통해 언어 속의 숨겨진 의미와 비유를 파악하는 모습을 형상화한 이미지. 빛나는 신경망과 다양한 감정·상징 아이콘들이 어우러져, 텍스트의 표면적 의미를 넘어 문맥과 '눈치'를 이해하는 차세대 AI 기술의 역동성을 보여준다.

인공지능, 아랍어의 속마음을 읽다! "완전 대박" 그래프 기술로 비유 정복기

내 마음은 호수요. 이 문장을 보고 우리는 내 마음이 정말 물로 가득 찬 호수라고 생각하지 않는다. 하지만 컴퓨터라면 어떨까? 아마 "데이터 오류: 인간의 가슴에 호수가 있을 수 없음"이라고 출력할지도 모른다!

이렇게 단어의 원래 의미 뒤에 숨겨진 의도를 파악하는 것을 비유적 언어 이해라고 한다. 특히 아랍어처럼 단어 하나가 수십 가지 형태로 변하고, 문화적 맥락이 깊은 언어에서는 인공지능이 비유를 알아듣기가 하늘의 별 따기보다 어려웠다. 그런데 최근 모로코와 이집트의 공동 연구팀이 이 어려운 숙제를 '그래프 신경망'이라는 마법 같은 기술로 풀어냈다는 소식이다.

단어와 단어 사이, 보이지 않는 끈을 찾는 '그래프의 마법'

기존의 인공지능은 문장을 그저 옆으로 길게 늘어선 기차처럼 한 줄로만 읽었다. 하지만 연구팀은 달랐다. 그들은 문장을 거미줄 같은 구조, 즉 그래프로 만들었다.

예를 들어 "집"이라는 단어가 있으면, 단순히 그 글자만 보는 게 아니라 "주택", "가옥" 같은 비슷한 말(유의어)과 "집들" 같은 변형된 형태들을 보이지 않는 선으로 연결한 것이다. 이렇게 하니 인공지능이 문장의 겉모습뿐만 아니라 그 속에 담긴 깊은 관계까지 한눈에 파악하게 되었다. 마치 탐정이 단서들을 실로 연결해 범인을 찾는 것과 비슷하다고 할까?

인공지능 대결: 결과는 그래프 기술의 압승!

연구팀은 이 새로운 인공지능에게 두 가지 시험을 치르게 했다. 하나는 완곡어법(나쁜 말을 부드럽게 표현하는 것) 찾기, 다른 하나는 환유(어떤 사물을 직접 부르지 않고 연관된 것으로 대신 부르는 것) 찾기였다.

결과는 놀라웠다! 기존에 가장 똑똑하다고 소문난 챗GPT의 사촌 격인 구글의 모델(BERT 기반 모델)들보다 훨씬 높은 점수를 받았다. 특히 환유 찾기에서는 점수가 무려 10점 이상 껑충 뛰어올랐다. 인공지능이 단순히 단어를 암기하는 수준을 넘어, 문맥의 흐름을 타기 시작했다는 증거다.

아래 표는 연구팀이 실험한 다양한 인공지능 모델들의 성적표 중 일부를 재구성한 것이다.

인공지능 모델 이름	정확도(%)	비유 이해력(F1점수)	특징
기존 우등생 모델 (AraBERT 등)	76.03	75.96	문장을 한 줄로 읽음
그래프 마법 모델 (HANConv)	77.29	81.11	단어 관계를 거미줄처럼 분석
최고 정확도 모델 (GAT)	82.08	79.43	중요한 단어에 더 집중함

표를 보면 알 수 있듯이, 그래프를 활용한 모델들이 전반적으로 훨씬 똑똑한 모습을 보여주었다. 특히 HANConv라는 모델은 비유의 의미를 파악하는 능력에서 독보적인 1등을 차지했다.

이제 인공지능과 "눈치껏" 대화하는 시대가 온다

이번 연구는 단순히 아랍어 성적을 올린 것에 그치지 않는다. 인공지능이 인간 특유의 복잡하고 미묘한 언어 습관을 이해할 수 있는 아주 중요한 열쇠를 찾았기 때문이다.

앞으로는 인공지능 비서에게 "아, 오늘 날씨가 참 덥네?"라고 말했을 때, 인공지능이 단순히 "네, 현재 기온은 35도입니다"라고 답하는 대신, "그럼 에어컨을 켜드릴까요?"라며 내 속마음을 알아채는 날이 머지않았다. 아랍어뿐만 아니라 한국어, 영어 등 모든 언어에서 인공지능이 우리의 '눈치'를 살피게 될 미래, 정말 기대되지 않는가?

연구팀은 앞으로 이 기술을 더 발전시켜서, 인공지능이 더 다양한 문화권의 비유와 은유를 이해할 수 있도록 만들 계획이라고 밝혔다. 인공지능이 시를 쓰고, 인간의 농담에 진심으로 웃어주는 날이 올지도 모르겠다.

출처: Banou, Z., Alaoui, F.-Z., El Filali, S., Benlahmar, E. H., El Jiani, L., & Sakhi, H. (2026). Graph convolution-based techniques for pragmatic Arabic figurative language classification. Frontiers in Artificial Intelligence, 9, 1759136. https://doi.org/10.3389/frai.2026.1759136