AI의 블랙박스를 열다! 그래프 신경망이 ‘논리 규칙’으로 변신한 사연

인공지능 기술이 하루가 다르게 발전하면서 이제는 우리의 일상을 지배하고 있다. 넷플릭스나 유튜브를 켜면 내 취향을 귀신같이 알아채고 영상을 추천해 주고, 쇼핑몰에 들어가면 내가 사고 싶었던 물건을 첫 화면에 띄워준다. 이러한 똑똑한 추천 시스템의 뒤에는 지식 그래프(Knowledge Graph)라는 복잡한 데이터 그물망과, 이를 분석하는 그래프 신경망(GNN)이라는 첨단 인공지능 모델이 자리 잡고 있다.

그런데 여기서 한 가지 커다란 문제가 발생한다. 이 인공지능 모델들은 너무나도 복잡한 수학적 계산을 거쳐 결론을 내리기 때문에, 왜 하필 나에게 그 책을 추천했는지, 왜 그 상품을 골랐는지 그 구체적인 이유를 인간이 알기 어렵다. 인공지능 학계에서는 이를 블랙박스 문제라고 부른다. 속을 들여다볼 수 없어 인공지능의 결론을 무조건 믿어야 하는 상황인 것이다. 만약 금융이나 의료 분야에서 인공지능이 잘못된 판단을 내렸는데 이유조차 모른다면 정말 끔찍한 일이 아닐 수 없다.

이러한 장벽을 깨부수기 위해 세계적인 명문대인 영국 옥스퍼드 대학교와 런던 대학교, 그리고 노르웨이 오슬로 대학교의 천재 컴퓨터 과학자들이 뭉쳤다. 데이비드 테나 쿠칼라, 베르나르도 쿠엔카 그라우, 보리스 모틱, 예고르 코스틸레프 연구팀은 인공지능의 복잡한 계산 과정을 단순한 논리 규칙으로 완벽하게 번역해 내는 기적 같은 기술을 개발했다.

이 놀라운 연구는 인공지능 분야의 세계 최고 권위 학술지인 Artificial Intelligence에 게재되며 전 세계 과학계의 이목을 집중시켰다. 인공지능의 블랙박스를 투명한 유리 상자로 바꾼 이들의 마법 같은 연구 속으로 들어가 보자.

인공지능의 천재성과 인간의 고전적 논리가 만나다

연구팀이 해결하고자 한 핵심 과제는 바로 그래프 신경망과 데이터로그(Datalog)라는 고전적인 컴퓨터 논리 언어 사이의 거대한 강을 연결하는 것이었다.

먼저 그래프 신경망은 엄청난 양의 데이터 속에서 복잡한 패턴을 스스로 학습하는 천재적인 능력을 가지고 있다. 예를 들어 도스토옙스키가 죄와 벌을 썼고, 어떤 사용자가 죄와 벌을 좋아한다는 사실이 지식 그래프에 얽혀 있다면, 그래프 신경망은 이 구조를 파악해 사용자에게 백치를 추천해 준다. 수많은 데이터를 먹여주면 스스로 똑똑해지니 정말 편리하지만, 도대체 어떤 계산 과정을 거쳐 그런 추천을 했는지 설명하라고 하면 인공지능은 그저 수조 개의 숫자로 이루어진 행렬만 보여줄 뿐이다. 인간은 도무지 이해할 수 없다.

반면 데이터로그라는 논리 언어는 아주 정직하고 투명하다. 모든 판단을 명확한 규칙으로 내리기 때문이다. 예를 들면 다음과 같은 방식이다.

만약 어떤 작가가 X라는 책을 썼고, 그 작가가 Y라는 책도 썼는데, 사용자가 X라는 책을 좋아한다면, 그 사용자에게 Y라는 책을 추천한다.

얼마나 명쾌한가! 초등학교 고학년 학생이라도 고개를 끄덕일 만큼 명확하고 직관적이다. 게다가 이 규칙을 따라가면 인공지능이 왜 그런 추천을 했는지 족보를 캐듯 역추적할 수 있다. 하지만 결정적인 약점이 있었다. 이러한 규칙들을 인간 전문가가 일일이 컴퓨터에 입력하고 관리해야 하는데, 세상의 그 수많은 지식과 관계를 규칙으로 만드는 것은 비용이 너무 많이 들고 사실상 불가능에 가깝다.

연구팀은 이 두 가지 시스템의 장점만 쏙쏙 골라 합치기로 했다. 그래프 신경망이 스스로 똑똑하게 학습하게 만들되, 그 학습된 결과를 데이터로그라는 쉬운 논리 규칙으로 쏙 뽑아내는 역번역 알고리즘을 설계한 것이다. 그렇게 하면 인공지능의 뛰어난 학습 능력과 인간의 완벽한 설명 가능성을 동시에 쥘 수 있기 때문이다.

단조성 마법과 수학적 장벽의 돌파구

말은 쉽지만 실제로 구현하는 과정은 수학적 통곡의 벽 마주하는 것과 같았다. 그래프 신경망과 데이터로그는 태생부터 작동 방식이 아예 달랐기 때문이다.

가장 큰 걸림돌은 데이터로그의 철저한 단조성(Monotonicity) 규칙이었다. 단조성이란 새로운 정보가 추가되어도 기존에 맞았던 규칙이 절대 거짓으로 뒤집히지 않는 성질을 뜻한다. 쉽게 말해 정보가 늘어나면 결론도 늘어날 뿐, 기존 결론이 사라지지는 않는다. 반면 일반적인 그래프 신경망은 계산 과정에서 마이너스 값을 곱하거나 복잡한 비선형 함수를 사용하기 때문에, 새로운 데이터가 들어오면 기존에 맞다고 판단했던 내용을 갑자기 틀렸다고 뒤집어버리는 비단조성 성질을 띠기 일쑤였다.

연구팀은 이 문제를 해결하기 위해 인공지능의 신경망 구조에 특별한 제약 조건을 걸어버리는 기발한 아이디어를 냈다. 이름하여 단조 맥스-썸 그래프 신경망(Monotonic Max-Sum GNN)을 발명한 것이다. 연구팀은 인공지능이 학습할 때 사용하는 가중치 행렬을 오직 0 이상의 양수(Nonnegative)로만 제한했다. 그리고 인공지능이 주변 노드들의 정보를 취합할 때 최댓값(Max)을 고르거나 모두 더하는(Sum) 기능만 사용하도록 설계했다. 또한 활성화 함수로는 오직 렐루(ReLU)나 임계값 함수처럼 입력이 커지면 출력도 함께 커지는 안전한 함수만을 허용했다.

이렇게 제약을 가하자 놀라운 마법이 일어났다. 그래프 신경망이 철저하게 단조성을 지키기 시작한 것이다. 즉, 입력 데이터에 새로운 사실이 추가되더라도 기존에 도출했던 결론이 흔들리지 않게 되었다. 이로써 수학적으로 그래프 신경망과 데이터로그 논리 규칙이 완벽하게 호환될 수 있는 이론적 토대가 마련되었다.

여기서 끝이 아니었다. 또 하나의 거대한 장벽이 있었다. 그래프 신경망은 어떤 노드에 연결된 이웃 노드가 10개든, 1,000개든 제한 없이 무한히 모든 정보를 더해나갈 수 있다. 반면 데이터로그 규칙은 규칙 안에 들어있는 변수의 개수가 고정되어 있어, 한 번에 고려할 수 있는 데이터의 개수가 수학적으로 정해져 있다. 무한을 다루는 인공지능과 유한을 다루는 논리 규칙이 어떻게 같아질 수 있단 말인가?

연구팀은 치밀한 수학적 증명을 통해, 단조 맥스-썸 그래프 신경망 구조에서는 이웃 노드가 아무리 많아도 실제로 인공지능의 최종 판단에 영향을 미치는 데이터의 개수는 일정한 경계 안으로 묶인다는 사실을 밝혀냈다. 즉, 무한해 보이는 인공지능의 더하기 연산을 특정한 유한 개의 규칙으로 완벽하게 쪼개어 나타낼 수 있음을 증명한 것이다. 연구팀은 한 걸음 더 나아가 더하기 기능도 빼고 오직 최댓값만 고르는 단조 맥스 그래프 신경망(Monotonic Max GNN)의 경우에는 부등호조차 없는 가장 깔끔한 트리 형태의 논리 규칙으로 변환된다는 완벽한 동등성까지 입증해 냈다.

실제 실험으로 증명된 강력한 성능과 눈부신 번역 속도

이론이 아무리 훌륭해도 실제 컴퓨터에서 제대로 돌아가지 않거나 인공지능의 똑똑함이 떨어진다면 아무짝에도 쓸모없는 일이다. 연구팀은 자신들이 만든 단조 그래프 신경망을 세계적으로 가장 널리 쓰이는 세 가지 표준 지식 그래프 데이터셋에 탑재해 성능을 시험했다.

그 결과는 실로 놀라웠다. 인공지능의 성능을 엄격하게 제한했음에도 불구하고, 링크 예측(데이터 간의 숨겨진 관계를 찾아내는 임무)에서 기존의 가장 뛰어난 최첨단 인공지능 모델들과 대등하거나 오히려 이를 뛰어넘는 최고의 정확도를 보여주었다. 인공지능에게 단조성이라는 정직한 성질을 부여한 것이 오히려 쓸데없는 오차나 노이즈를 걸러내어 더 똑똑하게 문제를 맞히도록 돕는 훌륭한 나침반 역할을 한 것이다.

무엇보다 압권은 연구팀이 개발한 역번역 알고리즘의 속도였다. 인공지능이 특정 결론을 내렸을 때, 그 결론이 나온 이유를 논리 규칙으로 뽑아내는 데 걸린 시간은 단 몇 초에 불과했다.

실제 실험 데이터를 요약한 아래 테이블을 보면 이 연구의 실용성이 얼마나 뛰어난지 한눈에 알 수 있다.

테이블 1: 단조 맥스 그래프 신경망에서의 규칙 추출 시간 및 규칙의 길이 측정 결과

평가 대상 데이터셋 종류	인공지능이 내린 결론 10개를 설명하는 논리 규칙을 추출하는 데 걸린 총 시간 (초)	추출된 논리 규칙 하나당 포함된 평균 핵심 단어(원자) 개수 (중앙값)
FB15K-237	21초	7개
NELL-995	11초	1개
WN18RR	10초	1개

테이블에서 보는 바와 같이, 인공지능이 도출해 낸 수많은 결과 중 무작위로 10개의 사실을 뽑아 왜 그런 결론을 내렸는지 물었을 때, 알고리즘은 단 10초에서 21초 만에 완벽한 설명 규칙을 만들어냈다. 게다가 추출된 규칙의 길이를 보면 핵심 단어가 적게는 1개에서 많아봐야 7~12개 수준이었다. 이는 인공지능이 복잡한 딥러닝 계산을 거쳐 내린 결론일지라도, 결국 인간이 단 한 줄로 명쾌하게 읽고 이해할 수 있는 지극히 상식적인 논리 규칙으로 요약될 수 있음을 생생하게 증명한다.

인공지능 대중화 시대의 새로운 이정표가 되다

이 연구가 가지는 의미는 단순히 학술적인 성공에 그치지 않는다. 인공지능의 판단에 투명성과 공정성을 부여함으로써, 우리가 인공지능을 완벽하게 통제하고 신뢰할 수 있는 세상을 열었다는 데 진짜 가치가 있다.

만약 은행에서 대출 심사를 하는 인공지능이 어떤 사람의 대출을 거절했다고 가정해 보자. 기존의 블랙박스 인공지능이라면 거절 사유를 물어도 대답하지 못했다. 하지만 이 연구팀의 기술을 적용하면 인공지능 시스템이 대출이 거절된 순간 즉시 만약 이 사람이 과거에 연체 기록이 있고 현재 소득이 기준치 미만이라면 대출을 승인하지 않는다라는 명확한 데이터로그 규칙을 화면에 띄워줄 수 있다. 신청자는 왜 거절되었는지 납득할 수 있고, 인공지능이 혹시나 인종이나 성별 같은 불합리한 요소로 차별하진 않았는지 인간이 감시하고 검증하는 것도 가능해진다.

더 나아가 이 기술은 인공지능을 활용한 자율주행 자동차의 사고 방지 시스템, 의료 인공지능의 암 진단 신뢰성 확보, 법률 인공지능의 판례 분석 등 안전과 신뢰가 극도로 요구되는 미래 핵심 산업 전반에 걸쳐 거대한 파급 효과를 미칠 것으로 기대된다. 복잡한 수식의 성벽 뒤에 숨어있던 인공지능이 드디어 인간의 언어로 조근조근 대화를 건네기 시작한 것이다. 이제 인공지능은 두려움의 대상이 아니라, 완벽하게 이해하고 통제할 수 있는 인간의 가장 안전한 동반자가 될 준비를 마쳤다.

출처:

Tena Cucala, D., Cuenca Grau, B., Motik, B., & Kostylev, E. V. (2026). From monotonic graph neural networks to datalog and back: Expressive power and practical applications. Artificial Intelligence, 357, 104545. https://doi.org/10.1016/j.artint.2026.104545