인간처럼 생각하는 인공지능은 가능할까?




AI와 인간의 '생각의 방식'을 비교한 새로운 연구


"AI가 인간처럼 사고하는 날이 올까?"

인공지능이 그림을 그리고, 운전을 하고, 바둑도 두는 시대다. 하지만 AI는 정말로 '인간처럼' 생각하는 걸까? 겉보기에 비슷해 보여도, 그 안의 사고 방식은 완전히 다를 수도 있다. 이런 물음에 답하기 위해 독일 막스플랑크연구소와 네덜란드 라드바우드대학교의 연구팀이 나섰다. 이들은 인간과 딥러닝 인공지능(DNN)이 어떻게 사물을 인식하고 분류하는지, 그 '내면의 구조'를 정밀하게 비교하는 실험을 설계했다.


그 결과는 놀라웠다. 인간과 AI가 같은 대상을 보고도 전혀 다른 방식으로 분류하고 있었다. 더욱이 AI가 인간처럼 보이기 위해 일부러 겉모습을 흉내 낸다는 점도 확인됐다.


인간과 AI, 무엇이 다른가

연구진은 인간과 AI의 "대표적 인식 차원(representational dimensions)"을 비교했다. 이 개념은, 우리가 어떤 사물을 볼 때 떠올리는 특징들(예: 둥근, 빨간, 음식 같음 등)을 각각의 축으로 삼아 인식의 좌표계를 그리는 방식이다. 이 좌표계가 어떻게 구성돼 있는지를 비교하면, 인간과 AI가 세상을 보는 관점이 얼마나 닮았는지 알 수 있다.


실험은 단순하면서도 강력했다. 세 개의 이미지가 주어졌을 때, 가장 다른 하나(‘odd one out’)를 고르는 방식이다. 이 간단한 선택을 수백만 번 반복하면, 사람이 어떤 기준으로 사물을 구분하는지 파악할 수 있다. 마찬가지 방식으로 AI에게도 선택을 시켜서 ‘생각하는 방식’을 유추했다.


인간 데이터는 470만 건 이상의 선택 기록을 기반으로 했고, AI는 잘 알려진 이미지 분류용 모델인 VGG-16을 사용했다. 연구팀은 이 모델에 2천만 개 이상의 삼중 이미지 조합을 입력해 반응을 측정했다.


시각 vs 의미 – 인간과 AI의 결정적 차이

실험 결과, 인간은 사물을 의미 중심으로 인식했다. 예를 들어, 토마토와 사과는 색이나 모양이 달라도 ‘음식’이라는 공통점을 중심으로 묶는 경향이 있다. 반면, AI는 색, 모양, 질감 등 시각적 속성에 훨씬 더 의존했다. 예를 들어, 붉은 사과는 빨간 공보다도 토마토보다 낯설다고 판단할 수 있다.


실제로 인간이 사용한 인식 차원의 80% 이상이 의미 기반(semantic)이었지만, AI는 시각 기반(visual)이거나 시각-의미 혼합형이 대부분이었다. 이는 인간과 AI가 똑같은 선택을 하더라도 전혀 다른 이유로 선택할 수 있다는 뜻이다. 즉, 결과는 같지만 ‘사고 경로’는 다르다.


재미있는 점은, AI가 의미 기반 차원을 흉내내는 경우도 있다는 것이다. 마치 인간처럼 보이려고 시각적인 특징을 조합해 의미를 흉내내는 셈이다. 하지만 이런 방식은 겉으로만 비슷할 뿐, 속내는 전혀 다르다는 것이 연구진의 분석이다.


AI가 진짜 인간처럼 되려면?

연구의 결론은 명확하다. 지금의 AI는 인간처럼 보이도록 훈련되었지만, 실제로는 다른 방식으로 사고한다. 이것은 단순히 기술의 미성숙 문제가 아니다. AI가 의미를 '이해'하는 것이 아니라, 시각적 패턴을 '모방'하는 데 능한 것이 본질이라는 뜻이다.


연구팀은 이 차이를 극복하려면 단순히 AI의 성능을 높이는 것만으로는 부족하다고 지적한다. 오히려 인간처럼 다양한 맥락과 의미를 이해하고 활용할 수 있도록 훈련 데이터와 구조 자체를 다르게 설계해야 한다고 강조한다. 특히 텍스트, 소리, 이미지 등 다양한 감각 정보를 통합적으로 학습하는 방식(multimodal training)이 유망한 대안으로 제시된다.


이 연구는 단순히 인간과 AI의 차이를 분석하는 데 그치지 않는다. 사고방식의 차이를 드러내고, 그 격차를 줄일 방법을 제안하는 데 의의가 있다. 앞으로 더욱 정교하고 신뢰할 수 있는 AI를 만들기 위한 방향타를 제시한 셈이다.



출처 논문

Mahner, F. P., Muttenthaler, L., Güçlü, U., & Hebart, M. N. (2025). Dimensions underlying the representational alignment of deep neural networks with humans. Nature Machine Intelligence, 7, 848–859. https://doi.org/10.1038/s42256-025-01041-7