“AI는 고흐를 정말 이해할 수 있을까?”

인공지능이 그림의 ‘화풍’을 읽는 시대가 왔다

미술관에서 그림을 볼 때 우리는 종종 이렇게 말한다.

“이건 딱 모네 느낌인데?”
“피카소 그림은 한눈에 알겠어.”

흥미로운 건, 이제 AI도 비슷한 일을 하기 시작했다는 점이다. 단순히 사물을 인식하는 수준이 아니다. “이 그림은 인상주의인지, 입체주의인지, 바로크인지”를 분류하려 한다. 인간에게도 쉽지 않은 작업이다. 미술사 지식, 시대 배경, 작가의 특징까지 알아야 하기 때문이다.

그런데 최근 인공지능은 이런 영역까지 들어왔다. 그리고 놀랍게도 꽤 높은 정확도를 보인다.

2026년 발표된 한 리뷰 논문은 지난 10년간 발표된 연구 39편을 분석해, AI가 그림의 화풍을 어떻게 분류해왔는지 정리했다. 단순 기술 소개가 아니다. “AI는 예술을 어디까지 이해하고 있는가”라는 질문에 가까운 연구다.

AI는 그림에서 무엇을 보는 것일까

사람은 그림을 볼 때 분위기와 감정을 먼저 느낀다.

하지만 AI는 전혀 다르게 접근한다.

초기의 인공지능은 그림을 잘게 쪼개 특징을 추출했다. 색 분포, 붓 터치 방향, 윤곽선의 형태, 질감 같은 요소다. 예를 들어 인상주의 그림은 흐릿한 경계와 밝은 색채가 많고, 입체주의는 기하학적 형태가 두드러진다. AI는 이런 패턴을 숫자로 바꿔 학습했다.

논문에 따르면 초기 연구들은 SVM(Support Vector Machine) 같은 전통 머신러닝 모델을 많이 사용했다. 이 방식은 사람이 “어떤 특징을 볼지” 먼저 지정해야 한다. 일종의 체크리스트 기반 분석이다.

하지만 이후 상황이 바뀌었다.

딥러닝, 특히 CNN(합성곱 신경망)이 등장하면서다.

CNN은 사람이 특징을 직접 지정하지 않아도 된다. 수많은 그림을 보며 스스로 중요한 패턴을 학습한다. 마치 미술 작품을 계속 보다 보면 자연스럽게 화풍 감각이 생기는 것과 비슷하다.

AI는 어떤 화풍을 가장 잘 맞히나

연구들을 보면 AI가 가장 자주 다룬 화풍은 인상주의, 입체주의, 사실주의, 낭만주의, 표현주의였다.

이유는 단순하다.

데이터가 많기 때문이다.

대표 데이터셋인 WikiArt에는 약 25만 점의 작품이 들어 있는데, 사실주의 작품은 1만6000점 이상인 반면 어떤 양식은 작품 수가 몇 점 수준에 불과하다.

AI는 결국 데이터를 먹고 자라는 존재다.

많이 본 스타일일수록 잘 맞힌다.

반대로 비잔틴 성화, 호주 원주민 미술, 일본 우키요에 같은 비서구권 예술은 상대적으로 연구가 적었다. 논문은 이를 “서구 중심 편향”이라고 지적한다.

흥미로운 부분은 여기다.

AI 성능 문제는 단순히 알고리즘 문제가 아니라, 어떤 문화를 얼마나 데이터로 남겼는가의 문제이기도 하다는 점이다.

정확도 90%? 그런데 정말 믿어도 될까

논문에서 소개된 일부 연구는 화풍 분류 정확도가 90%를 넘는다. 어떤 경우는 96% 가까운 결과도 보고됐다.

숫자만 보면 AI가 이미 인간 미술평론가 수준처럼 느껴진다.

하지만 논문은 여기에 꽤 신중하다.

왜냐하면 연구마다 조건이 너무 다르기 때문이다. 어떤 연구는 화풍 종류가 5개뿐이고, 어떤 연구는 100개 가까운 스타일을 구분한다. 데이터 규모도 다르고, 평가 방식도 다르다. 즉 “95% 정확도”라는 숫자를 연구끼리 단순 비교하면 안 된다는 뜻이다.

또 하나 중요한 문제는 데이터 불균형이다.

예를 들어 인상주의 작품은 수천 장인데 특정 소수 양식은 수십 장뿐이라면, AI는 인기 스타일만 잘 배우게 된다. 시험 문제 대부분이 익숙한 유형인 셈이다.

논문은 현재 연구들이 지나치게 “정확도 숫자”에 집착한다고 비판한다. 실제 일반화 능력, 문화적 다양성, 데이터 품질까지 함께 봐야 한다는 이야기다.

트랜스포머는 왜 기대에 못 미치나?

최근 AI 업계의 핵심 기술은 트랜스포머다.

ChatGPT도 이 계열이다.

그래서 연구자들은 “그림 화풍 분류에도 트랜스포머가 강하지 않을까?”라고 기대했다. 하지만 결과는 의외였다.

논문에서 소개된 한 연구는 Vision Transformer(ViT)를 사용했지만 정확도가 약 39% 수준이었다.

왜 이런 일이 벌어졌을까.

연구진은 이유로 데이터 불균형과 부족한 사전학습(pretraining)을 지목한다. 트랜스포머는 대규모 데이터에서 진가를 발휘하는데, 예술 데이터셋은 아직 충분히 크고 균형 잡혀 있지 않다는 것이다.

즉 지금 단계에서 화풍 분류 분야는 “데이터의 질”이 모델 구조만큼 중요하다.

AI는 마침내 예술을 이해하게 될까

여기서 가장 중요한 질문이 남는다.

AI는 정말 예술을 이해하는가?

논문은 여기에 조심스럽다. 현재 AI는 주로 색채, 질감, 구도 같은 시각 패턴을 학습한다. 하지만 인간이 예술을 이해할 때는 역사적 맥락, 철학, 감정, 시대 분위기까지 함께 읽는다.

예를 들어 피카소의 입체주의는 단순히 얼굴이 조각난 그림이 아니다. 20세기 초 세계관의 변화와 연결돼 있다. 하지만 현재 AI는 이런 맥락까지는 거의 이해하지 못한다.

즉 AI는 아직 “스타일의 흔적”을 읽는 데 강하지, “예술의 의미”를 이해한다고 보긴 어렵다.

그럼에도 이 연구는 중요한 메시지를 남긴다.

AI는 이제 단순 계산기를 넘어 문화와 예술 영역까지 들어오고 있다는 점이다. 그리고 그 과정에서 우리는 오히려 인간의 감상 능력이 무엇인지 다시 묻게 된다.

어쩌면 미래의 미술사는 “AI가 그림을 어떻게 봤는가”까지 포함하게 될지도 모른다.

출처

Papadopoulou, D. G., & Michailidis, P. D. (2026). An Overview of Machine Learning and Deep Learning Methods for Style Classification in Paintings. AI, 7(6), 187. https://doi.org/10.3390/ai7060187