AI가 사람처럼 거리를 평가할 수 있을까? ChatGPT·Gemini가 도시 보행 환경을 평가한 놀라운 실험

사람이 태블릿으로 도시 거리를 촬영하고 있고, 옆에서 두 개의 인공지능 로봇이 같은 거리를 관찰하며 분석하는 장면의 디지털 일러스트

사람과 인공지능이 같은 도시 거리 사진을 보고 보행 환경의 안전성, 편안함, 매력도를 함께 평가하는 모습을 표현한 일러스트.

AI가 사람의 “거리 느낌”까지 이해할 수 있을까?

도시를 걷다 보면 자연스럽게 이런 생각이 든다.

“이 길은 걷기 편하다.”
“여긴 좀 불안하다.”
“여긴 괜히 오래 머물고 싶다.”

흥미로운 점은 이런 판단이 대부분 순식간에, 그리고 무의식적으로 이루어진다는 것이다. 인간의 뇌는 건물의 형태, 나무의 존재, 길의 폭, 차량과의 거리 같은 수많은 시각 정보를 동시에 처리하며 “이 공간이 좋은지 아닌지”를 결정한다.

그렇다면 질문이 하나 떠오른다.

인공지능도 이런 ‘도시의 느낌’을 인간처럼 평가할 수 있을까?

최근 연구에서는 이 질문에 답하기 위해 ChatGPT와 Gemini 같은 대형 AI 모델을 실제 사람들과 비교하는 흥미로운 실험을 진행했다. 결과는 예상보다 훨씬 놀라웠다.

AI가 사람의 도시 경험을 꽤 정확하게 “흉내 낼” 수 있다는 것이다.

스페인의 세 거리에서 시작된 독특한 실험

연구팀은 스페인 산타크루스 데 테네리페(Santa Cruz de Tenerife)의 세 개 보도를 촬영했다. 그리고 이 사진들을 이용해 사람과 AI에게 같은 질문을 던졌다.

실험 방식은 간단했다.

사람 68명에게 사진을 보여준다
ChatGPT와 Gemini에게도 동일한 사진을 보여준다
모두에게 같은 질문을 한다
점수를 비교한다

질문은 총 7가지 평가 항목으로 구성됐다.

대표적인 질문은 다음과 같다.

이 길은 아름답고 매력적인가?
이 길은 보행자를 위해 설계된 것처럼 느껴지는가?
걷는 동안 차량 때문에 불안하지 않은가?
이 길은 걷기에 실용적인가?
이 거리는 보행자 친화적인가?
여기서 기다리는 것이 즐거운 공간인가?
저 멀리 보이는 풍경이 계속 걷고 싶게 만드는가?

참가자들은 1~5점 리커트 척도로 평가했다.

사람 vs AI: 놀라운 결과

실험 결과는 매우 흥미로웠다.

AI의 평가와 인간의 평가 사이에는 높은 수준의 일치가 나타났다.

연구에서 사용된 주요 통계 결과는 다음과 같다.

ChatGPT 인간 일치도 (ICC): 0.87
Gemini 인간 일치도 (ICC): 0.76

일반적으로 0.75 이상이면 높은 신뢰도로 평가된다.

즉,

👉 AI가 인간과 거의 비슷하게 도시 환경을 평가했다는 뜻이다.

특히 ChatGPT는 인간 평가와 매우 안정적으로 일치하는 결과를 보였다.

재미있는 발견: AI도 “거리의 느낌”을 읽는다

연구에서 특히 흥미로운 부분은 AI가 단순히 물체를 인식하는 수준을 넘어 공간의 분위기까지 설명했다는 점이다.

예를 들어 AI는 이런 식으로 판단했다.

ChatGPT의 설명

건물 색상이 매력적이다
보행자 공간이 있지만 다소 좁다
차량 속도가 낮을 것 같아 안전하다

Gemini의 설명

중앙의 전봇대가 보행을 방해한다
차량과 보도 사이 완충 공간이 없다
멀리 보이는 거리 구조가 걷고 싶게 만든다

즉 AI는 단순히 “보인다” 수준이 아니라

공간 구조
안전성
보행 경험

같은 인간 중심 평가까지 수행했다.

왜 이런 연구가 중요할까?

이 연구가 중요한 이유는 도시 계획 때문이다.

도시 환경을 평가하려면 보통 다음 과정이 필요하다.

현장 조사
시민 설문
전문가 분석

하지만 이 방법에는 큰 문제가 있다.

시간과 비용이 너무 많이 든다.

예를 들어 도시 전체의 보행 환경을 조사하려면 수천 개 거리를 조사해야 한다.

하지만 AI를 활용하면 상황이 완전히 달라진다.

AI는 다음과 같은 일을 할 수 있다.

수백만 개 거리 사진 분석
도시 전체 보행 환경 평가
설계안 비교 시뮬레이션
도시 디자인 개선 제안

연구에서는 AI가 “도시 환경 감정 평가 도구”로 활용될 가능성을 제시했다.

하지만 아직 완벽하지는 않다

AI가 잘 맞춘 것은 사실이지만 몇 가지 문제도 있었다.

대표적인 문제는 다음과 같다.

1️⃣ 때때로 지나치게 극단적인 평가

Gemini는 어떤 거리에서 인간보다 훨씬 낮거나 높은 점수를 주었다.

2️⃣ 인간의 감정적 경험 완전 재현은 어려움

예를 들어

소리
냄새
실제 거리 분위기

같은 요소는 사진으로 완전히 전달되지 않는다.

3️⃣ 데이터가 아직 적다

이번 연구는 3개 거리만 사용한 파일럿 연구였다.

따라서 더 큰 규모 연구가 필요하다.

미래 도시 설계는 AI와 함께 이루어질까?

이 연구는 아주 흥미로운 가능성을 보여준다.

미래에는 다음과 같은 일이 가능해질지도 모른다.

AI가 도시 설계를 미리 평가한다
“걷기 좋은 거리”를 자동 분석한다
시민 행복도를 예측한다
도시 디자인을 AI가 추천한다

즉 도시 계획이

차 중심 설계 → 사람 중심 설계

로 더 빠르게 바뀔 수 있다.

AI가 인간의 도시 경험을 이해하기 시작했다는 사실은
도시의 미래를 완전히 바꿀지도 모른다.

그리고 어쩌면 언젠가는 이런 질문이 자연스러워질지도 모른다.

“이 도시 설계안… AI는 어떻게 평가했지?”

출처:
Belaroussi, R., & Salingaros, N. A. (2026). Artificial Intelligence-Simulated Cognition of a Pedestrian Assessing a Built Environment. AI, 7(3), 110. https://doi.org/10.3390/ai7030110