회전에 강한 얼굴 인식 기술, 대칭성을 적용한 하이브리드 양자 AI가 정확도를 높인다
회전에 강한 얼굴 인식을 위해 양자회로에 대칭성을 직접 적용한 새로운 AI 모델이 제안됐다
인도 SRM Institute of Science and Technology 연구진은 얼굴의 방향이 달라져도 안정적으로 인식할 수 있는 대칭성 기반 하이브리드 양자-고전 합성곱 신경망(Eq-MG-QCNN)을 개발했다. 연구진은 양자회로 자체에 회전과 반사 대칭성을 내장하는 방식을 적용해 기존 양자 얼굴 인식 모델보다 더 적은 파라미터만으로 높은 정확도를 달성했다. ORL 얼굴 데이터셋에서는 최고 정확도 94.3%, Yale 데이터셋에서는 89.9%를 기록했으며, 회전에 따른 성능 편차도 크게 줄어들었다. 이번 연구는 양자 머신러닝이 실제 컴퓨터 비전 문제에서도 구조적 설계를 통해 성능과 효율성을 동시에 개선할 수 있음을 보여준 사례다.
얼굴 인식에서 회전 변화가 어려운 이유
얼굴 인식 시스템은 스마트폰 생체인증, 출입통제, 보안 감시 등 다양한 분야에서 활용된다. 그러나 사람이 카메라를 바라보는 각도가 달라지면 얼굴 이미지의 방향도 함께 변하기 때문에 인식 정확도가 떨어지는 문제가 발생한다.
기존 CNN(Convolutional Neural Network)은 위치 이동(Translation)에는 강하지만 회전(Rotation)이나 좌우·상하 반사(Reflection)를 자연스럽게 처리하도록 설계되지는 않았다. 이러한 문제를 해결하기 위해 데이터 증강(Data Augmentation)으로 다양한 방향의 이미지를 학습시키는 방법이 사용되지만, 모델 구조 자체가 회전을 이해하는 것은 아니다.
양자 머신러닝이 얼굴 인식에 주목받는 이유
양자 머신러닝(QML)은 중첩(Superposition)과 얽힘(Entanglement)을 활용해 매우 높은 표현력을 갖는 특징 추출을 수행할 수 있다는 장점이 있다.
하지만 현재의 양자 컴퓨터는 큐비트 수가 적고 노이즈가 많아 복잡한 양자 신경망을 학습하기 어렵다. 또한 회전이나 대칭성과 같은 공간 정보를 고려하지 않는 기존 양자 모델은 실제 이미지 인식 문제에서 일반화 성능이 제한적이라는 문제가 있었다.
연구진은 이러한 한계를 해결하기 위해 고전 신경망과 양자회로를 결합한 하이브리드 구조를 선택했다. 양자회로는 특징 추출을 담당하고, 최종 분류는 기존 신경망이 수행하는 방식이다.
연구진이 제안한 Eq-MG-QCNN의 핵심 아이디어
이번 연구의 가장 큰 특징은 대칭성을 양자회로 내부 구조에 직접 설계했다는 점이다.
연구진은 Klein Four Group(ℤ₂ × ℤ₂)이라는 군(Group) 이론을 이용해 다음 네 가지 변환을 동일한 특징으로 처리하도록 설계했다.
- 원본 이미지
- 좌우 반전
- 상하 반전
- 180도 회전
기존 모델은 각각의 큐비트가 서로 다른 학습 파라미터를 사용했지만, 새로운 모델은 같은 대칭 그룹에 속하는 큐비트들이 동일한 파라미터를 공유하도록 만들었다.
또한 모든 큐비트를 대칭적으로 연결하는 K₄ 그래프 기반 CZ 게이트를 사용하여 어느 방향으로 이미지가 변해도 동일한 구조를 유지하도록 설계했다. 이러한 방식은 모델이 회전 정보를 별도로 학습하지 않아도 방향 변화에 자연스럽게 대응하도록 만든다.
연구 방법
연구진은 두 개의 대표적인 얼굴 데이터셋을 사용해 성능을 평가했다.
- ORL 얼굴 데이터셋
- 40명
- 총 400장의 얼굴 이미지
- Yale 얼굴 데이터셋
- 15명
- 총 165장의 얼굴 이미지
모든 이미지는 16×16 해상도로 축소한 뒤 2×2 크기의 패치 64개로 분할하여 양자회로에 입력했다.
학습 과정에서는 각 이미지를 0°, 90°, 180°, 270° 네 가지 방향으로 회전시켜 데이터 증강을 수행했다.
비교 대상은 일반 CNN, Equivariant CNN, 기존 MG-QCNN, 새롭게 제안한 Eq-MG-QCNN 등 네 가지 모델이었다. 모든 모델은 동일한 학습 조건에서 비교해 공정성을 확보했다.
ORL 데이터셋에서 최고 정확도 94.3%를 기록했다
가장 중요한 결과는 ORL 데이터셋에서 최고 정확도 94.3%, 평균 정확도 92.5%를 기록했다는 점이다.
기존 MG-QCNN보다 평균 정확도가 약 6.7%포인트 향상됐으며, 기존 Equivariant CNN보다도 높은 성능을 보였다.
또한 회전 방향에 따른 정확도 변화도 매우 작았다.
연구진은 이를 Rotational Consistency로 측정했으며 Eq-MG-QCNN은 0.50%의 매우 낮은 편차를 기록했다. 이는 얼굴이 어느 방향으로 회전하더라도 거의 동일한 성능을 유지했다는 의미다.
더 적은 파라미터로 성능을 높였다
이번 연구의 또 다른 특징은 모델이 더 단순해졌다는 점이다.
기존 MG-QCNN은 8개의 양자 파라미터를 사용했지만 Eq-MG-QCNN은 6개만 사용했다.
연구진은 대칭성을 이용한 파라미터 공유(Parameter Sharing)를 적용하면서도 오히려 정확도를 높일 수 있음을 확인했다.
일반적으로 파라미터 수가 줄어들면 성능이 감소할 가능성이 있지만, 이번 연구에서는 구조적 대칭성이 불필요한 자유도를 제거하면서 일반화 성능을 향상시킨 것으로 해석된다.
이번 연구의 의미
이번 연구는 단순히 새로운 얼굴 인식 모델을 제안한 것 이상의 의미를 가진다.
기존에는 양자 머신러닝의 성능을 높이기 위해 더 많은 큐비트나 더 깊은 회로를 사용하는 방향이 주로 연구됐다.
반면 이번 연구는 수학적 대칭성을 회로 설계에 직접 반영하면 모델이 더 단순하면서도 더 안정적으로 학습할 수 있다는 가능성을 보여줬다.
이러한 접근법은 얼굴 인식뿐 아니라 객체 인식, 의료영상 분석, 위성영상 분석 등 방향 변화가 빈번한 다양한 컴퓨터 비전 문제에도 활용될 가능성이 있다.
연구의 한계와 향후 전망
이번 연구에는 몇 가지 중요한 한계도 존재한다.
가장 큰 한계는 모든 실험이 노이즈가 없는 양자 시뮬레이터에서 수행됐다는 점이다. 실제 양자 하드웨어에서는 큐비트 오류와 게이트 노이즈가 존재하기 때문에 동일한 성능을 보장하기는 어렵다.
또한 사용한 데이터셋인 ORL과 Yale는 비교적 작은 규모의 얼굴 데이터셋이다. 향후에는 LFW나 VGGFace2처럼 훨씬 큰 실제 환경 데이터셋에서 성능을 검증할 필요가 있다.
그럼에도 이번 연구는 기하학적 대칭성을 양자회로 설계에 통합하는 것이 양자 AI의 실용성을 높일 수 있는 유망한 방향임을 보여줬다는 점에서 의미가 크다.
자주 묻는 질문
Q. 하이브리드 양자-고전 신경망이란 무엇인가?
A. 하이브리드 양자-고전 신경망은 양자회로가 특징을 추출하고, 기존 딥러닝 신경망이 최종 분류를 수행하는 구조다. 현재의 양자 하드웨어 한계를 고려한 현실적인 양자 AI 접근 방식으로 평가된다.
Q. Eq-MG-QCNN의 가장 큰 차별점은 무엇인가?
A. 회전과 반사 대칭성을 양자회로 구조 자체에 내장해 방향이 바뀐 얼굴에서도 안정적인 특징을 추출하도록 설계한 점이다. 또한 기존 모델보다 적은 양자 파라미터를 사용하면서도 더 높은 정확도를 기록했다.
Q. 연구에서 사용한 얼굴 데이터셋은 무엇인가?
A. 연구진은 ORL 얼굴 데이터셋(400장)과 Yale 얼굴 데이터셋(165장)을 이용해 모델 성능을 평가했다.
Q. 이번 연구 결과를 실제 서비스에 바로 적용할 수 있을까?
A. 아직은 어렵다. 연구는 노이즈가 없는 양자 시뮬레이션 환경에서 수행됐으며, 실제 양자 컴퓨터에서 동일한 성능을 재현하려면 추가 검증이 필요하다.
Q. 이번 연구의 의미는 무엇인가?
A. 양자회로에 기하학적 대칭성을 직접 반영하면 모델의 파라미터 수를 줄이면서도 회전에 강한 얼굴 인식 성능을 구현할 수 있음을 보여준 연구라는 점에서 의미가 있다.
출처
Sony Priya, S., & Minu, R. I. (2026). Symmetry-constrained hybrid quantum-classical convolutional neural networks for rotation-robust face recognition. Frontiers in Artificial Intelligence, 9, 1878911. https://doi.org/10.3389/frai.2026.1878911
