딥페이크 탐정 AI, DAAL-NET
"내 얼굴이 가짜라고?" 전 세계를 속이는 딥페이크, 'AI 천재 탐정'이 나타나 싹 다 잡는다!
가짜 영상과의 전쟁 선포! 인공지능이 찾아낸 '완벽한 가짜'의 치명적 결점은 무엇일까?
요즘 SNS나 유튜브를 보면 깜짝 놀랄 때가 많다. 분명히 내가 아는 유명 연예인이나 정치인인데, 말하는 내용이 어딘가 이상하다. "저 사람이 진짜 저런 말을 했다고?" 알고 보니 그것은 인공지능(AI)이 정교하게 만들어낸 가짜 영상, 바로 '딥페이크'였다.
딥페이크는 인공지능 기술인 '딥러닝'과 가짜를 뜻하는 '페이크'의 합성어다. 영화에서 배우를 젊게 만들거나 이미 세상을 떠난 가수를 무대 위로 불러올 때는 감동을 주지만, 누군가를 속이거나 나쁜 소문을 퍼뜨리는 데 악용되면 큰 문제가 된다. 이제는 진짜와 가짜를 구별하는 일이 전문가조차 힘들 정도로 어려워졌다. 하지만 걱정 마라! 인류의 기술은 가짜를 만드는 속도보다 가짜를 찾아내는 기술을 더 똑똑하게 발전시키고 있다.
셜록 홈즈보다 예리한 'DAAL-NET', 가짜의 미세한 '떨림'을 포착하다!
최근 인공지능 공학자들이 아주 특별한 'AI 탐정'을 개발했다. 이름은 바로 'DAAL-NET(달넷)'. 이 탐정은 기존 인공지능들이 놓치던 아주 미세한 증거들을 찾아내는 데 천재적인 소질이 있다.
지금까지의 딥페이크 검사기들은 주로 사진 한 장 속에서 눈 모양이 이상한지, 입술 색이 번졌는지 같은 '정지 화면'의 특징만 살펴봤다. 하지만 요즘 나오는 고급 가짜들은 사진 한 장만 봐서는 도저히 알 수가 없다.
그래서 이번 연구팀은 '두 가지 눈'을 가진 하이브리드 모델을 제안했다. 첫 번째 눈은 사진 속의 아주 미세한 주파수 변화와 조작 흔적을 샅샅이 뒤지는 '로컬 포렌식 인코더'다. 그리고 두 번째 눈은 영상의 흐름을 지켜보며 얼굴 근육의 움직임이나 눈 깜빡임이 자연스러운지를 감시하는 '움직임 불규칙성 인코더'다.
가짜 영상은 아무리 정교해도 프레임과 프레임 사이에서 미세하게 툭툭 끊기거나 근육 움직임이 물리 법칙을 아주 조금씩 어기게 되는데, DAAL-NET은 바로 이 '시간의 틈'을 놓치지 않고 잡아낸다.
성적표 공개! 'AI 탐정단' 중 누가 가장 똑똑했을까?
연구팀은 이 새로운 탐정을 검증하기 위해 수만 장의 사진과 수천 개의 영상을 준비했다. 'Celeb-DF(v2)'라고 불리는 유명인 딥페이크 데이터셋을 활용해 여러 AI 모델들의 실력을 비교해 보았다. 결과는 놀라웠다!
아래 표를 보면 각 모델이 얼마나 정확하게 가짜를 잡아냈는지 한눈에 알 수 있다.
| 데이터셋 종류 | 인공지능 모델 이름 | 테스트 정확도 (%) | 정밀도 (%) |
|---|---|---|---|
| 사진 (deepfake_faces) | 일반 CNN | 58.6 | 58.7 |
| 사진 (deepfake_faces) | ResNet50 (기존 강자) | 74.7 | 74.9 |
| 영상 (Celeb-DF v2) | DAAL-NET (새로운 탐정) | 93.2 | 92.7 |
| 영상 (Celeb-DF v2) | ViT-B/16 (최신 모델) | 91.6 | 90.8 |
표에서 볼 수 있듯이, 기존의 일반적인 인공지능 모델(CNN)은 정확도가 60%도 채 되지 않아 가짜를 반 정도밖에 못 맞혔다.
하지만 이번 연구에서 제안한 DAAL-NET은 무려 93.2%라는 압도적인 성적으로 가짜를 검거해냈다! 특히 단순히 사진만 보는 게 아니라 영상 전체의 흐름을 읽는 능력이 탁월했다.
가짜가 판치는 세상, 우리는 이제 안심해도 될까?
이번 연구가 의미 있는 이유는 단순히 정확도가 높아서만이 아니다. 기존의 아주 똑똑한 AI들은 덩치가 너무 커서 엄청나게 비싼 컴퓨터에서만 돌아갔다. 하지만 DAAL-NET은 '가벼운 몸집'을 유지하면서도 실력은 최고로 유지하도록 설계되었다. 즉, 우리가 쓰는 스마트폰이나 작은 기기에서도 가짜 영상을 실시간으로 감시할 수 있는 길이 열린 것이다!
물론 인공지능 가짜 제조기들도 점점 더 교묘해질 것이다. 영상이 너무 어둡거나, 얼굴이 너무 조금만 움직이는 경우에는 여전히 인공지능 탐정도 헷갈려 하기도 한다. 하지만 이번 연구처럼 공간과 시간을 동시에 분석하는 똑똑한 기술들이 계속 나온다면, 머지않아 가짜 영상이 발붙일 곳은 없어질 것이다.
진짜와 가짜를 구별하는 힘, 그것은 이제 우리 인간의 눈을 넘어 우리가 만든 '착한 인공지능'의 손에 달려 있다. 가짜 뉴스나 조작된 영상에 속아 상처받는 사람이 없는 세상, 인공지능 탐정 DAAL-NET이 꿈꾸는 미래다.
출처
Potluri, S., Kandagatla, S. P., Mohanty, S. N., Rout, K. C., Israr, M., & Gupta, V. M. (2026). Hybrid deep feature integration model for robust deepfake detection using transfer-learned neural networks. Frontiers in Artificial Intelligence, 9, 1737761. doi: 10.3389/frai.2026.1737761