‘잊는 인공지능’ 시대를 여는 새로운 알고리즘







AI가 입력된 정보를 지우는 것이 중요한 관심사로 떠오른다.




인공지능(AI)은 한 번 배운 것은 절대 잊지 않는다고 알려져 있다. 우리가 SNS에 올린 사진 한 장, 혹은 병원 기록에 남긴 진료 정보는 학습된 AI 모델 속에 영원히 남아 있을지도 모른다. 그런데 이 ‘절대 기억’이 문제를 일으키기 시작했다. 바로 프라이버시 침해다.



“AI야, 나에 대한 걸 잊어줘.” 이 말이 가능해지려면 어떻게 해야 할까?



중국 북경우전대학교(BUPT)의 연구진은 바로 이 질문에 도전했다. 이들은 ‘Scrub-and-Learn’이라는 흥미로운 알고리즘을 제안하며, AI가 특정한 정보를 의도적으로 잊게 만드는 법을 제시했다. 이 기술은 기존의 복잡하고 비효율적인 ‘잊기’ 방법을 뒤집고, 단순하고 빠르게, 그리고 똑똑하게 AI의 기억을 지우는 새로운 해법으로 떠오르고 있다.



---

‘AI에게 잊어버리라는 건 왜 필요한가?’




이야기의 시작은 유럽연합의 GDPR(일반개인정보보호법)이다. 여기서는 사용자가 “내 데이터를 지워달라”고 요청하면 기업은 그에 응해야 한다. 하지만 문제는, 이미 학습된 AI 모델에서 그 데이터를 어떻게 지우냐는 것이다.



지금까지는 모델을 아예 처음부터 다시 학습시키거나, 수학적으로 복잡한 계산을 통해 ‘데이터 영향’을 추정해 제거했다. 그런데 이 과정은 시간도 오래 걸리고, 비용도 많이 든다. 더군다나 원본 데이터를 계속 보관해야 한다는 점에서 ‘잊는다’는 개념과 어긋나기도 했다.



이제는 효율적이고, 실제 적용 가능한 새로운 방식이 필요했다. 바로 그 해답이 ‘Scrub-and-Learn’이다.



---

AI도 ‘잊는 훈련’을 할 수 있다




이 알고리즘의 핵심은 발상의 전환이다. 

“기억을 지우려 하지 말고, 다시 배워서 덮어씌우자.”



Scrub-and-Learn은 기존 학습 모델에 ‘새로운 학습’을 덧붙이는 방식이다. 잊고 싶은 데이터가 포함된 클래스를 선정한 후, 그 데이터를 살짝 바꿔서 다시 학습시키는 것이다. 예를 들어, AI가 고양이와 개를 구분하는 법을 배웠는데, 고양이를 ‘잊어야’ 하는 상황이라면, 고양이 사진에 대해 “이건 고양이가 아니야, 개일 수도 있어”라고 다시 알려주는 식이다.



여기서 놀라운 건, 이 과정을 몇 번 반복하기만 해도 AI는 고양이에 대한 분류 정확도가 뚝 떨어진다는 것이다. 실제 실험에서, 5% 이하로 인식률이 떨어졌고, 나머지 클래스(예: 개)에 대한 정확도는 4% 이내에서만 감소했다.



---

‘한 글자 바꾸기’로 AI 기억을 지운다?




이 방법이 특별한 이유는 바로 ‘레이블 조작’이라는 단순한 아이디어 덕분이다. 기존에는 고양이 사진을 “고양이(1)”이라고 정답으로 학습시켰다면, Scrub-and-Learn은 이제 이 고양이 사진을 “가장 가능성 높은 두 번째 클래스(예: 개)에 1, 나머지는 0”이라는 새로운 정답으로 바꿔 학습시킨다. 일명 ‘서브맥스 원-핫 인코딩’ 방식이다.



이 방식은 기존의 정답 지시를 슬쩍 바꿔치기하는 것으로, 굳이 AI 모델을 ‘재훈련’할 필요도 없고, 복잡한 수학 연산도 필요 없다. 그냥 살짝 다른 방향으로 학습을 유도해, AI가 스스로 잊게 만드는 것이다.



---

성능은? 빠르고 정확했다




연구팀은 이 방법을 MNIST, CIFAR-10, Fashion-MNIST, SVHN 등 유명한 이미지 데이터셋은 물론, 실제 의료 영상 데이터인 ASCI까지 다양한 데이터에 적용했다.



그 결과는 놀라웠다. 대부분의 경우, 잊고자 하는 클래스에 대한 정확도는 5% 이하, 나머지 데이터에 대한 분류 정확도는 원래보다 2~3% 이내 감소에 그쳤다. 기존 방식들(PBU, GKT, WF-Net, NG-IR 등)에 비해 훨씬 안정적인 성능을 보여줬다.



게다가 학습 속도도 빨랐다. 보통 수십~수백 번의 반복 학습이 필요했던 기존 방식과 달리, Scrub-and-Learn은 몇 번의 반복만으로도 효과적인 ‘잊기’가 가능했다.



---

 진짜 AI가 ‘잊었다’고 말할 수 있을까?




기술적으로만 보면 완벽해 보인다. 하지만 여전히 넘어야 할 산은 많다.



* 이 방식은 클래스 단위로만 작동한다. 즉, “고양이 중 이 사진 한 장만 잊어줘”라는 개별 데이터 삭제는 어렵다.

* 동시에 여러 클래스를 삭제하면 성능이 급격히 저하된다.

* 마지막으로, 현재는 실질적인 ‘프라이버시 보장’에 대한 수학적 증거는 부족하다.



연구진도 이 한계들을 인지하고 있으며, 앞으로는 인스턴스 삭제, 연속적인 ‘잊기’, 법적 기준을 충족하는 기술적 인증 등에 대한 연구를 이어갈 계획이다.



---

 ‘지우는 능력’이 AI의 미래가 된다




AI에게 가장 필요한 능력은 뭘까? 더 많은 걸 빠르게 배우는 것도 중요하지만, 때로는 잊는 것이 더 중요하다. 잘못 배운 정보를 지우고, 바뀐 사회 기준에 맞게 자신을 업데이트하는 능력. 바로 그것이 인간을 닮은 인공지능이 나아가야 할 방향일 것이다.



Scrub-and-Learn은 그 가능성을 보여준다. 우리가 AI에게 “기억에서 지워줘”라고 말할 수 있는 날이, 점점 가까워지고 있다.



---

출처 논문

Wang, J.; Bie, H.; Jing, Z.; Zhi, Y.

Scrub-and-Learn: Category-Aware Weight Modification for Machine Unlearning.

AI 2025, 6, 108.

---