“클라우드도 못 훔쳐본다?”… 하이퍼레저 패브릭과 인텔 SGX가 만든 ‘철벽 블록체인’의 정체

이미지
  블록체인은 원래 안전한 기술 아닌가? 많은 사람이 그렇게 생각한다. 하지만 진짜 무서운 공격자는 따로 있다. 바로  서버 관리자 와  클라우드 운영자 다. 아무리 블록체인이 암호화돼 있어도, 데이터가 실제로 계산되는 순간에는 메모리 안에서 평문 상태로 존재한다. 쉽게 말해 금고 안에 넣어둔 돈을 꺼내 세는 순간, 누군가 옆에서 훔쳐볼 수 있다는 뜻이다. 이 치명적인 약점을 해결하기 위해 연구진이 꺼내든 무기는 바로  Confidential Computing(기밀 컴퓨팅) 이었다. 그리고 이 기술은 실제로 이탈리아 제노바 항구 물류 시스템에 적용됐다. 단순한 실험실 장난감 수준이 아니었다는 이야기다. 블록체인도 결국 서버 위에서 돌아간다는 불편한 진실 많은 기업이 물류, 금융, 의료 데이터를 위해  하이퍼레저 패브릭(Hyperledger Fabric)  같은 기업형 블록체인을 사용한다. 이 시스템은 참여자마다 권한을 나누고, 특정 조직끼리만 데이터를 공유하는 기능도 제공한다. 논문에서는 이를  Private Collections(프라이빗 컬렉션) 이라고 설명했다. 문제는 여기서 끝나지 않는다. 예를 들어 물류회사가 컨테이너 이동 정보를 블록체인에 저장했다고 해보자. 다른 참여자는 못 보더라도, 클라우드 서버 관리자나 해커가 서버 메모리를 들여다보면 정보가 그대로 노출될 수 있다. 즉, 블록체인이 참가자끼리는 속일 수 있어도,  서버 자체가 배신하면 답이 없었던 셈 이다. 연구진은 바로 이 부분을 파고들었다. 인텔 SGX는 컴퓨터 안에 ‘비밀 방’을 만든다 연구의 핵심 기술은  Intel SGX 다. 이 기술은 CPU 내부에 외부가 접근할 수 없는 작은 보안 공간, 즉  엔클레이브(enclave) 를 만든다. 조금 쉽게 말하면 이런 느낌이다. 일반 프로그램 → 유리벽 사무실 SGX 프로그램 → 철문 달린 방공호 데이터는 이 방 안에서 암호화된 상태로 계산된다. 심지어 운영체...

“AI가 인간의 마음을 읽을 수 있을까?”… 옥스퍼드 연구진이 밝힌 역강화학습(IRL)의 치명적 한계

이미지
  인공지능이 인간의 행동을 보고 “이 사람은 무엇을 원하고 있구나”를 추론하는 시대가 왔다. 유튜브 추천 알고리즘, 자율주행차, 로봇 비서, 심지어 AI 동반자 서비스까지… 수많은 시스템이 인간 행동을 분석해 욕구와 목적을 추정한다. 그 중심에 있는 기술이 바로  역강화학습(Inverse Reinforcement Learning, IRL)  이다. 쉽게 말하면 “행동을 보면 목표를 알 수 있다”는 아이디어다. 그런데 최근 옥스퍼드대학교 연구진이 발표한 논문은 이 믿음에 거대한 물음표를 던졌다. 놀랍게도 AI는 인간 행동을 보고도 “진짜 목적”을 정확히 알 수 없을 가능성이 크다는 것이다. 심지어 아주 작은 오해만 있어도 완전히 엉뚱한 결론에 도달할 수도 있다고 경고했다. 같은 행동인데… 이유는 전혀 다를 수 있다 생각해보자. 매일 아침 한 사람이 카페에 간다. AI는 이를 보고 이렇게 추론할 수 있다. “커피를 좋아하는구나” “조용한 공간이 필요하구나” “출근 전에 습관적으로 들르는구나” “사람 만나는 장소로 쓰는구나” 겉으로 보이는 행동은 똑같다. 하지만 진짜 이유는 여러 개일 수 있다. 연구진은 바로 이 문제를  부분 식별성(partial identifiability)  이라고 불렀다. 즉, 행동만으로는 인간의 진짜 보상 체계, 다시 말해 “무엇을 원하는가”를 완전히 특정할 수 없다는 뜻이다. AI 입장에서는 꽤 치명적이다. 왜냐하면 지금까지 많은 AI 시스템은 “행동을 보면 목표를 추론할 수 있다”는 가정을 바탕으로 설계됐기 때문이다. 인간은 생각보다 비합리적이다 문제는 여기서 끝나지 않는다. 기존 역강화학습은 대체로 인간이 꽤 합리적으로 행동한다고 가정한다. 예를 들어: 가장 좋은 선택을 한다 손해를 최소화한다 보상을 최대화한다 하지만 현실 인간은 어떤가? 피곤하면 이상한 선택을 한다 스트레스 받으면 충동구매를 한다 미래보다 당장 편한 걸 고른다 분명 손해인데도 익숙한 행동을 반복한다 연구진은 이런 현실과 A...

AI의 블랙박스를 열다! 그래프 신경망이 ‘논리 규칙’으로 변신한 사연

이미지
  인공지능 기술이 하루가 다르게 발전하면서 이제는 우리의 일상을 지배하고 있다. 넷플릭스나 유튜브를 켜면 내 취향을 귀신같이 알아채고 영상을 추천해 주고, 쇼핑몰에 들어가면 내가 사고 싶었던 물건을 첫 화면에 띄워준다. 이러한 똑똑한 추천 시스템의 뒤에는 지식 그래프(Knowledge Graph)라는 복잡한 데이터 그물망과, 이를 분석하는 그래프 신경망(GNN)이라는 첨단 인공지능 모델이 자리 잡고 있다. 그런데 여기서 한 가지 커다란 문제가 발생한다. 이 인공지능 모델들은 너무나도 복잡한 수학적 계산을 거쳐 결론을 내리기 때문에, 왜 하필 나에게 그 책을 추천했는지, 왜 그 상품을 골랐는지 그 구체적인 이유를 인간이 알기 어렵다. 인공지능 학계에서는 이를 블랙박스 문제라고 부른다. 속을 들여다볼 수 없어 인공지능의 결론을 무조건 믿어야 하는 상황인 것이다. 만약 금융이나 의료 분야에서 인공지능이 잘못된 판단을 내렸는데 이유조차 모른다면 정말 끔찍한 일이 아닐 수 없다. 이러한 장벽을 깨부수기 위해 세계적인 명문대인 영국 옥스퍼드 대학교와 런던 대학교, 그리고 노르웨이 오슬로 대학교의 천재 컴퓨터 과학자들이 뭉쳤다. 데이비드 테나 쿠칼라, 베르나르도 쿠엔카 그라우, 보리스 모틱, 예고르 코스틸레프 연구팀은 인공지능의 복잡한 계산 과정을 단순한 논리 규칙으로 완벽하게 번역해 내는 기적 같은 기술을 개발했다.  이 놀라운 연구는 인공지능 분야의 세계 최고 권위 학술지인 Artificial Intelligence에 게재되며 전 세계 과학계의 이목을 집중시켰다. 인공지능의 블랙박스를 투명한 유리 상자로 바꾼 이들의 마법 같은 연구 속으로 들어가 보자. 인공지능의 천재성과 인간의 고전적 논리가 만나다 연구팀이 해결하고자 한 핵심 과제는 바로 그래프 신경망과 데이터로그(Datalog)라는 고전적인 컴퓨터 논리 언어 사이의 거대한 강을 연결하는 것이었다. 먼저 그래프 신경망은 엄청난 양의 데이터 속에서 복잡한 패턴을 스스로 학습하는 천재적인 능력을 가지고...

“GPT-4보다 더 똑똑하다고?”… 단 8B 소형 AI가 스스로 틀린 답을 고쳐가며 진화한 놀라운 실험

이미지
  요즘 인공지능은 뭐든 척척 해내는 것처럼 보인다. 질문하면 답하고, 글도 쓰고, 요약도 한다. 그런데 여기엔 치명적인 문제가 하나 있다. AI는 사실  자기가 틀렸는지 잘 모른다 는 점이다. 한 번 답을 내놓으면 끝이다. 사람이 “그건 좀 아닌데?”라고 말해도 대부분의 작은 AI 모델은 왜 틀렸는지 이해하지 못한다. 마치 시험지를 제출한 뒤 오답노트를 보지 않는 학생과 비슷하다. 그런데 최근 흥미로운 연구가 등장했다. 작은 오픈소스 AI에게 “이전 답이 좋았는지 나빴는지”를 계속 알려주자, AI가 스스로 더 좋은 답을 찾아가기 시작한 것이다. 놀랍게도 일부 작업에서는 GPT-4o보다 더 뛰어난 성능까지 보였다. 이 연구는 단순히 “AI 성능이 좋아졌다” 수준이 아니다. 앞으로 값비싼 초거대 AI 없이도, 저렴하고 작은 AI가 스스로 발전하는 시대가 올 수 있다는 신호에 가깝다. AI는 왜 같은 실수를 반복할까? 지금 대부분의 AI는 “한 번에 답 하나”를 생성한다. 질문을 받으면 그 즉시 가장 그럴듯한 답을 뱉어낸다. 문제는 여기서 끝난다는 점이다. 예를 들어 AI에게 “이 글의 핵심 키워드를 10개 뽑아라”라고 시키면, 처음 몇 개는 꽤 괜찮다. 하지만 뒤로 갈수록 이상한 단어나 중복 표현이 튀어나온다. 왜 그럴까? AI는 이전에 자기가 어떤 답을 냈는지, 그 답이 좋은지 나쁜지 충분히 고려하지 못하기 때문이다. 연구진은 여기서 인간 학습의 핵심 원리를 떠올렸다. 사람은 보통 이렇게 배운다. 답을 쓴다 피드백을 받는다 틀린 이유를 이해한다 다음 답을 수정한다 그런데 기존 소형 AI에는 이 과정이 거의 없었다. 연구진이 만든 핵심 아이디어… “GOOD / BAD” 이번 연구의 핵심은 놀라울 정도로 단순했다. AI에게 이전 답변마다 “GOOD” 또는 “BAD”라는 라벨을 붙여주는 것이다. 예를 들면 이런 식이다. GOOD: 아주 적절한 키워드 BAD: 엉뚱하거나 중복된 키워드 AI는 이 기록을 계속 프롬프트 안에 쌓아가며 다음 답을 생성한다....