전문의 vs 인공지능, 누가 더 똑똑할까
헬리코박터 파일로리, 그리고 갑자기 등장한 인공지능 선생님들 위 속에 몰래 숨어 사는 세균 하나가 있다. 이름은 헬리코박터 파일로리. 전 세계 사람의 절반 정도가 이 세균을 품고 산다고 한다. 그냥 같이 지내면 좋겠지만, 이 세균은 위염, 위궤양, 위 림프종, 그리고 위암까지 일으킬 수 있는 꽤 위험한 손님이다. 그래서 병원에서는 이 세균을 최대한 빨리 찾고, 약으로 없애자고 계속 캠페인을 벌여 왔다. 그런데 한 가지 문제가 있다. 정작 세균을 없애야 할 사람들, 그러니까 환자들이 헬리코박터에 대해 잘 모른다는 것. 어떻게 감염되는지, 왜 치료해야 하는지, 약은 왜 꼭 끝까지 먹어야 하는지 충분히 이해하지 못하는 경우가 많다. 이때 등장한 것이 바로 요즘 핫한 인공지능 챗봇, 그중에서도 거대 언어 모델이라고 불리는 챗GPT, 제미나이, 딥시크 같은 친구들이다. 연구자들이 이런 생각을 한 거다. “헬리코박터에 대해 설명하는 쉬운 안내문을, 의사 대신 인공지능이 써 주면 어떨까?” 듣기만 해도 편해 보인다. 24시간 언제든지 질문할 수 있고, 원하는 언어로 친절하게 설명해 줄 것 같다. 그런데 정말로 안전하고, 정확하고, 환자에게 도움이 될까? 이번에 소개하는 논문은 바로 이 질문에 답하려고 했다. 최근 2년 사이에 발표된 7편의 연구를 모아, 인공지능이 만든 헬리코박터 교육 자료와 실제 위장병 전문의들이 만든 자료를 정면 비교했다. 이 리뷰 논문은 챗GPT 여러 버전(GPT-3.5, GPT-4, GPT-4o), 빙 코파일럿, 제미나이, 클로드, ERNIE Bot, 딥시크 같은 인공지능을 싹 모아서 총 7편의 연구 결과를 비교했다. 평가 기준은 정확도, 완전성, 가독성, 이해도, 안전성, 만족도 여섯 가지였다. 인공지능의 정답률, 생각보다 높았다 연구에서 인공지능에게 던진 질문은 헬리코박터가 일으키는 병, 검사법, 약 복용 기간, 치료 후 확인 방법 같은 것들이었다. 놀랍게도 최신 인공지능...