AI가 의학 논문을 읽는 날: 의료 텍스트를 읽고 이해하는 비밀 병기




“병원 기록이 너무 복잡해요!”
의사들이 종종 털어놓는 말이다. 수많은 진료 기록, 처방전, 소견서, 검사 결과… 하나하나 꼼꼼히 읽고 중요한 정보를 뽑아내려면 끝없는 시간이 걸린다. 그런데 이 복잡한 의료 텍스트를 대신 읽고, 핵심만 쏙쏙 뽑아주는 인공지능(AI)이 있다면 어떨까?

브라질 연구진은 바로 이 점에 주목했다. ‘의료 텍스트 속 이름표 달기(Named Entity Recognition, 이하 NER)’라는 기술이 그 주인공이다. 이름은 조금 어렵지만, 하는 일은 간단하다. 의학 용어, 질병 이름, 약품 이름 등을 문서 속에서 자동으로 찾아내고 구분하는 기술이다.


NER가 뭐길래 이렇게 중요할까?

의료 기록은 방대한데다 사람마다 표현도 제각각이다. 같은 병도 표현하는 단어가 수십 가지가 넘는다. 기존에는 규칙 기반 시스템이나 단어 묶음 기술(Word2Vec, GloVe)을 써왔다. 하지만 이 방식은 사람처럼 문맥을 이해하지 못해 정확도가 낮고, 새로운 표현에는 약했다. 게다가 방대한 데이터에 사람이 직접 라벨을 달아야 해서 시간이 많이 들었다.

그래서 최근엔 ‘트랜스포머(Transformer)’ 기반의 언어 모델이 주목받고 있다. 대표 주자인 BERT는 양쪽 문맥을 모두 고려해 단어의 의미를 파악한다. 사람처럼 문장을 앞뒤로 읽는 셈이다. 이번 연구는 BERT와 그 파생 모델(ClinicalBERT, BioBERT 등)이 의료 텍스트에서 NER을 어떻게 잘 해내는지 꼼꼼히 살폈다.



세계 곳곳에서 뛰어든 AI 연구

연구팀은 SCOPUS, IEEE Xplore, ACM 등 6개의 대형 데이터베이스에서 5,800편이 넘는 논문을 모았다. 이 중 엄격한 기준을 통과한 300여 편의 논문을 분석했다. 흥미로운 점은 연구의 30%가 불과 2023년에 쏟아져 나왔다는 것! 그만큼 의료 텍스트 처리 분야가 급성장하고 있다는 뜻이다.

국가별로는 중국과 미국이 가장 많은 연구를 발표했다. 한국도 주요 병원 데이터로 연구에 참여했다. 전 세계 연구진이 하나같이 주목한 것은 BERT였다. BERT는 의료 기록에서 무려 99% 가까운 정확도로 사람 이름, 약 이름 등을 찾아냈다. 특히 ClinicalBERT는 병원 데이터에 특화돼 더 강점을 보였다.


AI가 읽고 뽑아낸다, 무엇이 달라질까?

NER 기술이 본격적으로 자리 잡으면 병원 현장부터 달라진다. 의사가 복잡한 기록을 일일이 읽지 않아도 된다. AI가 먼저 문서를 읽고, 질병명, 증상, 약물명 등을 분류해 의사에게 ‘핵심 요약본’을 제공한다. 의사는 더 빠르고 정확한 진단을 내릴 수 있고, 중복 처방 같은 실수도 줄어든다.

브라질 보건의료 시스템(SUS)도 이를 적극 활용할 계획이다. 의료 데이터 자동 정리, 감염병 실시간 감시, 병상 관리까지 AI가 지원한다면, 공공의료가 더 빠르고 촘촘해진다. 누구나 더 안전하고 신속한 진료를 받을 수 있는 길이 열린다.



아직 남은 숙제도 있다

물론 한계도 있다. BERT는 영어에서 뛰어난 성능을 보였지만, 언어가 바뀌면 결과가 달라질 수 있다. 한국어나 포르투갈어 같은 언어에서는 아직 데이터가 부족하다. 또 AI가 읽어도 사람의 손길이 완전히 필요 없지는 않다. 라벨링과 학습 데이터 품질이 좋지 않으면 AI의 ‘눈’도 흐려진다.

그래도 연구진은 낙관적이다. BERT, GPT 같은 모델에 ‘파인튜닝(fine-tuning)’과 ‘프롬프트 튜닝(prompt tuning)’ 기법을 더해 점점 더 똑똑한 의료 비서가 탄생할 거라고 내다봤다.


AI가 진짜 ‘의료 파트너’가 되는 날까지

언젠가 병원 기록은 물론 인터넷에 쏟아지는 건강 뉴스까지 AI가 실시간으로 읽고, 위험 신호를 잡아낼 수 있을까? 이번 연구는 그 가능성을 향해 한 발 더 다가갔다. 인간과 AI가 함께라면, 더 빠르고 정확한 의료 정보 시대가 열린다.




출처 논문
de Almeida SS, Silva Fontes R, Pareja Credidio Freire Alves L, Júnior MC, José Pinheiro Caldeira Silva G, Ramalho Cortez L, de Morais AHF, Medeiros Machado G, Gonçalo Oliveira H, Cunha-Oliveira A, dos Santos JPQ and de Medeiros Valentim RA (2025) Artificial intelligence in healthcare text processing: a review applied to named entity recognition. Front. Artif. Intell. 8:1584203. https://doi.org/10.3389/frai.2025.1584203