11월, 2025의 게시물 표시

전문의 vs 인공지능, 누가 더 똑똑할까

이미지
헬리코박터 파일로리, 그리고 갑자기 등장한 인공지능 선생님들 위 속에 몰래 숨어 사는 세균 하나가 있다. 이름은 헬리코박터 파일로리. 전 세계 사람의 절반 정도가 이 세균을 품고 산다고 한다. 그냥 같이 지내면 좋겠지만, 이 세균은 위염, 위궤양, 위 림프종, 그리고 위암까지 일으킬 수 있는 꽤 위험한 손님이다. 그래서 병원에서는 이 세균을 최대한 빨리 찾고, 약으로 없애자고 계속 캠페인을 벌여 왔다. 그런데 한 가지 문제가 있다. 정작 세균을 없애야 할 사람들, 그러니까 환자들이 헬리코박터에 대해 잘 모른다는 것. 어떻게 감염되는지, 왜 치료해야 하는지, 약은 왜 꼭 끝까지 먹어야 하는지 충분히 이해하지 못하는 경우가 많다. 이때 등장한 것이 바로 요즘 핫한 인공지능 챗봇, 그중에서도 거대 언어 모델이라고 불리는 챗GPT, 제미나이, 딥시크 같은 친구들이다. 연구자들이 이런 생각을 한 거다. “헬리코박터에 대해 설명하는 쉬운 안내문을, 의사 대신 인공지능이 써 주면 어떨까?” 듣기만 해도 편해 보인다. 24시간 언제든지 질문할 수 있고, 원하는 언어로 친절하게 설명해 줄 것 같다. 그런데 정말로 안전하고, 정확하고, 환자에게 도움이 될까? 이번에 소개하는 논문은 바로 이 질문에 답하려고 했다. 최근 2년 사이에 발표된 7편의 연구를 모아, 인공지능이 만든 헬리코박터 교육 자료와 실제 위장병 전문의들이 만든 자료를 정면 비교했다. 이 리뷰 논문은 챗GPT 여러 버전(GPT-3.5, GPT-4, GPT-4o), 빙 코파일럿, 제미나이, 클로드, ERNIE Bot, 딥시크 같은 인공지능을 싹 모아서 총 7편의 연구 결과를 비교했다. 평가 기준은 정확도, 완전성, 가독성, 이해도, 안전성, 만족도 여섯 가지였다. 인공지능의 정답률, 생각보다 높았다 연구에서 인공지능에게 던진 질문은 헬리코박터가 일으키는 병, 검사법, 약 복용 기간, 치료 후 확인 방법 같은 것들이었다. 놀랍게도 최신 인공지능...

눈으로 보는 심장병? 눈 사진으로 알아보는 미래 건강 이야기

이미지
  “눈을 보면 마음을 알 수 있다”는 말, 들어본 적 있지? 그런데 요즘은 눈을 보면  심장병 도 알 수 있게 됐다! 그것도 아주 빠르게, 아주 쉽게, 눈 사진 한 장으로 말이다. 영국과 아르헨티나, 그리고 전 세계 의료진들이 함께한 놀라운 연구가 바로 그 얘기다. 과학자들은 이번에 눈 속에 있는 아주 얇은 층, 바로 ‘망막’과 그 아래 ‘맥락막’을 특별한 카메라로 들여다봤다. 이 카메라 이름은 좀 어렵지만 “광간섭단층촬영”이라는 기술이다. 영어로는 OCT라고 부른다. 덕분에 눈 안의 핏줄과 조직이 얼마나 건강한지, 마치 지도처럼 정밀하게 볼 수 있게 된 거다. 자, 그럼 이 기술로 도대체 무슨 일을 한 걸까? 평범한 눈 사진이 심장병 위험을 알려준다? 연구팀은 영국 UK 바이오뱅크라는 거대한 건강 데이터 저장소를 활용했다. 여기엔 수십만 명의 건강 정보와 눈 사진, 피검사 결과까지 빼곡히 담겨 있다. 이 중에서 연구자들은 2,800명 정도의 데이터를 꺼내 살펴봤다. 그중 612명은 실제로  5년 안에 심장마비나 뇌졸중 을 겪은 사람들이었고, 나머지 2,234명은 아무 문제 없던 건강한 사람들이었다. 연구진은 이 사람들이  미래에 심장병에 걸릴지 아닐지 를 눈 사진만 보고 맞출 수 있을지 실험을 해봤다. 놀랍게도, 인공지능이  정확히 맞춘 비율은 무려 70%! 이건 기존의 QRISK3라는 병원용 계산기보다도 훨씬 높은 수치였다. QRISK3는 혈압이나 체중 같은 기본 정보만 가지고 계산하지만, 이 새 기술은  눈 속의 미세한 변화 까지 포착했기 때문에 더 정밀했던 것이다. 인공지능, 눈 사진을 어떻게 분석했을까? 이 연구에서 사용된 인공지능 기술은 아주 똑똑하게 설계되었다. 이름은  VAE (변분 오토인코더) 라는 복잡한 이름을 갖고 있지만, 쉽게 말하면 ‘패턴을 스스로 배우는 두뇌’ 같은 존재다. 먼저, 눈 사진을 수천 장 보여주면서  어떤 모양이 보통인지 를 스스로 익히게 했다...

챗GPT 덕분에 보고서 쓰는 시간이 절반으로 줄었다?

이미지
대학원 수업에서 매주 영어로 정책 메모를 써야 한다고 상상해보자. 뉴스 기사 요약하고, 추가 설문조사 자료를 찾아 분석하고, 마지막에는 조직의 정책까지 제안해야 한다. 게다가 이 모든 걸 전부 영어로, 깔끔한 ‘프로의 글’처럼 써야 한다. 여기에 챗GPT 같은 생성형 AI를 제대로 배우고 쓰면 어떤 일이 벌어질까? 국제 학술지 International Journal of Artificial Intelligence in Education 에 실린 한 연구는 이 질문에 꽤 분명한 답을 내놓았다. 결론부터 말하면, 학생들이 과제를 끝내는 시간은 절반 이하로 줄었고, 글의 점수는 A-에서 A 수준으로 올라갔다. 특히 영어가 모국어가 아닌 대학원생들에게 효과가 더 컸다. 말 그대로 “영어 글쓰기 레벨링(levelling)”이 일어난 셈이다. 카네기멜론 대학원생 27명을 대상으로 한 작은 실험 이 연구는 미국 카네기멜론대학교의 7주짜리 인공지능 대학원 수업에서 진행했다. 참여자는 석‧박사 과정 대학원생 27명. 전공도 정보시스템, 공공정책, 경영, 컴퓨터공학, 인문학 등 다양했다. 그중 약 56%는 영어가 모국어가 아닌 학생들이었다. 연구팀은 학생들에게 총 세 번의 ‘프로페셔널 메모’ 작성 과제 를 줬다. 내용은 매번 다르지만 구성은 항상 같았다. 뉴스 기사 요약하기 인터넷에서 관련 설문조사나 통계 찾기 여러 자료를 비교‧분석하기 그 결과를 기반으로 정책 제안하기 전체 글의 구조와 흐름 정리하기 각 과제는 24점짜리 루브릭으로 채점했다. 요약·외부 조사·분석·정책 제안·스타일 등 8개 항목 을 각각 1~3점으로 평가했다. 1단계: AI 완전 금지 첫 번째 과제는 AI 완전 금지 조건에서 진행했다. 학생들은 평소처럼 조사하고 직접 쓰고 스스로 다듬었다. 그리고 실제로 걸린 시간을 직접 재서 제출하게 했다. 2단계: “AI에게 다 맡겨봐라”...

목이 아픈 사람들 사이에, 인공지능이 끼어들었다

이미지
나이가 들수록 목이 뻐근하고 팔이 저린 사람이 늘어난다. 병원에 가면 “목 디스크” 혹은 “퇴행성 경추증”이라는 말을 듣곤 한다. 의사는 MRI 사진을 보여주며 어디가 좁아졌는지, 신경이 얼마나 눌리는지를 설명한다. 문제는 이 설명이 의사마다, 심지어 같은 환자를 두고도 제각각일 수 있다는 점이다. 누군가는 “심하다, 수술을 고려해야 한다”고 말하고, 다른 이는 “그 정도면 경미하다, 경과를 보자”고 말한다. 만약 이 애매함을 줄여줄 ‘공정한 심판’이 있다면 어떨까? 싱가포르 국립대병원과 컴퓨터공학 연구진이 바로 그 역할을 맡을 인공지능을 만들었다. 경추(목) MRI를 여러 방향으로 한 번에 읽어, 신경이 얼마나 눌려 있는지 자동으로 등급을 매기는 딥러닝 모델이다. 그리고 이 모델은 실제 척추외과 의사와 영상의학과 의사들과 정면 대결을 벌였다. 그 결과는? 꽤 놀랍다. 내부 시험에서는 대부분의 항목에서 인공지능이 인간 전문가들을 앞섰다. MRI를 ‘위에서, 옆에서’ 동시에 보는 똑똑한 모델 먼저 이 병의 정체부터 짚고 가자. 퇴행성 경추증은 쉽게 말해, 목뼈와 디스크가 나이를 먹으면서 닳고 변형되면서 신경이 눌리는 상태 다. 목에서 나오는 신경은 크게 둘로 나눠 볼 수 있다. 척수 자체가 지나가는 척추관(스파이널 캐널) 양옆으로 팔로 뻗어 나가는 신경이 빠져나가는 신경공(포라미나) 좁아지는 위치와 정도에 따라 증상이 다르고, 수술 여부도 달라진다. 그래서 MRI에서 “어느 높이의 디스크에서, 척추관과 신경공이 몇 단계로 좁아졌는지” 꼼꼼하게 보게 된다. MRI에는 두 가지 시선이 있다 의사들이 보는 경추 MRI는 크게 두 방향이다. 시상면(sagittal) : 옆에서 목 전체를 길게 1장으로 보는 사진 축면(axial) : 목을 얇게 슬라이스처럼 한 단면씩 자른 사진 시상면은 전체적으로 어느 레벨이 가장 심하게 눌려 있나를 한눈에 볼 수 있고, 축면은 양쪽...

굴삭기도 똑똑해진다?! AI가 건설 현장을 이해하는 법

이미지
  건설 현장에선 매일 수많은 일이 벌어진다. 크레인이 철근을 옮기고, 굴삭기는 땅을 파고, 작업자들은 분주하게 움직인다. 그런데 이런 복잡한 현장을  AI가 이해하고 조종할 수 있다면  어떨까? 누군가는 말했을지도 모른다. “AI가 사람 얼굴은 알아도, 굴삭기 옆에 있는 돌덩이까지 구분하진 못하잖아?” 하지만 그게 이제는 가능해졌다. 그것도  비싼 슈퍼컴퓨터 없이 ,  일반 소비자용 컴퓨터 에서도 말이다! 이번에 한국 연구팀이 발표한 논문은 바로 그런 획기적인 기술을 다루고 있다. 똑똑한 인공지능 모델이 실제 건설 장면을 보고,  사람과 장애물은 물론 날씨까지 구분 하는 방법을 제시한 것. 건설 현장의 ‘눈’이 되어줄 이 기술은 안전과 효율, 두 마리 토끼를 잡을 수 있게 해준다. AI가 현장을 읽는 눈을 갖게 하려면? 요즘 인공지능(AI)은 그림도 보고, 글도 읽고, 영상도 분석할 수 있다. 이런 AI를  ‘대형 비전-언어 모델’(LVLM) 이라고 부른다. 문제는 이 모델들이 너무 커서  운영하려면 엄청난 컴퓨터 자원이 필요 하다는 점이다. 건설 현장에서 이런 AI를 쓰고 싶어도,  VRAM 24GB 정도의 일반 GPU 로는 무리라고 여겨졌던 게 현실이다. 게다가, 건설 현장 사진은 다양하고 복잡해서  데이터 수집과 라벨링 에도 시간이 많이 든다. 그래서 연구팀은 새로운 방법을 고안했다. 바로  ‘적은 데이터와 자원으로도 AI를 똑똑하게 만드는’  방법이다. 핵심은 ‘적게 먹고 잘 뛰는’ AI 만들기 연구팀은 총 5가지 최신 AI 모델을 테스트했다: Llama-3.2-Vision, Qwen2-VL, Qwen2.5-VL, LLaVA-1.6, 그리고 Gemma 3. 각각은 이미지와 텍스트를 함께 이해할 수 있는 모델이다. 하지만 그냥 사용하면 메모리도 많이 먹고 느리다. 그래서  ‘Unsloth’와 ‘QLoRA’ 라는 기술을 써서...

AI가 가난을 줄이려면, 먼저 ‘돈의 흐름’부터 바꿔야 한다

이미지
“AI가 가난한 나라를 구할 수 있을까?” 이 질문에 스페인~영국~캐나다~영국을 넘나들며 연구하는 학자 이고르 칼사다는 이렇게 답했다. “가능하다. 하지만 그냥 기술만 깔아서는 안 되고, AI가 만드는 돈과 권력이 누구에게 넘어가는지부터 다시 설계해야 한다.” 그가 막 발표한 논문의 제목은 이렇다. ‘Decentralizing AI Economics for Poverty Alleviation: Web3 Social Innovation Systems in the Global South’ 직역하면, “AI 경제를 분산시켜 가난을 줄이자: 글로벌 사우스에서의 웹3 사회혁신 시스템” 정도다. 이 논문이 다루는 핵심은 단순하다. AI 자체가 중요한 게 아니라, AI가 만들어내는 부와 데이터, 권력이 “어떤 경제 시스템”을 통해 움직이느냐 가 중요하다는 것이다. 그리고 그 무대는 유럽이나 미국이 아니라, 아프리카·라틴아메리카·아시아 등 이른바 ‘글로벌 사우스’다. AI를 ‘기술’이 아닌 ‘경제 시스템’으로 바라보다 칼사다는 먼저 새로운 개념 하나를 제시한다. ‘AI 경제학(AI Economics)’ 이다. 보통 디지털 경제라고 하면 플랫폼, 앱, 네트워크 효과 같은 이야기를 떠올리지만, AI 경제학은 질문이 조금 다르다. AI 모델이 돌아가면서 누가 데이터를 모으고 , 그 데이터로 만든 서비스에서 누가 이익을 가져가고 , 그 과정에서 사람들의 노동과 시간은 어떻게 가치가 매겨지는지 , 그리고 최종적으로 돈과 권력이 어디로 흘러가는지 를 살펴보는 시각이다. 글로벌 노스(북반구 부유국)에서는 AI가 이미 행정, 교통, 보건, 금융에서 효율을 높이고 있다. 하지만 글로벌 사우스에서는 얘기가 달라진다. 인터넷 인프라도 충분치 않고, 디지털 교육도 부족하고, 법과 제도도 AI를 감당할 준비가 안 된 곳이 많기 때문이다. 그래서 칼사다가 던지는 더 날카로운 질문은 이것이다. “AI가 정말 가난을 줄이는 도구가 ...

챗봇이 대신 민원 넣어주는 시대, 모두에게 공정할까?

이미지
  요즘 주민센터에 가는 대신, 휴대폰으로 몇 번만 눌러서 민원을 처리하는 사람이 점점 늘고 있다. 여기에  “생성형 AI 챗봇이 전자정부를 도와준다” 는 말까지 붙으면, 왠지 세상이 훨씬 편해질 것 같다. 하지만 한 번 상상해보자. 어떤 사람은 AI 챗봇에게 “이 서류 어떻게 내나요?”라고 물어보고 순식간에 신청을 끝낸다. 반대로, 어떤 사람은 여전히 종이 서류를 들고 구청 창구 앞에서 번호표를 뽑고 서 있다. 같은 나라 국민인데, 디지털 행정의 문 앞에서부터 이미 갈리는 것 이다. 이번에 소개할 논문은 바로 이 지점을 파고든다. 세르비아를 사례로, 생성형 AI가 전자정부 안에서  디지털 격차를 줄일지, 오히려 벌려놓을지  분석한 연구다. 인터넷은 다들 되는데, 정작 전자정부는 잘 안 쓴다 연구진은 먼저 “전자정부의 디지털 격차”를 세 가지 층으로 나눴다. 이름은 조금 어려워 보여도, 내용은 surprisingly 직관적이다. D1: 기본 디지털 격차 인터넷 되는지, 스마트폰·컴퓨터는 있는지 기본적인 디지털 기술(파일 옮기기, 프로그램 설치 등)이 되는지 디지털 교육이나 도움을 받을 곳이 있는지 D2: 전자정부 격차 실제로 온라인으로 정부 서비스를 이용하는지 전자서명·공동인증서 같은 eID를 쓸 줄 아는지 “복잡해 보여서…”, “굳이 필요 없어서…” 같은 이유로 안 쓰는 사람은 얼마나 되는지 D3: 생성형 AI 격차(탐색 단계) 챗GPT 같은 생성형 AI를 쓸 수 있는지 단순 질문뿐 아니라 다양한 업무에 활용하는지 AI가 내놓은 답을 검증하고, 개인정보·윤리 문제를 이해할 만큼의 ‘AI 리터러시’가 있는지 연구진은 이 세 층을 합쳐  전자정부 디지털 격차 측정 지표(EGDMI) 라는 지표를 만들었다. 이름은 딱딱하지만, 요지는 간단하다. “ 접속이 되느냐 ”에서 끝내지 않고 “ 정말로 잘 쓰고 있느냐, 그리고 AI 시대엔 거기서 또 누가 떨어져 나가느냐 ”까지 한 번에 살펴보겠다는 것이다. 숫자로 본 현실:...

슬로바키아 작은 도시를 살린 교차로 혁신, ‘터보 라운드어바웃’의 반전 효과

이미지
  슬로바키아의 소도시 페지노크. 브라atislava에서 차로 20분 정도 떨어진 이 도시의 한 작은 회전교차로가 교통공학자들의 실험실이 됐다. 평소에는 조용한 동네 교차로지만, 출·퇴근 시간만 되면 차량이 몰려 정체와 긴 대기 행렬이 끊이지 않았다. 연구진은 “이 교차로를 그냥 두면 앞으로 10~20년 안에 완전히 막히게 된다”고 경고했다. 그리고 한 가지 대담한 해법을 꺼냈다. 기존의 단일 차로 회전교차로(single-lane roundabout)를 ‘터보 라운드어바웃(turbo roundabout)’으로 바꾸자는 제안이었다. 도심 한가운데 작은 회전교차로가 왜 문제였을까 연구가 시작된 곳은 지름 43m짜리, 다섯 개의 도로가 만나는 단일 차로 회전교차로였다. 모든 진입·진출이 한 차로에 몰려 있어, 조금만 교통량이 늘어도 금세 목이 막히는 구조였다. 연구진은 2023년 10월, 평일 하루 12시간 동안 카메라를 설치해 이 교차로를 지나가는 모든 차량을 세었다. 그 결과 아침 6시부터 저녁 6시까지 무려 2만 7,466대가 통과한 것으로 나타났다. 그중 승용차가 대부분이었지만, 화물차와 버스도 적지 않았다. 시간대별로 보면, 아침 피크 시간(7:30~8:30) 에는 2550대, 오후 피크 시간(15:45~16:45) 에는 2586대가 몰렸다. 겉으로 보기엔 “제법 버티고 있네” 싶지만, 용량 분석을 돌려 보니 결과는 심각했다. 기술 기준(TP 102)에 따라 각 진입로의 평균 대기 시간을 계산해 보니, 출근 시간대에는 다섯 개 진입로 중 두 곳이 사실상 ‘용량 초과’ 상태, 교통 서비스 수준으로는 최악을 뜻하는  F등급 을 받았다. 차가 얼마나 길게 섰는지도 따졌다. 95%의 시간 동안 발생하는 최대 대기 행렬 길이를 계산했더니, 가장 심한 진입로는 줄이  312m 까지 늘어났다. 거의 축구장 세 개를 이어 붙인 길이다. 터보 라운드어바웃이라는 낯선 해법 그렇다면 ‘터보 라운드어바웃’은 무엇일까. 이름은 거창하지만 기본 개...