AI-World-Story

글

12월, 2025의 게시물 표시

“거실 전등 좀 꺼줘” 한마디가, 집 전체를 위험에 빠뜨릴 수도 있다

- 12월 31, 2025

스마트홈은 참 달콤하다. 침대에 누워 “불 꺼” 하면 거실 전등이 꺼지고, 밖에서도 문을 열어줄 수 있고, 로봇청소기가 알아서 움직인다. 그런데 여기엔 불편한 진실이 숨어 있다. 집 안에 붙어 있는 IoT(사물인터넷) 기기들은 생각보다 ‘약한 고리’가 많다는 점이다. 기기 종류도 제각각이고 성능도 들쭉날쭉하다. 어떤 건 작은 센서라서 계산을 거의 못 하고, 어떤 건 허브처럼 똑똑하다. 이런 ‘뒤죽박죽 팀’이 한 집 안에서 네트워크로 연결돼 있으니, 공격자 입장에선 문 하나만 열면 방 전체가 열린다. 논문은 이 문제를 정면으로 겨냥한다. “중앙 서버 하나가 모든 걸 통제하는 구조는 뚫리면 끝장이고, 블록체인만 쓰면 너무 느려서 전등 끄는 데도 버벅인다.” 그러니 둘 다 장점만 섞어서, ‘단단하면서도 빠른’ 보안 구조를 만들자는 이야기다. 그리고 그 조합의 핵심은 네 가지다. 컨소시엄 블록체인 , 스마트 계약 , 그룹 기반 영지식증명 , 그리고 오프체인 조정자(코디네이터) 다. 여기에 보너스로 머신러닝 을 붙여, 기기 상태에 따라 암호 방식을 똑똑하게 바꾸게 만든다. 블록체인은 ‘집안 주민등록’, 코디네이터는 ‘현장 경비’ 역할을 맡는다 이 설계가 재미있는 이유는 역할 분담이 아주 명확해서다. 한 줄로 요약하면 이렇다. 블록체인은 “누가 우리 집 식구냐”를 절대 잊지 않는 기록장 이다. 기기의 공개키(신분증 같은 것), 기기 그룹(예: 거실 그룹), 그리고 ‘큰 규칙’(이 사용자가 이 그룹에 이 행동을 해도 되는지)을 바꿀 수 없게 저장한다. 코디네이터는 실시간으로 움직이는 현장 경비 다. “지금 너무 자주 요청하는데?”, “밤 3시에 현관문을 열라고?”, “배터리가 바닥인 센서에게 무리한 암호를 시키면 죽겠는데?” 같은 상황 판단을 한다. 여기서 포인트는 “모든 걸 블록체인에 올리지 않는다”는 선택이다. 블록체인은 강력하지만 느리고 비용이 든다. 그래서 논문은...

AI, 엑스레이 보고서 작성 능력 발전

- 12월 30, 2025

엑스레이 사진만 보고도 척척? 인공지능 의사의 보고서 작성 능력 어디까지 왔나 병원을 찾았을 때 우리 몸 안의 문제를 확인하기 위해 찍는 엑스레이나 CT 사진. 하지만 이 사진들을 보고 의사 선생님이 직접 소견을 적는 과정은 생각보다 많은 시간과 노력이 필요하다. 만약 인공지능이 복잡한 사진을 분석해서 전문가처럼 상세한 보고서를 척척 써준다면 어떨까? 최근 과학계에서는 딥러닝이라는 기술을 이용해 방사선 보고서를 자동으로 만들어내는 연구가 뜨겁게 달아오르고 있다. 과연 인공지능은 미래의 병원에서 의사 선생님의 든든한 조력자가 될 수 있을까? 사람처럼 생각하고 글 쓰는 인공지능, 엑스레이를 읽기 시작했다 최근 발표된 대규모 연구 분석에 따르면, 2015년부터 2025년 사이 인공지능 기반의 자동 보고서 생성 기술은 엄청난 발전을 이루었다. 연구진은 총 89건의 주요 연구 사례를 분석했는데, 특히 코로나19 대유행을 거치며 가슴 부위 엑스레이 사진을 분석하는 도구들이 비약적으로 늘어났다. 전체 연구의 무려 87%가 가슴 엑스레이에 집중되었을 정도다. 인공지능은 마치 눈으로 보듯 이미지를 인식하는 기술과 사람의 언어를 이해하는 기술을 결합해, 사진 속에 숨은 미세한 징후들을 찾아내고 이를 문장으로 옮기는 훈련을 거듭하고 있다. 보고서 작성의 달인 탄생의 비결은 하이브리드 두뇌 인공지능이 어떻게 사진을 보고 글을 쓸 수 있을까? 연구 결과에 따르면, 요즘 가장 인기 있는 방식은 서로 다른 능력을 가진 두 가지 인공지능을 하나로 합친 하이브리드 구조다. 한쪽에서는 이미지의 특징을 꼼꼼하게 잡아내고, 다른 한쪽인 트랜스포머라는 기술은 문맥을 파악해 자연스러운 문장을 만들어낸다. 특히 최근에는 단순히 글자만 흉내 내는 것을 넘어, 방사선과 의사들이 가진 전문 지식이나 과거의 치료 기록까지 참고해 보고서의 정확도를 높이려는 시도가 계속되고 있다. 덕분에 인공지능이 쓴 보고서는 갈수록 사람이 쓴 것처럼 매끄럽고 구체적인 모습을...

하늘을 나는 비행기, 사실은 계속 “나 여기 있어!”라고 말한다

- 12월 30, 2025

공항 근처 하늘을 올려다보면 비행기는 조용히 지나가지만, 그 안에서는 아주 시끄러운 ‘데이터 방송’이 계속 나온다. 비행기가 스스로 자기 위치(위도·경도), 고도, 속도, 방향, 식별 정보 같은 걸 실시간으로 뿌리는 기술이 있다. 이름은 ADS-B(Automatic Dependent Surveillance–Broadcast). 항공 관제의 눈과 귀가 되는 핵심 장치라, 비행 안전과 효율을 크게 끌어올린다. 문제는 “Broadcast”, 즉 ‘방송’이라는 단어에 숨어 있다. 방송은 원래 누구나 들을 수 있다. ADS-B도 마찬가지다. 암호화 없이 공개로 흘러나오는 데이터가 많아, 마음만 먹으면 가로채기(도청)가 가능하다. 그리고 여기서부터 이야기가 무서워진다. 비행기 식별 코드 하나만 보면 별일 아닐 수 있지만, 거기에 초정밀 위치·시간·고도·속도 같은 값이 강하게 묶이면 ‘한 대의 비행기가 언제 어디로 어떻게 움직였는지’가 한눈에 그려진다. 이게 쌓이면 비행기의 의도, 임무 성격, 특정 지역 접근 패턴까지 추정될 수 있다. 개인의 이동과 연결될 수도 있고, 국가·항공 보안 이슈로도 번진다. 논문은 이 지점을 “민감한 정보가 결합될 때 위험이 커진다”는 식으로 정의하고, 보호해야 할 프라이버시 데이터를 ‘모든 필드’가 아니라 ‘식별자+상태를 정확히 찍는 동적 정보의 조합’으로 잡았다. AI가 ‘잠글 것만’ 골라내고, 잠금은 초고속으로 끝낸다 이 논문이 내놓은 해법은 한마디로 “전부 잠그지 말고, 정말 위험한 것만 골라서 잠그자”다. 여기서 주인공이 둘이다. 첫째는 딥러닝(CNN) , 둘째는 대칭키 암호 다. 먼저 AI가 ‘민감한 조각’을 찾아낸다. 연구팀은 ADS-B 데이터를 시간에 따라 이어지는 ‘연속 기록’으로 보고, 이를 일종의 1차원 이미지처럼 다뤘다. 예를 들어 50개의 연속 시점(time step) 동안 위도·경도·고도·속도·방향 같은 5개 특징을 묶어 하나의 입력으로 만든다. 그러면 CNN이 시간축을...

돋보기 든 AI, 우리 집 가전제품의 '0.1mm' 결함까지 잡아낸다!

- 12월 29, 2025

우리가 매일 사용하는 스마트폰, TV, 그리고 자동차 안에는 초록색 판 위에 수많은 부품이 올라간 전자 회로 기판(PCB)이 들어 있다. 이 기판은 기계의 심장이자 두뇌 같은 존재다. 그런데 부품들이 점점 작아지고 촘촘해지면서, 사람이 눈으로 보거나 일반적인 기계로 검사해서는 찾기 힘든 아주 미세한 불량들이 생기기 시작했다. 만약 이 작은 결함을 놓친다면? 우리가 산 스마트폰이 갑자기 꺼지거나 심각한 고장을 일으킬 수도 있다. 최근 과학자들은 인공지능(AI), 그중에서도 똑똑하기로 소문난 '딥러닝'을 이용해 이 문제를 해결하는 방법을 찾아냈다. 56개의 최신 연구들을 꼼꼼히 분석한 이번 보고서를 통해, AI가 어떻게 전자제품의 수호천사가 되고 있는지 함께 살펴보자. 딥러닝이라는 마법의 안경을 쓴 검사관의 등장 그동안 공장에서는 '자동 광학 검사(AOI)'라는 기계를 주로 사용했다. 하지만 이 기계는 정해진 규칙대로만 움직여서, 빛이 조금만 바뀌거나 기판이 살짝 비뚤어져도 "불량이야!"라고 잘못 외치는 경우가 많았다. 심지어 진짜 불량을 정상으로 착각하는 위험한 실수도 했다. 하지만 딥러닝은 다르다. 딥러닝은 수만 장의 사진을 보며 스스로 '무엇이 정상이고 무엇이 결함인지' 특징을 공부한다. 연구에 따르면, 딥러닝을 활용한 검사는 정확도가 무려 98~99.8%에 달한다고 한다. 예전 기계들이 80%대에 머물렀던 것과 비교하면 정말 엄청난 발전이다. 특히 '합성곱 신경망(CNN)'이라는 기술은 마치 사람의 눈처럼 이미지의 구석구석을 훑으며 쥐가 파먹은 듯한 자국(마우스 바이트), 끊어진 회로, 불필요한 구리 조각 같은 6가지 이상의 대표적 결함들을 척척 찾아낸다. 데이터가 부족해도 스스로 학습하는 똑똑한 AI의 비결 하지만 문제가 하나 있었다. AI가 공부하려면 수많은 '불량 사진'이 필요한데, 실제 공장에서는 불량이 자주 나오지 않아 사진을 구하기가 힘들었다. 과...

번호판이 안 보이면 끝일까? ‘차의 얼굴’로 추적하는 시대가 왔다

- 12월 29, 2025

교차로 CCTV 화면을 떠올려 보자. 차는 쌩쌩 지나가고, 비가 오거나 햇빛이 강하면 반사 때문에 화면이 번쩍인다. 결정적으로 번호판이 가려지거나, 흙탕물이 튀거나, 아예 위조돼 있으면? 우리가 흔히 믿는 “번호판 인식”은 그 순간 힘이 빠진다. 그렇다고 수사를 멈출 순 없다. 그래서 연구자들이 꺼낸 대안이 있다. 번호판 대신 “차 자체의 생김새와 색”을 단서로 삼는 방법이다. 루마니아 연구팀은 실제 도로 환경에서 차종(제조사·모델) 과 차색 을 함께 맞히는 자동 인식 시스템을 만들었다. 핵심 메시지는 단순하다. “번호판이 흔들릴 때, 차의 겉모습이 백업 카드가 된다.” 그리고 그 백업 카드를 꽤 높은 정확도로 꺼내 들었다. 카메라는 차를 ‘잘라내고’, AI는 중요한 부위만 ‘골라 본다’ 이 시스템은 크게 두 단계로 움직인다. 연구팀이 논문 속 그림(특히 8쪽의 파이프라인 도식)으로 보여준 흐름을, 사람 말로 풀면 이렇다. 1) 먼저 “저기 차 있다!”를 찾아낸다 교차로 영상에서 차를 찾아 박스로 둘러치는 역할을 한다. 여기서는 YOLOv8이라는 물체 탐지 모델을 사용했다. 요점은 “차만 뽑아내서 다음 단계로 넘긴다”다. 배경(도로, 건물, 사람)이 섞이면 뒤 단계가 헷갈리기 때문이다. 2) 그다음 “차의 어느 부분을 볼지”를 결정한다 여기가 이 연구의 재미있는 지점이다. 사람은 차를 알아볼 때 본능적으로 특정 부위를 본다. 헤드라이트 모양, 그릴, 범퍼 라인 같은 ‘얼굴’ 말이다. 반대로 색을 보려면 바퀴나 유리보다는 도어·지붕·후드처럼 ‘도장면’을 본다. 연구팀은 이를 AI에 강제로 가르쳤다. 딥러닝 분할(세그멘테이션) 모델(DeepLabv3)을 써서 차를 부위별로 나눈 다음, 목적에 맞는 부위만 남기고 나머지는 버렸다. 색 인식(VCR) : 바퀴, 유리, 번호판 같은 “색을 헷갈리게 만드는 부위”를 빼고 도장면 중심으로 본다. 차종 인식(VMMR) : 가장 특징이 강한 전면부를 집중적...

세금 탈루, AI로 잡는다?

- 12월 28, 2025

‘이상한 동맹’을 찾아낸 인공지능 탐정 이야기 누군가 거대한 세금 사기를 꾸미고 있다면? 그리고 그 범죄가 아주 치밀하게 조직된 동맹 에 의해 진행된다면? 그런데 이걸 사람이 아닌, 인공지능 이 찾아낸다면? 믿기 어려울지도 모르지만, 실제로 그런 기술이 등장했다. 중국 시안공대 연구진은 거대한 세금 데이터 속에서 탈세 범죄 그룹 을 찾아내는 인공지능 알고리즘을 개발했다. 그 이름은 바로 DyCIAComDet 와 BMPS . 얼핏 보면 어려운 이름이지만, 이 기술이 하는 일은 간단히 말해 “세금 범죄자를 네트워크로 추적하는 AI 형사”다. 문제는 ‘혼자’가 아니라 ‘여럿’이라는 것 세금 탈루, 가짜 세금계산서 발행, 수입 은폐, 공모 등은 대부분 개인이 아닌 집단 에 의해 일어난다. 예를 들어, 세무 공무원과 기업인이 짜고 서류를 조작하거나, 전문 ‘대리인’이 수십 개 기업의 세무 처리를 도맡으며 불법을 저지르는 경우가 있다. 이런 행동은 겉보기에는 드러나지 않지만, 데이터 상에서는 독특한 연결 구조 를 만들게 된다. 연구팀은 바로 이 ‘연결 구조’를 분석했다. 이들은 납세자와 세무 공무원의 관계를 이중 네트워크 —즉, 서로 다른 두 그룹(예: 납세자와 세무사)을 노드로 연결한 그래프—로 모델링했다. 그리고 그 네트워크가 시간에 따라 어떻게 변화하는지를 추적해, 수상한 관계의 흐름 을 잡아낸 것이다. AI 탐정의 첫 번째 무기: DyCIAComDet ‘DyCIAComDet’라는 이름은 다소 복잡하지만, 간단히 말하면 이건 시간에 따라 변하는 관계망 속에서 ‘수상한 그룹’을 찾아내는 알고리즘 이다. 이 AI는 다음과 같은 방식으로 움직인다: 현재 시점의 네트워크를 분석해 그룹(커뮤니티)을 나눈다. 예: 특정 세무 공무원과 자주 거래하는 납세자 그룹 ‘리더 역할’을 하는 핵심 인물을 파악한다. 연결이 가장 많은 사람, 즉 중심 인물! 시간이 지나면서...

생성형 AI 프롬프트의 양날의 검: 기술, 윤리, 창의성의 교차점

- 12월 27, 2025

프롬프트(Prompt)는 더 이상 주변적인 기술 요소가 아니라, 인공지능(AI)의 사고 과정과 사용자 경험을 결정짓는 핵심 요소로 자리잡았다. 본 기획 주제는 AI 윤리, 계산 창의성, 인지 과학, 인간-AI 상호작용 분야의 편집자들이 협업하여 준비한 결과물이다. 최근 프롬프트에 대한 연구는 인과 모델링, 인식론, 창의성, 안전성 등 다양한 영역으로 확장되고 있다. 이는 범용 아키텍처를 기반으로 한 대규모 기반 모델(foundation model)의 부상과 밀접하게 연관된다. 이러한 모델은 다양한 하위 작업에 적응 가능한 능력과 위험을 동시에 내포하고 있다. 예를 들어, Vallverdú(2025)의 연구는 프롬프트가 인과적 서사를 구성하는 인지적 틀로 작동한다는 점을 보여주며, LLM(대형 언어 모델)이 비체화된 상태에서 의미를 구성하는 방식에 대한 문제도 제기되었다. 이는 사용자 의도와 lived experience(경험 기반 지식)가 결여된 시스템 간의 불일치 가능성을 드러낸다. 한편, 프롬프트를 통해 윤리적 제약 조건을 명시하거나, 혹은 그것이 잘못 지정되거나 악의적으로 조작될 경우 보안 장치를 우회할 가능성도 존재한다. 따라서 프롬프트는 단순한 기술적 명령이 아니라 윤리적 행위로 간주되어야 한다. 프롬프트의 기술적 최적화와 새로운 프로그래밍 패러다임 최근 자연어 처리 분야에서는 프롬프트를 고수준의 제어 언어로 간주하며, 이는 운영 체제나 API에 비견되는 인터페이스 기술로 간주된다. Sécheresse 외(2025)의 GAAPO 연구는 프롬프트 최적화를 위한 유전 알고리즘을 통해, 성능 향상에 유의미한 결과를 도출하였다. 하지만 이처럼 프롬프트가 기계에 의해 자동 생성될 경우, 인간의 해석 가능성과 실행 효과 간의 간극이 벌어질 우려가 있다. 이는 프롬프트의 기술적 이중성을 보여준다. 접근성 높은 인터페이스이면서도 정교한 제어 수단이라는 모순된 성격이다. 프롬프트와 윤리적 책임 Farnós 외(2025)는 "윤리적 프롬프트" 개념을 ...