생성형 AI와 멀티에이전트 RAG 기술을 결합하여 수작업 없이 기업 맞춤형 SCORM 표준 교육 과정을 자동으로 제작하는 혁신적 방법
새로운 직원이 입사했을 때 회사의 고유한 규정이나 업무 절차를 가르치는 사내 교육 과정은 기업 운영에서 매우 중요한 단계이다. 하지만 기존의 인공지능 기반 교육 콘텐츠 생성 시스템은 주로 누구나 접근할 수 있는 일반적인 학술 지식이나 공개된 정보만을 학습 대상으로 삼았다. 이 때문에 기업 내부의 보안 규정이나 고유한 업무 지침서 같은 전용 문서를 바탕으로 교육 자료를 자동 생성하는 일은 오랫동안 풀지 못한 숙제였다. 보안이 중요한 기업 환경에서 검증되지 않은 인공지능을 사용해 교육 자료를 만들면 기술이 거짓 정보를 진짜처럼 말하는 환각 현상이 발생해 심각한 규정 위반으로 이어질 위험이 크기 때문이다.
최근 학술지 Frontiers in Artificial Intelligence에 발표된 연구는 기업 내부 문서만 철저하게 학습하고 분석하여 수작업 없이 완벽한 디지털 교육 콘텐츠를 만들어내는 멀티에이전트 검색 증강 생성 시스템을 제안했다. 연구진은 대형 언어 모델과 정보 검색 기술을 정교하게 결합한 4단계 자동화 파이프라인을 구축했다. 이 기술은 수많은 내부 규정 문서에서 정확한 사실만을 추출하여 전 세계 교육 공학 표준인 SCORM 1.2 규격을 만족하는 이러닝 강좌 패키지를 자동으로 생산한다.
실제 빵을 제조하는 공장의 안전 지침서와 소방 절차서 등 3개의 복잡한 기업 문서를 시스템에 입력한 결과, 단 16분 만에 인간의 개입 없이 4개 모듈과 16개 단원으로 구성된 정교한 교육 과정과 평가 시험이 완벽하게 만들어졌다. 이 시스템은 정보의 출처를 명확하게 추적할 수 있도록 설계되어 인공지능의 단점인 거짓말 문제를 근본적으로 해결했다. 디지털 대전환을 추진하는 기업들이 왜 이 기술에 주목해야 하는지, 그리고 이 시스템이 내부 보안 문서를 어떻게 정교한 교육 자료로 바꾸는지 그 구체적인 메커니즘을 살펴본다.
인공지능은 왜 일반 문서에서 지식을 추출할 때 구조를 먼저 파악해야 할까
기업이 보유한 매뉴얼이나 규정집은 일반적인 줄글로만 되어 있지 않다. 수많은 목차와 제목, 하위 항목들이 촘촘하게 얽혀 있는 복잡한 계층 구조를 가진다. 인공지능이 이러한 문서를 정확하게 이해하고 교육 콘텐츠로 바꾸기 위해서는 첫 번째 단계인 문서 흡수와 인덱싱 과정이 필수적이다.
연구진은 문서를 단순히 일정한 글자 수로 뚝뚝 끊어서 저장하는 방식을 사용하지 않았다. 문서의 시각적 형태와 구조를 분석하는 기술인 Docling의 HybridChunker를 활용했다. 이 기술은 문서 안에 존재하는 제목과 본문의 위계 관계를 그대로 보존하면서 텍스트를 적절한 크기로 쪼갠다. 이렇게 쪼개진 개별 텍스트 조각에는 해당 본문이 속해 있던 상위 제목 정보가 꼬리표처럼 항상 따라붙는다.
이렇게 처리된 텍스트 조각들은 Qwen3-Embedding-8B 모델을 통해 컴퓨터가 이해할 수 있는 수학적 벡터 값으로 변환되어 ChromaDB라는 특수한 벡터 데이터베이스에 저장된다. 문서의 계층 구조를 유지한 채 변환이 이루어지기 때문에, 인공지능은 특정 문장이 단순히 흘러가는 말인지 아니면 전체 규정을 지배하는 핵심 수칙인지 정확하게 구별할 수 있다. 구조를 인식하는 데이터 변환 방식은 정보 검색의 정확도를 눈에 띄게 향상시킨다.
동시에 시스템은 문서 전체의 흐름을 놓치지 않기 위해 각 문서의 요약본과 목차를 별도로 생성한다. 분량이 10만 토큰을 넘지 않는 일반적인 문서는 단 한 번의 처리로 요약과 목차를 동시에 뽑아낸다. 만약 백과사전처럼 방대한 분량의 문서가 입력되면 문단을 나누어 병렬로 요약한 뒤 이를 최종적으로 다시 합치는 맵리듀스 전략을 사용하여 인공지능이 기억할 수 있는 용량의 한계를 극복한다.
자율적인 건축가 에이전트는 어떻게 스스로 완벽한 교육 과정을 설계하는가
데이터베이스에 회사의 모든 규정이 저장되면 두 번째 단계인 자율 교육 과정 설계가 시작된다. 이 역할을 맡은 것은 시스템 내부에서 사내 교육 전문가 역할을 하도록 훈련된 대형 언어 모델 기반의 건축가 에이전트이다. 이 에이전트는 LangGraph의 ReAct 패턴을 따라 작동한다. 이는 인공지능이 무작정 결과물을 내놓는 것이 아니라, 스스로 상황을 '생각'하고 필요한 '행동'을 취한 뒤 그 결과를 분석하는 과정을 반복하는 고도의 추론 방식이다.
건축가 에이전트에게는 데이터베이스를 탐색할 수 있는 네 가지 강력한 도구가 주어진다. 저장된 모든 문서의 이름과 식별자를 확인하는 도구, 특정 문서의 요약본을 읽는 도구, 문서의 전체 목차를 조회하는 도구, 그리고 필요한 내용을 핵심 단어로 정밀 검색하는 도구이다.
에이전트는 먼저 전체 문서 목록을 훑어본 뒤 각 문서의 요약본과 목차를 교차 검증한다. 예를 들어 안전 관리 문서를 읽다가 의문이 생기면 스스로 정밀 검색 도구를 실행해 세부 조항을 파악한다. 이러한 탐색을 마친 인공지능은 전체 강좌의 제목, 설명, 그리고 하위 모듈과 세부 단원, 단원별 학습 목표를 컴퓨터가 명확하게 인식할 수 있는 JSON 구조체로 직접 설계해 낸다.
이 과정에서 인간 관리자는 인공지능의 독주를 막고 통제권을 유지할 수 있다. 에이전트가 만든 설계도는 사용자 화면에 그대로 표시되며, 인간 관리자는 교육 과정의 제목을 직접 수정하거나 특정 단원의 재생성을 요구할 수 있다. 물론 에이전트의 설계 단계를 완전히 건너뛰고 사람이 직접 작성한 YAML 파일 설정대로 교육 구조를 고정하는 방식도 지원한다.
교차 문서 검색의 한계를 극복하고 환각 현상을 차단하는 다중 쿼리와 신경망 재정렬 메커니즘
설계도가 승인되면 세 번째 단계인 병렬 콘텐츠 및 평가 시스템 생성이 시작된다. 수십 개의 단원을 하나씩 차례대로 만들면 시간이 너무 오래 걸리기 때문에, 시스템은 모든 단원의 작성을 동시에 진행하는 병렬 처리 방식을 취한다. 그러나 여러 문서에 흩어진 전문 용어들이 서로 얽혀 있을 때 인공지능이 엉뚱한 문서에서 내용을 가져와 거짓 정보를 섞어 쓰는 문제가 발생할 수 있다. 연구진은 이러한 교차 문서 disambiguation 에러를 해결하기 위해 세 가지 방어 기제를 결합했다.
첫째는 다중 쿼리 생성이다. 인공지능은 하나의 단원 제목을 기반으로 성격이 조금씩 다른 검색어 3개에서 5개를 스스로 만들어낸다. 단 하나의 키워드로만 검색했을 때 발생할 수 있는 누락을 방지하기 위함이다. 변환된 다중 검색어들은 각각 벡터 데이터베이스에서 가장 유사한 텍스트 조각을 50개씩 찾아내고, 시스템은 이들을 모두 모아 중복을 제거한다.
둘째는 신경망 재정렬 단계이다. 중복이 제거된 수많은 후보 텍스트 조각들은 곧바로 본문 작성에 사용되지 않는다. 시스템은 문맥을 극도로 정밀하게 비교하는 Qwen3-Reranker-8B 모델에 이 텍스트들을 입력한다. 이 모델은 현재 작성해야 하는 단원의 주제와 가장 밀접한 관련이 있는 진짜 핵심 텍스트 20개만을 엄격하게 골라내어 순위를 다시 매긴다.
셋째는 출처 제한 생성 수칙이다. 최종 선별된 20개의 텍스트 조각은 인공지능에게 전달될 때 각각 [Source 1], *[Source 2]*와 같이 고유한 번호표가 붙는다. 인공지능은 오직 제공된 출처 안의 정보만을 사용하여 본문을 작성해야 하며, 임의로 외부 지식을 섞거나 추측하여 글을 쓰면 안 된다는 강력한 제약을 받는다. 실제로 카자흐스탄 노동법 문서를 활용해 검색 정확도를 정밀 측정한 실험에서, 전체 문서 풀을 대상으로 검색했을 때와 특정 문서로 범위를 제한했을 때의 정보 복원력 차이가 0.314의 수치로 나타났다. 다중 쿼리와 신경망 재정렬 기술은 이 검색 능력의 격차를 완벽하게 메워주며, 인공지능이 규정에 없는 거짓말을 지어내는 환각 현상을 완벽하게 차단한다.
가짜 시험 문제를 걸러내고 국제 표준 이러닝 규격을 만족시키는 자동 패킹 시스템
본문 작성이 끝나면 인공지능은 교육 효과를 측정하기 위해 단원별로 3~5개의 객관식 문제, 2~3개의 O/X 문제, 그리고 4~6쌍의 선 잇기 유형이 포함된 지식 확인 평가 시험을 자동 생성한다. 이때 인공지능이 실수로 정답이 없는 문제를 만들거나 오답을 정답으로 지정하는 오류를 막기 위해 프로그램 기반의 자동 검증 루프가 작동한다. 객관식 문제에 정확히 하나의 정답만 존재하는지, 선 잇기 문제에 중복된 항목이 없는지 코드가 실시간으로 검사하며, 오류가 발견되면 인공지능에게 즉시 재작성을 요구하는 꼼꼼한 확인 과정을 거친다.
검증이 끝난 교육 본문과 시험 문제들은 Jinja2 템플릿 엔진을 통해 깔끔한 웹 화면으로 렌더링된다. 시험 문제의 정답 데이터는 사람이 함부로 소스코드를 열어 볼 수 없도록 암호화된 JSON 형태로 서버 측에 저장되며, 브라우저 내부에서 자바스크립트를 통해 실시간으로 채점이 이루어진다.
마지막 단계는 전 세계 학습관리시스템에서 인식할 수 있는 SCORM 1.2 규격의 패키지를 만드는 것이다. 시스템은 교육 과정의 구조와 모듈 정보를 트리 구조로 기록한 imsmanifest.xml 파일을 자동으로 작성하고, 각 단원을 독립적인 학습 객체로 선언한다. 여기에 수강생의 학습 진도와 시험 점수를 시스템과 주고받을 수 있는 API 통신 기술 모듈을 결합하여, 하나의 압축 파일로 최종 패키징한다. 이렇게 만들어진 압축 파일은 무들, 아이스프링, SAP 석세스팩터스 등 표준을 준수하는 전 세계 모든 학습관리시스템에 별도의 추가 설정 없이 즉시 업로드하여 현업에 바로 적용할 수 있다.
전용 챗봇 인터페이스를 통해 누구나 모바일에서 16분 만에 교육 과정을 완성하는 시대
이 시스템의 또 다른 장점은 복잡한 프로그램 명령어를 입력하지 않아도 모바일 메신저를 통해 아주 쉽게 제어할 수 있다는 점이다. 연구진은 현업 담당자들이 컴퓨터 앞에 앉아 있지 않아도 사내 교육 자료를 생산할 수 있도록 텔레그램 봇 인터페이스를 별도로 구현했다.
사용자는 스마트폰을 켜고 전용 챗봇 방에 접속한 뒤, 회사의 규정집 파일들을 대화창에 전송하기만 하면 된다. 파일 업로드가 끝나고 완료 버튼을 누르면 내부의 유한 상태 기계가 작동하면서 가동, 분석, 생성, 압축의 각 단계를 순차적으로 처리한다. 동시에 데이터베이스 백엔드에서는 여러 사용자의 요청이 꼬이지 않도록 작업 큐를 통해 효율적으로 분산 처리하며 진행 상황을 실시간으로 사용자에게 메시지로 알려준다.
실제 빵 제조 공장의 안전 문서를 올렸을 때, 인공지능은 어떠한 사전 학습이나 인간의 개입 없이도 단 1분 45초 만에 문서 분석을 끝내고 전체 16분 만에 완벽한 사내 안전 교육 패키지를 텔레그램 채팅창으로 배달했다. 생성된 교육 과정은 공장 장비 조작법, 화재 대피 요령, 위생 수칙 등 실제 원본 문서의 핵심 내용을 티끌 하나 틀리지 않고 정확하게 반영하고 있었다.
수많은 매뉴얼과 법률 규정이 수시로 바뀌는 현대 비즈니스 환경에서 매번 교육 자료를 사람이 손으로 고치고 검증하는 방식은 비용과 시간 측면에서 한계에 부딪힐 수밖에 없다. 정보의 신뢰성을 극한으로 끌어올린 멀티에이전트 검색 증강 생성 기술은 내부 보안을 철저히 지키면서도 기업의 지식 자산을 가장 빠르고 정확하게 임직원에게 전달하는 새로운 이정표를 제시하고 있다.
출처
Amirkhanova, G., Amirkhanov, B., Amirkhanov, A., & Aubakirova, R. (2026). A multi-agent RAG system for generating SCORM courses from enterprise documents. Frontiers in Artificial Intelligence, 9, Article 1834985. https://doi.org/10.3389/frai.2026.1834985