로봇이 후회한다? 산업 5.0의 인간-로봇 협업 혁신 기술
산업 5.0 현장을 상징적으로 표현한 장면. 작업자가 다관절 로봇 팔과 악수하며 협력하는 모습 뒤로, 파란색 데이터 스트림과 컨베이어 벨트가 흐르며 인간-로봇 간 지능형 협업과 실시간 데이터 교환을 시각화했다. |
산업 현장에선 매일같이 수많은 작업이 이뤄진다. 나사 하나를 조이는 것부터 복잡한 전자 부품을 조립하는 일까지. 이런 작업을 담당하는 로봇들은 놀라울 만큼 정밀하지만, 한 번 잘못 학습한 방식은 계속 반복하는 경향이 있다. 그런데, 만약 로봇이 ‘후회’를 느끼고, 그 경험을 토대로 스스로 더 나은 선택을 하게 된다면? 이번에 발표된 연구는 바로 그 가능성을 현실로 만들고 있다.
이란 담간대학교 산업공학과의 하메드 파즐롤라타바르(Hamed Fazlollahtabar) 교수팀은 ‘회한 기반 학습(Regret-based Learning)’과 ‘검색 보강 생성(RAG, Retrieval-Augmented Generation)’, 그리고 ‘파인튜닝된 트랜스포머 신경망(Transformer Neural Networks)’을 결합한 새로운 인간-로봇 상호작용(HRI) 프레임워크를 제안했다. 연구의 핵심은 로봇이 실시간으로 필요한 정보를 찾아 활용하고, 인간의 피드백을 바탕으로 학습하며, 과거의 실수를 최소화하는 방향으로 스스로를 조정한다는 것이다.
기존 로봇의 한계, 그리고 새로운 접근
전통적인 산업 로봇은 미리 프로그래밍된 절차에 따라 움직인다. 정해진 매뉴얼 안에서는 정확하지만, 환경 변화나 예기치 못한 변수에는 약하다. 작업자가 중간에 개입해야 하는 경우도 많고, 그 과정에서 효율이 떨어진다.
이번 연구에서 제안된 시스템은 다르다. 우선 RAG 모듈이 과거 작업 기록, 매뉴얼, 외부 데이터베이스에서 필요한 정보를 즉시 검색한다. 그다음 트랜스포머 신경망이 이를 바탕으로 최적의 실행 계획을 세운다. 마지막으로 회한 기반 학습이 ‘이전보다 더 나은 선택’을 위해 매 순간 성과를 평가하고, 잘못된 부분을 보정한다.
연구팀은 이 과정을 “로봇이 스스로 ‘아, 저건 더 잘할 수 있었는데’라고 느끼고, 다음번에는 그 실수를 반복하지 않는 것”이라고 설명한다.
실제 생산 라인에서의 성능 검증
연구팀은 전자회로 기판 조립 공정을 가상으로 재현해 실험을 진행했다. 로봇은 세 가지 작업—부품 픽앤플레이스, 나사 조이기, 품질 검사—를 수행하며, 총 500개의 생산 사이클 동안 학습을 반복했다.
초기 성능은 그리 인상적이지 않았다. 예를 들어 나사 조이기 작업(T2)은 평균 12초가 걸렸고, 오류율이 18%에 달했다. 그러나 5번째 학습 사이클에 이르자 평균 시간이 8.5초로 단축되고, 오류율은 7%까지 떨어졌다. 작업자 개입 횟수도 5회에서 1회로 줄었다. 전체적으로 ‘회한 점수(성능 격차 지표)’는 122.0에서 47.2로 무려 61.3% 감소했다.
통계 분석에서도 이 변화는 유의미했다. 작업 시간, 오류율, 인간 개입 모두 p<0.001 수준에서 개선이 입증됐다. 연구팀은 “단순히 속도가 빨라진 것만이 아니라, 로봇이 스스로 더 정확하게 판단하는 능력을 갖추게 됐다”고 강조한다.
로봇과의 ‘친밀감’도 높아졌다
흥미롭게도 이번 연구는 인간-로봇 간 ‘친밀감(intimacy)’이라는 다소 낯선 지표를 도입했다. 신뢰도 설문, 작업 지시 후 반응 속도, 그리고 수정 지시 빈도를 종합해 점수를 매긴 것인데, 첫 주기에서 2.1점이던 신뢰 점수가 마지막에는 4.5점까지 상승했다. 반응 속도 역시 평균 1.2초에서 0.4초로 단축됐다. 마치 함께 일한 시간이 쌓이면서 로봇이 ‘동료’처럼 느껴지는 것이다.
산업 5.0 시대의 의미
이번 연구는 단순한 기술 업그레이드를 넘어 산업 5.0의 비전을 보여준다. 산업 5.0은 기계 중심의 자동화에서 벗어나, 인간과 기계가 상호 보완하며 일하는 ‘사람 중심’ 제조 패러다임을 뜻한다.
이 시스템은 단순 반복 작업에서 벗어나, 로봇이 상황을 이해하고, 사람의 의도를 파악하며, 스스로 최적화를 추구하도록 한다. 이를 통해 생산 효율은 물론, 품질, 안전성, 그리고 작업자 만족도까지 향상시킬 수 있다.
넘어야 할 과제들
물론 한계도 있다.
첫째, RAG 시스템의 확장성과 실시간성 문제다. 대량의 데이터를 빠르게 검색하는 과정에서 계산량이 커지면, 응답 속도가 느려질 수 있다.
둘째, 개인 맞춤형 파인튜닝의 부족이다. 현재는 일반적인 학습 데이터를 기반으로 하지만, 향후에는 각 작업자의 스타일과 선호에 맞춘 학습이 필요하다.
셋째, 멀티모달 학습과 윤리적 안전장치가 과제다. 음성, 제스처, 시각 데이터 등을 통합적으로 처리하는 기능과, 잘못된 의사결정을 예방하는 윤리적 프레임워크가 필수다.
연구팀의 다음 계획
연구팀은 향후 실제 산업 현장에서 이 기술을 시험할 계획이다. 초기 단계에서는 20개의 작업 스테이션에서 6개월간 파일럿 프로젝트를 운영하며, 안전 규격(ISO 13849-1)과 실시간 응답성을 검증한다. 또, 음성 외에도 제스처 인식, 촉각 센서를 결합한 멀티모달 인터랙션을 구현해 로봇의 이해 능력을 넓힐 예정이다.
결론
이번 연구는 로봇이 단순한 ‘기계 팔’에서 벗어나, 배우고, 기억하고, 개선하는 ‘스마트 동료’로 진화할 수 있음을 보여준다. 산업 5.0의 핵심은 바로 이 지점—인간과 로봇이 서로를 이해하며 협력하는 관계다.
그리고 그 시작은, 로봇이 실수를 인정하고 “다음엔 더 잘하겠다”는 의지를 가질 때 가능해진다.
출처
Fazlollahtabar, H. (2025). Human-robot interaction using retrieval-augmented generation and fine-tuning with transformer neural networks in industry 5.0. Scientific Reports, 15(29233). https://doi.org/10.1038/s41598-025-12742-9