약초 정보, 이젠 AI가 읽어준다




– 한 문장 한 문장 속에 숨어 있던 약초의 효능, AI가 뽑아내는 시대

코로나19 팬데믹 당시, 약국도 병원도 문을 닫고, 의사와 약을 찾기 어려웠던 때를 떠올려보자. 이 시기 많은 이들이 향한 곳은 집 근처 텃밭, 혹은 부엌이었다. 생강차, 레몬그라스, 바질, 심지어 전통 민간요법까지—이른바 ‘대체의학’이 다시금 주목을 받았다.

그런데 여기서 의문 하나.
우리가 먹는 생강의 ‘뿌리’는 감기 예방에 효과가 있고, 레몬그라스의 ‘잎’은 소화를 돕는다고 한다. 그런데 이 ‘효능’이라는 것이 어디에, 어떻게 쓰여 있을까? 수백, 수천 개의 약초 관련 문서를 사람이 하나하나 읽고, 정리할 수 있을까?

태국-스웨덴 공동 연구팀은 바로 이 질문에서 출발했다. 그리고 놀라운 연구 결과를 내놓았다. AI를 활용해 ‘식물의 어떤 부위가 어떤 효능을 갖는지’를 문장 속에서 자동으로 추출해, 마치 지도로 그려내듯 정리하는 기술을 개발한 것이다.



약초 문장을 AI가 읽고, 뜻을 알아챈다

연구의 핵심은 ‘pp-mpG 관계’라는 이름의 새로운 방식이다. 간단히 말하면 식물의 부위(leaf, root, flower 등)와 그것이 가진 약리효과 그룹(항염, 해열, 진통 등)을 연결하는 ‘개념적 짝짓기’다.

기존에는 보통 "레몬그라스는 소화에 좋다"는 식의 단순 문장을 대상으로, ‘레몬그라스 → 소화 촉진’이라는 관계만 추출했다. 하지만 이런 방식은 지나치게 단편적이다. 실제로 많은 약초는 여러 효능을 동시에 갖고 있으며, 부위마다 효능이 다르기도 하다.

연구팀은 약초에 대한 태국어 문서 259개에서 총 20,000개 이상의 문장을 수집했다. 각 문장을 분석한 뒤, AI가 “이 문장에서 말하는 효능은 어떤 것이며, 그 효능은 어떤 식물 부위와 연결되는가?”를 자동으로 추출하도록 설계했다.

놀라운 점은 이 분석에 문장을 구성하는 ‘동사’의 역할이 결정적이라는 사실이다. 예를 들어 “잎을 달여 마시면 소화를 돕는다”는 문장에서 ‘돕는다’라는 동사는 특정 효능(소화 촉진)을 나타내는 단서로 작용한다. 이처럼 동사와 명사의 짝을 찾아내는 ‘단어 동시 출현(word co-occurrence)’ 패턴이 연구의 핵심이었다.




그냥 단어 짝짓기가 아니다. 구조방정식을 쓴다?

물론 단순히 "단어 A와 단어 B가 같이 나왔네!" 식으로 접근했다면 이 기술은 의미가 없었을 것이다. 약초 효능의 세계는 그리 단순하지 않다.

예를 들어 ‘진통’과 ‘해열’은 자주 함께 나타나는 효능이다. 이 둘은 서로 연관되어 있기 때문에, 각각을 따로 보는 것보다 ‘연관된 효능 그룹’으로 묶어서 이해하는 것이 더 정확하다.

그래서 연구팀은 놀랍게도, 심리학이나 사회과학에서 쓰이던 ‘구조방정식 모형(SEM)’을 도입했다. 이는 고차원 데이터를 분석해, 여러 변수 간의 숨은 관계를 찾아내는 통계 기법이다. 이를 통해 “잎은 항염+진통+항바이러스 효과가 함께 나타난다”는 식의 ‘효능 묶음’을 하나의 개념 그룹(mpG)으로 정리하는 데 성공했다.

그리고 이렇게 정리된 결과는 시각화해서, 누구나 이해할 수 있는 약초 효능 지도로 만들 수 있다. 연구팀은 이를 통해 약초 관련 지식을 SNS나 블로그 등에 쉽게 공유할 수 있는 형태로 바꾸는 것을 목표로 삼았다.



AI가 바꿀 ‘대체의학’ 정보의 미래

이 연구는 단순히 AI 기술을 썼다는 점에서 흥미로운 것이 아니다. 중요한 건 전통 지식, 특히 민간요법이라는 ‘암묵적 지식’을 체계적으로 정리하고 공유 가능하게 만들었다는 점이다.

그간 민간요법은 전해 들은 말, 가족의 기억, 혹은 블로그의 몇 줄 문장으로만 존재해왔다. 믿을 수 없는 정보도 많았고, 정제되지 않은 표현들로 가득했다. 하지만 이제는 다르다.

AI가 각 문장의 의미를 읽고, 그 안의 의미망을 구성하며, 단어 간의 유의미한 관계를 찾아내는 시대. 이 기술이 더 발전하면 단순한 문서 분석을 넘어, 치료 보조, 한의학 디지털화, 그리고 식물 기반 신약 개발까지 이어질 수 있다.

무엇보다도, 병원에 가기 어려운 이들이 믿고 활용할 수 있는 대체정보의 질이 높아진다는 점에서 이 기술은 큰 의미를 가진다.




출처 논문
Pechsiri, C., Piriyakul, I., & Pechsiri, J. S. (2025). Grouped semantic-feature relation extraction from texts to represent medicinal-plant property knowledge on social media. Frontiers in Artificial Intelligence, 8, 1579357.