복잡한 분자도 한눈에! 인공지능 신약 개발의 새로운 지도, 'HiFrAMes' 탄생
컴퓨터가 문장을 읽을 때 단어와 글자로 쪼개어 이해하듯, 이제 복잡한 약물 분자도 아주 쉽고 체계적으로 쪼개서 분석할 수 있는 길이 열렸다.
최근 텍사스 A&M 대학교 연구팀이 발표한 새로운 분자 구조 분석 프레임워크인 'HiFrAMes(하이프레임즈)'가 그 주인공이다.
이 기술은 마치 레고 블록을 분해하듯 복잡한 화학 구조를 의미 있는 조각으로 나누어, 인공지능(AI)이 신약을 더 빠르고 정확하게 설계할 수 있도록 돕는다.
인공지능이 화학의 '언어'를 더 깊이 이해해야 하는 이유
최근 구글 딥마인드의 알파폴드3(AlphaFold3) 같은 혁신적인 AI 모델이 등장하면서 단백질 구조를 예측하고 신약을 개발하는 속도가 엄청나게 빨라지고 있다.
하지만 아무리 똑똑한 AI라도 분자 구조를 제대로 이해하지 못하면 무용지물이다. 기존에는 분자를 단순한 문자열(SMILES)이나 지문 형태의 데이터로 변환해 AI에게 가르쳤다.
하지만 이런 방식은 분자가 가진 복잡한 입체적 연결 구조와 계층적인 특징을 충분히 보여주지 못한다는 한계가 있었다. 문장을 단어 단위로 쪼개지 않고 그냥 글자들의 나열로만 본다면 그 깊은 의미를 알기 어려운 것과 마찬가지다.
레고 블록처럼 분자를 분해하는 4단계 마법의 파이프라인
연구팀은 분자 그래프를 계층적으로 쪼개고 추상화하는 4단계의 체계적인 과정을 개발했다. 이 과정은 크게 '나뭇잎 사슬(Leaf Chain)' 추출, '고리 그물(Ring Mesh)' 축소, '고리 열거(Ring Enumeration)', 그리고 '연결기(Linker)' 탐지로 나뉜다.
먼저, 분자의 핵심 줄기에서 삐져나온 잔가지들을 먼저 쳐낸다. 이를 '나뭇잎 사슬'이라 부르는데, 주로 약물의 성질을 미세하게 조정하는 역할을 한다. 그다음 남은 핵심 고리 구조들을 단순화하고, 그 안에 숨겨진 모든 고리들을 하나하나 찾아낸다.
마지막으로 이 고리들을 이어주는 '다리' 역할의 연결기를 찾아내면 분해 작업이 완료된다. 이 모든 과정은 수학적인 그래프 이론을 바탕으로 하여 매우 정교하고 빠르다.
아래 표는 이번 연구에서 사용된 주요 분석 지표와 그 결과를 요약한 것이다.
| 분석 항목 | 설명 | 주요 결과 및 특징 |
|---|---|---|
| 고유 조각 수 | 분석을 통해 얻은 서로 다른 분자 조각의 개수 | 약 25만 개의 화합물에서 29,219개의 고유 조각 추출 |
| 조각별 비율 | 추출된 조각 중 각 카테고리가 차지하는 비중 | 나뭇잎 사슬(19,803개) > 고리(7,153개) > 연결기(2,468개) |
| 분자량(MW) | 추출된 조각들의 무게 단위 | 99% 이상이 300 Da 이하로, 약물 설계에 최적화된 크기 |
| 중원자 수(HAC) | 수소를 제외한 주요 원자의 개수 | 대부분 20개 이하로 구성되어 재사용성이 높음 |
비타민 B-12부터 대마 성분까지, 복잡한 구조도 척척
HiFrAMes의 성능은 놀라웠다. 구조가 매우 복잡하기로 유명한 비타민 B-12(코발라민)를 분석했을 때, 이 시스템은 중심의 거대한 고리 구조와 여기에 붙은 수많은 곁가지들을 완벽하게 분리해 냈다.
또한, 합성 카나비노이드(JWH-018)를 분석한 결과, 실제 생물학적으로 중요한 역할을 하는 '머리-연결기-몸통-꼬리' 구조를 정확하게 짚어냈다. 이는 마치 숙련된 화학자가 눈으로 분석하는 것과 같은 수준의 해석력을 AI가 갖게 되었음을 의미한다.
특히 기존의 분석 방식인 RECAP이나 BRICS와 비교했을 때, HiFrAMes는 훨씬 더 세밀하고 유연하게 분자를 쪼개면서도 그 연결 관계(계층 구조)를 잃어버리지 않는다는 강력한 장점을 보여주었다.
AI 신약 개발의 '내비게이션'이 될 HiFrAMes
이 연구의 결론은 명확하다. HiFrAMes는 단순히 분자를 자르는 도구를 넘어, 분자의 '지도'를 그리는 기술이다. 이렇게 쪼개진 양질의 분자 조각들은 거대한 '조각 도서관(Fragment Library)'이 되어, 나중에 새로운 약을 만들 때 필요한 부품을 꺼내 쓰듯 활용될 수 있다.
연구팀은 이 프레임워크가 앞으로 AI 기반의 가상 스크리닝(약물 후보 탐색)이나 분자 설계 모델의 성능을 비약적으로 높일 것으로 기대하고 있다. 복잡한 화학의 세계를 AI가 더 쉽고 깊게 이해하게 됨으로써, 우리가 난치병을 치료할 신약을 만나는 시간도 그만큼 단축될 것이다.
Yu, Y., Smith, M. A., Wang, H., & Liu, J.-C. (2026). HiFrAMes: A Framework for Hierarchical Fragmentation and Abstraction of Molecular Graphs. AI, 7(2), 71. https://doi.org/10.3390/ai7020071