CORNETO: 오믹스 시대의 생물학 네트워크 추론을 재정의하다
분자 네트워크와 오믹스 데이터를 시각화한 추상 일러스트 – 생물학적 상호작용과 데이터 흐름을 상징적으로 표현한 이미지 |
생물학적 네트워크는 왜 중요한가?
인간의 세포는 수많은 유전자, 단백질, 대사물질이 얽혀있는 복잡한 시스템이다. 이들은 서로 신호를 주고받고, 조절하고, 연쇄 반응을 일으키며 생명 현상을 유지한다. 이런 분자 간 상호작용을 수학적 구조인 "네트워크(graph)"로 모델링하면, 각 분자는 노드(node)로, 상호작용은 엣지(edge)로 표현할 수 있다. 이렇게 구성된 생물학적 네트워크는 신호전달, 대사 경로, 단백질 상호작용 등을 시각화하고 분석하는 데 핵심 도구다.
하지만 문제는 이러한 네트워크가 상황에 따라 달라진다는 점이다. 같은 유전자라 해도 암세포에서의 역할과 정상세포에서의 역할이 다를 수 있다. 그래서 연구자들은 상황에 따라 달라지는 "문맥 특이적(context-specific) 네트워크"를 구성하고자 한다. 이때 가장 중요한 도전 과제는 바로 "어떻게 네트워크를 추론할 것인가"이다.
데이터 기반 접근 vs. 지식 기반 접근: 각각의 한계
네트워크 추론에는 두 가지 주요 접근 방식이 있다. 하나는 머신러닝 기반의 통계적 접근이다. 대규모 오믹스 데이터를 입력으로 하여 패턴을 학습하고, 상호작용을 예측하는 방식이다. 예측 성능은 뛰어나지만, 결과 해석이 어렵고, 데이터 양이 많아야 한다는 단점이 있다.
다른 하나는 생물학적으로 알려진 상호작용 정보를 담은 PKN(Prior Knowledge Network)을 활용하는 방식이다. 이는 해석이 쉽고, 데이터가 적더라도 작동하지만, 특정 샘플이나 조건에만 맞춰져 있어 일반화가 어렵고, 다양한 샘플을 동시에 분석하는 데 한계가 있다.
CORNETO의 등장: 두 세계를 통합한 수학적 프레임워크
이러한 이분법을 깬 것이 바로 2025년 Nature Machine Intelligence에 소개된 "CORNETO"다. CORNETO는 'Constrained Optimization for the Recovery of Networks from Omics'의 줄임말로, 생물학적 네트워크 추론 문제를 "혼합정수 최적화(Mixed-Integer Optimization)" 문제로 정식화한 통합 수학 프레임워크다.
간단히 말하면, 다양한 네트워크 추론 방법론들을 하나의 수학 모델 안에서 구현할 수 있도록 해주는 도구이며, 여러 샘플에 걸쳐 공통적이면서도 샘플 특이적인 네트워크 구조를 동시에 추론할 수 있도록 설계되었다.
핵심 아이디어: 네트워크 흐름과 구조적 희소성
CORNETO는 네트워크 흐름(network flow) 개념을 바탕으로 한다. 각 엣지를 흐름이 지나가는 통로로 보고, 물리적 제약(예: 대사 반응의 방향성, 용량 등)을 수학적으로 반영한다. 여기에 구조적 희소성(structured sparsity) 개념을 도입하여, 가능한 적은 수의 엣지로 의미 있는 네트워크를 구성하도록 유도한다. 이 과정에서 각 샘플 간의 공통성과 차이를 동시에 고려할 수 있다.
예를 들어, CORNETO는 대사 네트워크를 추론할 때 각 샘플별 대사 흐름을 따로 모델링하되, 공통적으로 사용되는 경로를 강조하면서 불필요한 차이를 줄인다. 이는 생물학적으로 타당한 경로를 더 명확히 부각시키는 효과가 있다.
다양한 생물학 문제에의 응용
CORNETO의 유연성은 여러 생물학적 문제에 적용 가능하다는 점에서 두드러진다. 논문에서는 다음과 같은 사례들이 소개되었다:
- 다중 샘플 FBA(Flux Balance Analysis): 전통적으로는 하나의 조건에 대한 대사 흐름만 분석 가능했지만, CORNETO는 여러 조건(예: 유전자 결실 변이)에 대한 공통 대사 경로를 동시에 추론할 수 있다.
- 오믹스 기반 대사 네트워크 재구성: iMAT 등의 기존 기법을 확장해, 전사체 데이터를 바탕으로 문맥 특이적인 대사 네트워크를 구성하는 데도 사용된다.
- 환자별 신호전달 네트워크 추론: 환자 전사체 데이터를 기반으로, 공통 신호 경로와 개별적 경로를 함께 추론하여 암 등의 질환에서 의미 있는 생물학적 기전을 도출한다.
개인적 통찰: CORNETO가 주는 세 가지 교훈
- 해석력과 예측력을 동시에 확보하려는 노력: CORNETO는 기계학습처럼 강력한 예측력을 가지면서도, 기존 생물학 지식에 기반한 해석력을 놓치지 않으려 한다. 이는 AI 분야에서도 점점 강조되는 "설명 가능한 AI(Explainable AI)"와 맞닿아 있다.
- 다중 샘플 분석의 중요성: 생물학 실험은 샘플 수가 많지 않은 경우가 흔하다. CORNETO는 각 샘플을 따로 분석하지 않고, 함께 분석하여 데이터의 정보량을 최대한 끌어내는 방식을 보여준다. 이는 임상 데이터 분석 등에서도 매우 중요한 전략이다.
- 수학적 정식화의 힘: 이 프레임워크의 진짜 강점은 다양한 생물학 문제를 동일한 최적화 문제로 통일했다는 데 있다. 이는 앞으로 다른 종류의 생물학적 네트워크 분석 방법도 같은 틀 안에 통합할 수 있는 가능성을 연다.
아쉬운 점과 미래 방향
물론 CORNETO에도 한계는 있다. 가장 큰 문제는 계산 복잡도다. 많은 생물학 네트워크 문제는 NP-hard 문제로, 샘플 수나 네트워크 크기가 커질수록 계산 비용이 폭증한다. 이를 해결하기 위해 저자들은 휴리스틱 해법이나 병렬화, ADMM 등의 접근을 제안하고 있으며, 이는 향후 연구 주제가 될 것이다.
또한 CORNETO는 현재는 정적(steady-state) 네트워크만 다루지만, 동적 네트워크(시간 흐름에 따른 변화)를 다루는 방향으로 확장될 가능성도 크다. 이는 특히 시간대별 오믹스 데이터를 다룰 때 중요한 문제다.
마지막으로, CORNETO의 구조는 머신러닝 모델 설계에도 영감을 줄 수 있다. 실제로 이 논문에서는 생물학 지식 기반 신경망 구조를 자동 생성하는 데 CORNETO를 활용하기도 했다. 이는 설명 가능성과 구조적 제약을 동시에 만족시키는 생물학적 인공지능 모델 개발에 중요한 방향성을 제시한다.
결론: CORNETO는 '도구' 그 이상이다
CORNETO는 단순히 또 하나의 네트워크 추론 알고리즘이 아니다. 그것은 다양한 생물학적 질문을 통일된 수학적 틀 안에서 다룰 수 있도록 만든 "패러다임"이다. 연구자들은 이제 특정 방법에 얽매이지 않고, 자신의 문제에 맞는 수학적 제약을 정의함으로써, 정확하고 해석 가능한 네트워크를 구성할 수 있다. CORNETO는 그 가능성을 현실로 만든 첫걸음이다.
출처논문: Rodriguez-Mier, P., Garrido-Rodriguez, M., Gabor, A., & Saez-Rodriguez, J. (2025). Unifying multi-sample network inference from prior knowledge and omics data with CORNETO. Nature Machine Intelligence, 7, 1168–1186. https://doi.org/10.1038/s42256-025-01069-9