머신러닝은 왜 유기금속 반응을 일반 화학 반응처럼 처리하지 못할까
연구진은 금속-탄소 결합을 찾는 AI 필터를 만들기 위해 분자 구조 표현 방식 자체를 다시 비교했다 유기금속 화학은 배터리, 신약, 플라스틱, 반도체, 촉매 산업까지 매우 넓게 사용된다. 하지만 실제 연구 현장에서는 새로운 촉매나 반응을 찾기 위해 수많은 실험을 반복해야 한다. 시간이 오래 걸리고 실패 비용도 크다. 최근에는 이런 문제를 해결하기 위해 인공지능과 머신러닝을 활용하는 연구가 빠르게 늘고 있다. 문제는 기존 AI 모델이 유기금속 반응을 잘 구별하지 못한다는 점이다. 일반 유기화학 데이터로 학습한 모델은 금속-탄소 결합의 특수성을 제대로 이해하지 못했다. 연구진은 바로 이 지점을 해결하려 했다. 핵심 목표는 “어떤 반응이 진짜 유기금속 반응인지 자동으로 걸러내는 AI 필터”를 만드는 것이었다. 이번 연구에서는 Random Forest, KNN, SVC, MLP 같은 여러 머신러닝 알고리즘을 비교했고, Morgan fingerprint와 MACCS keys라는 두 가지 분자 표현 방식도 함께 시험했다. 그 결과 MACCS keys 기반 MLP 모델 이 가장 안정적이고 정확한 성능을 보였다. F1 score와 Recall은 각각 0.85였고, AUC-ROC는 0.837에 도달했다. 유기금속 반응은 왜 일반 화학 AI로 잘 구분되지 않는 것인가 유기금속 화학의 핵심은 금속과 탄소가 직접 결합하는 구조다. 일반적인 배위화합물은 금속이 산소나 질소 같은 원자와 연결되지만, 유기금속 화합물은 금속-탄소 결합 자체가 존재한다. 연구진은 이 차이가 머신러닝 모델에서 매우 중요하다고 설명했다. 기존 화학 AI는 대부분 유기화학 데이터에 맞춰 설계됐다. 그러나 유기금속 화합물은 전자 구조와 결합 방식이 매우 다르다. 예를 들어 철, 니켈, 팔라듐 같은 전이금속은 전자의 이동 방식이 복잡하고 반응 메커니즘도 일반 유기반응과 다르다. 그래서 기존 모델이 새로운 유기금속 반응을 만나면 잘못 분류하는 경우가 많았다. 연구...