ChatPaper.aiChatPaper

가상 세포에서 자율적 메커니즘 추론으로의 진전

Towards Autonomous Mechanistic Reasoning in Virtual Cells

April 14, 2026
저자: Yunhui Jang, Lu Zhu, Jake Fawkes, Alisandra Kaye Denton, Dominique Beaini, Emmanuel Noutahi
cs.AI

초록

대규모 언어 모델(LLM)은 과학적 발견을 가속화할 유망한 접근법으로 최근 큰 주목을 받고 있습니다. 그러나 생물학과 같은 개방형 과학 분야에서의 적용은 사실에 기반한 실행 가능한 설명이 부족하다는 이유로 여전히 제한적입니다. 이를 해결하기 위해 우리는 생물학적 추론을 기계론적 행동 그래프로 표현하여 체계적인 검증과 반증을 가능하게 하는 가상 세포에 대한 구조화된 설명 형식을 소개합니다. 이를 기반으로 우리는 VCR-Agent를 제안합니다. 이는 생물학적으로 근거 있는 지식 검색과 검증 기반 필터링 접근법을 통합하여 기계론적 추론을 자율적으로 생성하고 검증하는 다중 에이전트 프레임워크입니다. 이 프레임워크를 이용해 우리는 Tahoe-100M 아틀라스에서 도출된 검증된 기계론적 설명으로 구성된 VC-TRACES 데이터 세트를 공개합니다. 실증적으로, 이러한 설명을 활용한 학습이 사실적 정밀도를 향상시키고 하류 유전자 발현 예측을 위한 더 효과적인 감독 신호를 제공함을 입증합니다. 이러한 결과는 다중 에이전트와 엄격한 검증의 시너지를 통해 달성된 가상 세포를 위한 신뢰할 수 있는 기계론적 추론의 중요성을 강조합니다.
English
Large language models (LLMs) have recently gained significant attention as a promising approach to accelerate scientific discovery. However, their application in open-ended scientific domains such as biology remains limited, primarily due to the lack of factually grounded and actionable explanations. To address this, we introduce a structured explanation formalism for virtual cells that represents biological reasoning as mechanistic action graphs, enabling systematic verification and falsification. Building upon this, we propose VCR-Agent, a multi-agent framework that integrates biologically grounded knowledge retrieval with a verifier-based filtering approach to generate and validate mechanistic reasoning autonomously. Using this framework, we release VC-TRACES dataset, which consists of verified mechanistic explanations derived from the Tahoe-100M atlas. Empirically, we demonstrate that training with these explanations improves factual precision and provides a more effective supervision signal for downstream gene expression prediction. These results underscore the importance of reliable mechanistic reasoning for virtual cells, achieved through the synergy of multi-agent and rigorous verification.
PDF21April 18, 2026