ChatPaper.aiChatPaper

LLM4Cell: 단일 세포 생물학을 위한 대형 언어 모델 및 에이전트 모델에 대한 조사

LLM4Cell: A Survey of Large Language and Agentic Models for Single-Cell Biology

October 9, 2025
저자: Sajib Acharjee Dip, Adrika Zafor, Bikash Kumar Paul, Uddip Acharjee Shuvo, Muhit Islam Emon, Xuan Wang, Liqing Zhang
cs.AI

초록

대형 언어 모델(LLMs)과 새롭게 부상하는 에이전트 프레임워크는 자연어 추론, 생성적 주석, 그리고 다중 모드 데이터 통합을 가능하게 함으로써 단일 세포 생물학을 변화시키기 시작하고 있습니다. 그러나 데이터 모달리티, 아키텍처, 평가 표준에 걸쳐 진전은 여전히 단편적으로 이루어지고 있습니다. LLM4Cell은 RNA, ATAC, 다중 오믹스, 공간 모달리티를 아우르는 단일 세포 연구를 위해 개발된 58개의 기초 및 에이전트 모델을 통합적으로 조사한 첫 번째 연구입니다. 우리는 이러한 방법들을 기초, 텍스트-브리지, 공간, 다중 모드, 에피지노믹, 그리고 에이전트의 다섯 가지 패밀리로 분류하고, 주석, 궤적 및 교란 모델링, 약물 반응 예측을 포함한 여덟 가지 주요 분석 작업에 매핑합니다. 40개 이상의 공개 데이터셋을 바탕으로, 벤치마크 적합성, 데이터 다양성, 윤리적 또는 확장성 제약을 분석하고, 생물학적 근거, 다중 오믹스 정렬, 공정성, 프라이버시, 설명 가능성을 포함한 10가지 도메인 차원에서 모델을 평가합니다. 데이터셋, 모델, 평가 도메인을 연결함으로써, LLM4Cell은 언어 기반 단일 세포 지능에 대한 첫 번째 통합적 관점을 제공하고, 해석 가능성, 표준화, 신뢰할 수 있는 모델 개발에서의 열린 과제를 제시합니다.
English
Large language models (LLMs) and emerging agentic frameworks are beginning to transform single-cell biology by enabling natural-language reasoning, generative annotation, and multimodal data integration. However, progress remains fragmented across data modalities, architectures, and evaluation standards. LLM4Cell presents the first unified survey of 58 foundation and agentic models developed for single-cell research, spanning RNA, ATAC, multi-omic, and spatial modalities. We categorize these methods into five families-foundation, text-bridge, spatial, multimodal, epigenomic, and agentic-and map them to eight key analytical tasks including annotation, trajectory and perturbation modeling, and drug-response prediction. Drawing on over 40 public datasets, we analyze benchmark suitability, data diversity, and ethical or scalability constraints, and evaluate models across 10 domain dimensions covering biological grounding, multi-omics alignment, fairness, privacy, and explainability. By linking datasets, models, and evaluation domains, LLM4Cell provides the first integrated view of language-driven single-cell intelligence and outlines open challenges in interpretability, standardization, and trustworthy model development.
PDF23October 13, 2025