LLM4Cell: 単一細胞生物学における大規模言語モデルとエージェントモデルのサーベイ
LLM4Cell: A Survey of Large Language and Agentic Models for Single-Cell Biology
October 9, 2025
著者: Sajib Acharjee Dip, Adrika Zafor, Bikash Kumar Paul, Uddip Acharjee Shuvo, Muhit Islam Emon, Xuan Wang, Liqing Zhang
cs.AI
要旨
大規模言語モデル(LLMs)と新興のエージェント型フレームワークは、自然言語推論、生成的アノテーション、マルチモーダルデータ統合を可能にすることで、単一細胞生物学の変革を始めつつある。しかし、進展はデータモダリティ、アーキテクチャ、評価基準にわたって断片的なままである。LLM4Cellは、RNA、ATAC、マルチオミクス、空間モダリティにまたがる単一細胞研究のために開発された58の基盤モデルとエージェントモデルを初めて統一的に調査した。これらの手法を5つのカテゴリー(基盤、テキストブリッジ、空間、マルチモーダル、エピゲノミクス、エージェント型)に分類し、アノテーション、軌跡モデリング、摂動モデリング、薬剤応答予測を含む8つの主要な分析タスクにマッピングする。40以上の公開データセットを活用し、ベンチマークの適切性、データ多様性、倫理的またはスケーラビリティの制約を分析し、生物学的基盤、マルチオミクス整合性、公平性、プライバシー、説明可能性を含む10のドメイン次元にわたってモデルを評価する。データセット、モデル、評価ドメインを結びつけることで、LLM4Cellは言語駆動型単一細胞知能の初の統合ビューを提供し、解釈可能性、標準化、信頼できるモデル開発における未解決の課題を概説する。
English
Large language models (LLMs) and emerging agentic frameworks are beginning to
transform single-cell biology by enabling natural-language reasoning,
generative annotation, and multimodal data integration. However, progress
remains fragmented across data modalities, architectures, and evaluation
standards. LLM4Cell presents the first unified survey of 58 foundation and
agentic models developed for single-cell research, spanning RNA, ATAC,
multi-omic, and spatial modalities. We categorize these methods into five
families-foundation, text-bridge, spatial, multimodal, epigenomic, and
agentic-and map them to eight key analytical tasks including annotation,
trajectory and perturbation modeling, and drug-response prediction. Drawing on
over 40 public datasets, we analyze benchmark suitability, data diversity, and
ethical or scalability constraints, and evaluate models across 10 domain
dimensions covering biological grounding, multi-omics alignment, fairness,
privacy, and explainability. By linking datasets, models, and evaluation
domains, LLM4Cell provides the first integrated view of language-driven
single-cell intelligence and outlines open challenges in interpretability,
standardization, and trustworthy model development.