scPilot: 大規模言語モデルによる自動化された単一細胞解析と発見への推論
scPilot: Large Language Model Reasoning Toward Automated Single-Cell Analysis and Discovery
February 12, 2026
著者: Yiming Gao, Zhen Wang, Jefferson Chen, Mark Antkowiak, Mengzhou Hu, JungHo Kong, Dexter Pratt, Jieyuan Liu, Enze Ma, Zhiting Hu, Eric P. Xing
cs.AI
要旨
我々はscPilotを発表します。これはオミクスネイティブ推論を実践する初の体系的なフレームワークであり、大規模言語モデル(LLM)が自然言語で対話しながら、単一細胞RNA-seqデータとオンデマンドのバイオインフォマティクスツールを直接参照します。scPilotは、細胞タイプ注釈、発生軌道再構築、転写因子ターゲティングといった単一細胞解析の核心を、モデルが解決し、正当化し、必要に応じて新たな証拠で修正すべき段階的推論問題へと変換します。
進捗を測定するため、我々はscBenchを公開しました。これは9つの専門家精選データセットと評価器から成るスイートであり、様々なLLMに対するscPilotのオミクスネイティブ推論能力を忠実に評価します。o1を用いた実験では、反復的オミクスネイティブ推論により細胞タイプ注釈の平均精度が11%向上し、Gemini-2.5-Proはワンショットプロンプトと比較して軌道グラフ編集距離を30%削減しつつ、マーカー遺伝子の曖昧性や制御ロジックを説明する透明な推論軌跡を生成することが示されました。LLMを生のオミクスデータに接地することで、scPilotは監査可能で解釈可能、かつ診断情報に富んだ単一細胞解析を実現します。
コード、データ、パッケージはhttps://github.com/maitrix-org/scPilot で利用可能です。
English
We present scPilot, the first systematic framework to practice omics-native reasoning: a large language model (LLM) converses in natural language while directly inspecting single-cell RNA-seq data and on-demand bioinformatics tools. scPilot converts core single-cell analyses, i.e., cell-type annotation, developmental-trajectory reconstruction, and transcription-factor targeting, into step-by-step reasoning problems that the model must solve, justify, and, when needed, revise with new evidence.
To measure progress, we release scBench, a suite of 9 expertly curated datasets and graders that faithfully evaluate the omics-native reasoning capability of scPilot w.r.t various LLMs. Experiments with o1 show that iterative omics-native reasoning lifts average accuracy by 11% for cell-type annotation and Gemini-2.5-Pro cuts trajectory graph-edit distance by 30% versus one-shot prompting, while generating transparent reasoning traces explain marker gene ambiguity and regulatory logic. By grounding LLMs in raw omics data, scPilot enables auditable, interpretable, and diagnostically informative single-cell analyses.
Code, data, and package are available at https://github.com/maitrix-org/scPilot