scPilot: Redeneren met Grote Taalmodellen voor Geautomatiseerde Enkelcelanalyse en Ontdekking

Samenvatting

Wij presenteren scPilot, het eerste systematische raamwerk voor *omics-native reasoning*: een groot taalmodel (LLM) voert gesprekken in natuurlijke taal terwijl het direct single-cell RNA-seq data inspecteert en on-demand bio-informatica tools gebruikt. scPilot zet kernanalyses van enkelvoudige cellen – zoals celtype-annotatie, reconstructie van ontwikkelingspaden en targeting van transcriptiefactoren – om in stapsgewijze redeneerproblemen die het model moet oplossen, rechtvaardigen en, indien nodig, herzien met nieuw bewijs. Om de vooruitgang te meten, lanceren we scBench, een reeks van 9 deskundig samengestelde datasets en beoordelaars die de *omics-native reasoning*-capaciteit van scPilot ten opzichte van verschillende LLM's nauwkeurig evalueren. Experimenten met o1 tonen aan dat iteratief *omics-native reasoning* de gemiddelde nauwkeurigheid voor celtype-annotatie met 11% verhoogt, en Gemini-2.5-Pro de grafiek-editieafstand voor ontwikkelingspaden met 30% verkleint in vergelijking met one-shot prompting, terwijl het transparante redeneersporen genereert die ambiguïteit in markergenen en regulatorische logica verklaren. Door LLM's te verankeren in ruwe omics-data, maakt scPilot controleerbare, interpreteerbare en diagnostisch informatieve single-cell analyses mogelijk. Code, data en package zijn beschikbaar op https://github.com/maitrix-org/scPilot.

English

We present scPilot, the first systematic framework to practice omics-native reasoning: a large language model (LLM) converses in natural language while directly inspecting single-cell RNA-seq data and on-demand bioinformatics tools. scPilot converts core single-cell analyses, i.e., cell-type annotation, developmental-trajectory reconstruction, and transcription-factor targeting, into step-by-step reasoning problems that the model must solve, justify, and, when needed, revise with new evidence. To measure progress, we release scBench, a suite of 9 expertly curated datasets and graders that faithfully evaluate the omics-native reasoning capability of scPilot w.r.t various LLMs. Experiments with o1 show that iterative omics-native reasoning lifts average accuracy by 11% for cell-type annotation and Gemini-2.5-Pro cuts trajectory graph-edit distance by 30% versus one-shot prompting, while generating transparent reasoning traces explain marker gene ambiguity and regulatory logic. By grounding LLMs in raw omics data, scPilot enables auditable, interpretable, and diagnostically informative single-cell analyses. Code, data, and package are available at https://github.com/maitrix-org/scPilot

scPilot: Redeneren met Grote Taalmodellen voor Geautomatiseerde Enkelcelanalyse en Ontdekking

scPilot: Large Language Model Reasoning Toward Automated Single-Cell Analysis and Discovery

Samenvatting

Support