scPilot: Ragionamento con Modelli Linguistici di Grande Dimensione per l'Analisi e la Scoperta Automatica a Singola Cella

Abstract

Presentiamo scPilot, il primo framework sistematico per praticare il *reasoning* nativo per le omiche: un modello linguistico di grandi dimensioni (LLM) dialoga in linguaggio naturale ispezionando direttamente i dati di RNA-seq a cellula singola e strumenti di bioinformatica on-demand. scPilot converte le analisi fondamentali a cellula singola, ovvero l'annotazione del tipo cellulare, la ricostruzione delle traiettorie di sviluppo e il targeting dei fattori di trascrizione, in problemi di ragionamento passo-passo che il modello deve risolvere, giustificare e, quando necessario, rivedere sulla base di nuove evidenze. Per misurare i progressi, rilasciamo scBench, una suite di 9 dataset curati da esperti e sistemi di valutazione che testano fedelmente la capacità di reasoning nativo per le omiche di scPilot rispetto a vari LLM. Esperimenti con o1 mostrano che il reasoning nativo per le omiche iterativo aumenta la precisione media dell'11% per l'annotazione del tipo cellulare, mentre Gemini-2.5-Pro riduce la distanza di modifica del grafo delle traiettorie del 30% rispetto al prompting one-shot, generando al contempo tracce di ragionamento trasparenti che spiegano l'ambiguità dei geni marker e la logica regolatoria. Fondando gli LLM sui dati omici grezzi, scPilot abilita analisi a cellula singola verificabili, interpretabili e clinicamente informative. Codice, dati e pacchetto sono disponibili all'indirizzo https://github.com/maitrix-org/scPilot.

English

We present scPilot, the first systematic framework to practice omics-native reasoning: a large language model (LLM) converses in natural language while directly inspecting single-cell RNA-seq data and on-demand bioinformatics tools. scPilot converts core single-cell analyses, i.e., cell-type annotation, developmental-trajectory reconstruction, and transcription-factor targeting, into step-by-step reasoning problems that the model must solve, justify, and, when needed, revise with new evidence. To measure progress, we release scBench, a suite of 9 expertly curated datasets and graders that faithfully evaluate the omics-native reasoning capability of scPilot w.r.t various LLMs. Experiments with o1 show that iterative omics-native reasoning lifts average accuracy by 11% for cell-type annotation and Gemini-2.5-Pro cuts trajectory graph-edit distance by 30% versus one-shot prompting, while generating transparent reasoning traces explain marker gene ambiguity and regulatory logic. By grounding LLMs in raw omics data, scPilot enables auditable, interpretable, and diagnostically informative single-cell analyses. Code, data, and package are available at https://github.com/maitrix-org/scPilot

scPilot: Ragionamento con Modelli Linguistici di Grande Dimensione per l'Analisi e la Scoperta Automatica a Singola Cella

scPilot: Large Language Model Reasoning Toward Automated Single-Cell Analysis and Discovery

Abstract

Support