scPilot: Raciocínio de Modelos de Linguagem de Grande Porte para Análise e Descoberta Automatizada de Células Únicas

Resumo

Apresentamos o scPilot, o primeiro framework sistemático para praticar o *raciocínio nativo em ômicas*: um modelo de linguagem grande (LLM) dialoga em linguagem natural enquanto inspeciona diretamente dados de RNA-seq de célula única e ferramentas de bioinformática sob demanda. O scPilot converte análises centrais de célula única, ou seja, anotação de tipo celular, reconstrução de trajetória de desenvolvimento e identificação de fatores de transcrição-alvo, em problemas de raciocínio passo a passo que o modelo deve resolver, justificar e, quando necessário, revisar com novas evidências. Para medir o progresso, lançamos o scBench, um conjunto de 9 conjuntos de dados curados por especialistas e avaliadores que testam fielmente a capacidade de raciocínio nativo em ômicas do scPilot em relação a vários LLMs. Experimentos com o o1 mostram que o raciocínio nativo em ômicas iterativo aumenta a precisão média em 11% para anotação de tipo celular, e o Gemini-2.5-Pro reduz a distância de edição de grafos de trajetória em 30% em comparação com o *prompting* único, ao mesmo tempo que gera trilhas de raciocínio transparentes que explicam a ambiguidade de genes marcadores e a lógica regulatória. Ao fundamentar LLMs em dados brutos de ômicas, o scPilot permite análises de célula única auditáveis, interpretáveis e com valor diagnóstico. Código, dados e pacote estão disponíveis em https://github.com/maitrix-org/scPilot.

English

We present scPilot, the first systematic framework to practice omics-native reasoning: a large language model (LLM) converses in natural language while directly inspecting single-cell RNA-seq data and on-demand bioinformatics tools. scPilot converts core single-cell analyses, i.e., cell-type annotation, developmental-trajectory reconstruction, and transcription-factor targeting, into step-by-step reasoning problems that the model must solve, justify, and, when needed, revise with new evidence. To measure progress, we release scBench, a suite of 9 expertly curated datasets and graders that faithfully evaluate the omics-native reasoning capability of scPilot w.r.t various LLMs. Experiments with o1 show that iterative omics-native reasoning lifts average accuracy by 11% for cell-type annotation and Gemini-2.5-Pro cuts trajectory graph-edit distance by 30% versus one-shot prompting, while generating transparent reasoning traces explain marker gene ambiguity and regulatory logic. By grounding LLMs in raw omics data, scPilot enables auditable, interpretable, and diagnostically informative single-cell analyses. Code, data, and package are available at https://github.com/maitrix-org/scPilot

scPilot: Raciocínio de Modelos de Linguagem de Grande Porte para Análise e Descoberta Automatizada de Células Únicas

scPilot: Large Language Model Reasoning Toward Automated Single-Cell Analysis and Discovery

Resumo

Support