CellMaster: Anotação Colaborativa de Tipos Celulares na Análise de Célula Única
CellMaster: Collaborative Cell Type Annotation in Single-Cell Analysis
February 12, 2026
Autores: Zhen Wang, Yiming Gao, Jieyuan Liu, Enze Ma, Jefferson Chen, Mark Antkowiak, Mengzhou Hu, JungHo Kong, Dexter Pratt, Zhiting Hu, Wei Wang, Trey Ideker, Eric P. Xing
cs.AI
Resumo
A técnica de RNA-seq de célula única (scRNA-seq) permite a caracterização em escala de atlas de tecidos complexos, revelando linhagens raras e estados transitórios. No entanto, a atribuição de identidades celulares biologicamente válidas permanece um gargalo, pois os marcadores são dependentes do tecido e do estado, e estados novos carecem de referências. Apresentamos o CellMaster, um agente de IA que imita a prática especializada para anotação de tipos celulares *zero-shot*. Diferente de ferramentas automatizadas existentes, o CellMaster aproveita o conhecimento codificado em LLMs (por exemplo, GPT-4o) para realizar anotações em tempo real com racionalizações interpretáveis, sem pré-treinamento ou bases de dados fixas de marcadores. Em 9 conjuntos de dados abrangendo 8 tecidos, o CellMaster melhorou a precisão em 7,1% em relação às melhores baselines (incluindo CellTypist e scTab) no modo automático. Com refinamento humano em *loop* (human-in-the-loop), essa vantagem aumentou para 18,6%, com um ganho de 22,1% em populações de subtipos. O sistema demonstra particular força em estados celulares raros e novos, onde as baselines frequentemente falham. O código-fonte e a aplicação web estão disponíveis em https://github.com/AnonymousGym/CellMaster.
English
Single-cell RNA-seq (scRNA-seq) enables atlas-scale profiling of complex tissues, revealing rare lineages and transient states. Yet, assigning biologically valid cell identities remains a bottleneck because markers are tissue- and state-dependent, and novel states lack references. We present CellMaster, an AI agent that mimics expert practice for zero-shot cell-type annotation. Unlike existing automated tools, CellMaster leverages LLM-encoded knowledge (e.g., GPT-4o) to perform on-the-fly annotation with interpretable rationales, without pre-training or fixed marker databases. Across 9 datasets spanning 8 tissues, CellMaster improved accuracy by 7.1% over best-performing baselines (including CellTypist and scTab) in automatic mode. With human-in-the-loop refinement, this advantage increased to 18.6%, with a 22.1% gain on subtype populations. The system demonstrates particular strength in rare and novel cell states where baselines often fail. Source code and the web application are available at https://github.com/AnonymousGym/CellMaster{https://github.com/AnonymousGym/CellMaster}.