CellMaster: Anotación Colaborativa de Tipos Celulares en Análisis de Célula Única
CellMaster: Collaborative Cell Type Annotation in Single-Cell Analysis
February 12, 2026
Autores: Zhen Wang, Yiming Gao, Jieyuan Liu, Enze Ma, Jefferson Chen, Mark Antkowiak, Mengzhou Hu, JungHo Kong, Dexter Pratt, Zhiting Hu, Wei Wang, Trey Ideker, Eric P. Xing
cs.AI
Resumen
La secuenciación de ARN de células individuales (scRNA-seq) permite la caracterización a escala de atlas de tejidos complejos, revelando linajes raros y estados transitorios. Sin embargo, la asignación de identidades celulares biológicamente válidas sigue siendo un cuello de botella, ya que los marcadores son dependientes del tejido y del estado, y los estados novedosos carecen de referencias. Presentamos CellMaster, un agente de IA que imita la práctica experta para la anotación de tipos celulares de cero disparos. A diferencia de las herramientas automatizadas existentes, CellMaster aprovecha el conocimiento codificado en modelos de lenguaje grandes (por ejemplo, GPT-4o) para realizar anotaciones sobre la marcha con razonamientos interpretables, sin necesidad de preentrenamiento o bases de datos de marcadores fijas. En 9 conjuntos de datos que abarcan 8 tejidos, CellMaster mejoró la precisión en un 7.1% respecto a las mejores líneas de base (incluyendo CellTypist y scTab) en modo automático. Con un refinamiento humano en el bucle, esta ventaja aumentó al 18.6%, con una ganancia del 22.1% en poblaciones de subtipos. El sistema demuestra una fuerza particular en estados celulares raros y novedosos donde las líneas de base a menudo fallan. El código fuente y la aplicación web están disponibles en https://github.com/AnonymousGym/CellMaster.
English
Single-cell RNA-seq (scRNA-seq) enables atlas-scale profiling of complex tissues, revealing rare lineages and transient states. Yet, assigning biologically valid cell identities remains a bottleneck because markers are tissue- and state-dependent, and novel states lack references. We present CellMaster, an AI agent that mimics expert practice for zero-shot cell-type annotation. Unlike existing automated tools, CellMaster leverages LLM-encoded knowledge (e.g., GPT-4o) to perform on-the-fly annotation with interpretable rationales, without pre-training or fixed marker databases. Across 9 datasets spanning 8 tissues, CellMaster improved accuracy by 7.1% over best-performing baselines (including CellTypist and scTab) in automatic mode. With human-in-the-loop refinement, this advantage increased to 18.6%, with a 22.1% gain on subtype populations. The system demonstrates particular strength in rare and novel cell states where baselines often fail. Source code and the web application are available at https://github.com/AnonymousGym/CellMaster{https://github.com/AnonymousGym/CellMaster}.