ChatPaper.aiChatPaper

CellMaster: Collaboratieve Celtype-annotatie in Enkelcelanalyse

CellMaster: Collaborative Cell Type Annotation in Single-Cell Analysis

February 12, 2026
Auteurs: Zhen Wang, Yiming Gao, Jieyuan Liu, Enze Ma, Jefferson Chen, Mark Antkowiak, Mengzhou Hu, JungHo Kong, Dexter Pratt, Zhiting Hu, Wei Wang, Trey Ideker, Eric P. Xing
cs.AI

Samenvatting

Enkelcel-RNA-seq (scRNA-seq) maakt grootschalige profilering van complexe weefsels mogelijk, waardoor zeldzame celtypen en voorbijgaande cellulaire toestanden zichtbaar worden. Het toekennen van biologisch valide celidentiteiten blijft echter een knelpunt, omdat markers weefsel- en toestandafhankelijk zijn en nieuwe toestanden geen referentiemateriaal hebben. Wij presenteren CellMaster, een AI-agent die de werkwijze van experts nabootst voor zero-shot annotatie van celtypen. In tegenstelling tot bestaande geautomatiseerde tools, benut CellMaster door LLM's gecodeerde kennis (bijv. GPT-4o) om directe annotatie uit te voeren met interpreteerbare onderbouwingen, zonder voorafgaande training of vaste marker-databases. Over 9 datasets verspreid over 8 weefsels verbeterde CellMaster de nauwkeurigheid met 7,1% ten opzichte van de best presterende basismodellen (waaronder CellTypist en scTab) in de automatische modus. Met human-in-the-loop verfijning nam dit voordeel toe tot 18,6%, met een winst van 22,1% voor subpopulaties. Het systeem toont bijzondere kracht in zeldzame en nieuwe celtoestanden waar basismodellen vaak falen. De broncode en de webapplicatie zijn beschikbaar op https://github.com/AnonymousGym/CellMaster{https://github.com/AnonymousGym/CellMaster}.
English
Single-cell RNA-seq (scRNA-seq) enables atlas-scale profiling of complex tissues, revealing rare lineages and transient states. Yet, assigning biologically valid cell identities remains a bottleneck because markers are tissue- and state-dependent, and novel states lack references. We present CellMaster, an AI agent that mimics expert practice for zero-shot cell-type annotation. Unlike existing automated tools, CellMaster leverages LLM-encoded knowledge (e.g., GPT-4o) to perform on-the-fly annotation with interpretable rationales, without pre-training or fixed marker databases. Across 9 datasets spanning 8 tissues, CellMaster improved accuracy by 7.1% over best-performing baselines (including CellTypist and scTab) in automatic mode. With human-in-the-loop refinement, this advantage increased to 18.6%, with a 22.1% gain on subtype populations. The system demonstrates particular strength in rare and novel cell states where baselines often fail. Source code and the web application are available at https://github.com/AnonymousGym/CellMaster{https://github.com/AnonymousGym/CellMaster}.
PDF12February 18, 2026