ChatPaper.aiChatPaper

CellMaster: Kollaborative Zelltyp-Annotation in der Einzelzellanalyse

CellMaster: Collaborative Cell Type Annotation in Single-Cell Analysis

February 12, 2026
papers.authors: Zhen Wang, Yiming Gao, Jieyuan Liu, Enze Ma, Jefferson Chen, Mark Antkowiak, Mengzhou Hu, JungHo Kong, Dexter Pratt, Zhiting Hu, Wei Wang, Trey Ideker, Eric P. Xing
cs.AI

papers.abstract

Die Einzelzell-RNA-Sequenzierung (scRNA-seq) ermöglicht die atlas-skalige Profilerstellung komplexer Gewebe und deckt seltene Linien und transiente Zustände auf. Dennoch bleibt die Zuweisung biologisch valider Zellidentitäten ein Engpass, da Marker gewebe- und zustandsabhängig sind und neuartige Zustände keine Referenzen haben. Wir stellen CellMaster vor, einen KI-Agenten, der die Vorgehensweise von Experten zur Null-Stichproben-Zelltyp-Annotation nachahmt. Im Gegensatz zu bestehenden automatisierten Tools nutzt CellMaster LLM-kodiertes Wissen (z.B. GPT-4o), um eine sofortige Annotation mit interpretierbaren Begründungen durchzuführen, ohne Vorabtraining oder feste Marker-Datenbanken. Über 9 Datensätze aus 8 Geweben hinweg verbesserte CellMaster die Genauigkeit im automatischen Modus um 7,1 % gegenüber den besten Baseline-Methoden (einschließlich CellTypist und scTab). Mit menschlicher Beteiligung bei der Verfeinerung stieg dieser Vorteil auf 18,6 % an, mit einem Zuwachs von 22,1 % bei Subpopulationen. Das System zeigt besondere Stärke bei seltenen und neuartigen Zellzuständen, bei denen Baseline-Methoden oft versagen. Der Quellcode und die Webanwendung sind verfügbar unter https://github.com/AnonymousGym/CellMaster.
English
Single-cell RNA-seq (scRNA-seq) enables atlas-scale profiling of complex tissues, revealing rare lineages and transient states. Yet, assigning biologically valid cell identities remains a bottleneck because markers are tissue- and state-dependent, and novel states lack references. We present CellMaster, an AI agent that mimics expert practice for zero-shot cell-type annotation. Unlike existing automated tools, CellMaster leverages LLM-encoded knowledge (e.g., GPT-4o) to perform on-the-fly annotation with interpretable rationales, without pre-training or fixed marker databases. Across 9 datasets spanning 8 tissues, CellMaster improved accuracy by 7.1% over best-performing baselines (including CellTypist and scTab) in automatic mode. With human-in-the-loop refinement, this advantage increased to 18.6%, with a 22.1% gain on subtype populations. The system demonstrates particular strength in rare and novel cell states where baselines often fail. Source code and the web application are available at https://github.com/AnonymousGym/CellMaster{https://github.com/AnonymousGym/CellMaster}.
PDF12February 18, 2026