ChatPaper.aiChatPaper

CellMaster: Annotazione Collaborativa dei Tipi Cellulari nell'Analisi di Singola Cellula

CellMaster: Collaborative Cell Type Annotation in Single-Cell Analysis

February 12, 2026
Autori: Zhen Wang, Yiming Gao, Jieyuan Liu, Enze Ma, Jefferson Chen, Mark Antkowiak, Mengzhou Hu, JungHo Kong, Dexter Pratt, Zhiting Hu, Wei Wang, Trey Ideker, Eric P. Xing
cs.AI

Abstract

La tecnica di RNA-seq a singola cellula (scRNA-seq) consente la profilazione su scala atlantica di tessuti complessi, rivelando lignaggi rari e stati transitori. Tuttavia, l'assegnazione di identità cellulari biologicamente valide rimane un collo di bottiglia, poiché i marcatori sono tessuto- e stato-dipendenti, e gli stati nuovi mancano di riferimenti. Presentiamo CellMaster, un agente di IA che imita la pratica esperta per l'annotazione dei tipi cellulari zero-shot. A differenza degli strumenti automatizzati esistenti, CellMaster sfrutta la conoscenza codificata negli LLM (ad esempio, GPT-4o) per eseguire annotazioni in tempo reale con giustificazioni interpretabili, senza pre-addestramento o database di marcatori fissi. Su 9 dataset che coprono 8 tessuti, CellMaster ha migliorato l'accuratezza del 7,1% rispetto alle migliori baseline (inclusi CellTypist e scTab) in modalità automatica. Con un perfezionamento human-in-the-loop, questo vantaggio è aumentato al 18,6%, con un guadagno del 22,1% sulle popolazioni di sottotipi. Il sistema dimostra una forza particolare negli stati cellulari rari e nuovi, dove le baseline spesso falliscono. Il codice sorgente e l'applicazione web sono disponibili su https://github.com/AnonymousGym/CellMaster{https://github.com/AnonymousGym/CellMaster}.
English
Single-cell RNA-seq (scRNA-seq) enables atlas-scale profiling of complex tissues, revealing rare lineages and transient states. Yet, assigning biologically valid cell identities remains a bottleneck because markers are tissue- and state-dependent, and novel states lack references. We present CellMaster, an AI agent that mimics expert practice for zero-shot cell-type annotation. Unlike existing automated tools, CellMaster leverages LLM-encoded knowledge (e.g., GPT-4o) to perform on-the-fly annotation with interpretable rationales, without pre-training or fixed marker databases. Across 9 datasets spanning 8 tissues, CellMaster improved accuracy by 7.1% over best-performing baselines (including CellTypist and scTab) in automatic mode. With human-in-the-loop refinement, this advantage increased to 18.6%, with a 22.1% gain on subtype populations. The system demonstrates particular strength in rare and novel cell states where baselines often fail. Source code and the web application are available at https://github.com/AnonymousGym/CellMaster{https://github.com/AnonymousGym/CellMaster}.
PDF12February 18, 2026