CellMaster: Совместная аннотация типов клеток при анализе одноклеточных данных
CellMaster: Collaborative Cell Type Annotation in Single-Cell Analysis
February 12, 2026
Авторы: Zhen Wang, Yiming Gao, Jieyuan Liu, Enze Ma, Jefferson Chen, Mark Antkowiak, Mengzhou Hu, JungHo Kong, Dexter Pratt, Zhiting Hu, Wei Wang, Trey Ideker, Eric P. Xing
cs.AI
Аннотация
Одноклеточная РНК-секвенирование (scRNA-seq) позволяет проводить атласное профилирование сложных тканей, выявляя редкие клеточные линии и транзиторные состояния. Однако присвоение биологически достоверных клеточных идентичностей остаётся узким местом, поскольку маркеры зависят от типа ткани и состояния, а для новых состояний отсутствуют референсы. Мы представляем CellMaster — ИИ-агент, который имитирует экспертный подход для аннотирования типов клеток «с нуля». В отличие от существующих автоматизированных инструментов, CellMaster использует знания, закодированные в больших языковых моделях (например, GPT-4o), для выполнения аннотации в реальном времени с интерпретируемыми обоснованиями, без предварительного обучения или фиксированных баз маркеров. На 9 наборах данных, охватывающих 8 тканей, CellMaster повысил точность на 7,1% по сравнению с лучшими базовыми методами (включая CellTypist и scTab) в автоматическом режиме. При использовании подхода с участием человека в цикле уточнения это преимущество возросло до 18,6%, с приростом в 22,1% для субпопуляций клеток. Система демонстрирует особую эффективность в отношении редких и новых клеточных состояний, где базовые методы часто терпят неудачу. Исходный код и веб-приложение доступны по адресу https://github.com/AnonymousGym/CellMaster.
English
Single-cell RNA-seq (scRNA-seq) enables atlas-scale profiling of complex tissues, revealing rare lineages and transient states. Yet, assigning biologically valid cell identities remains a bottleneck because markers are tissue- and state-dependent, and novel states lack references. We present CellMaster, an AI agent that mimics expert practice for zero-shot cell-type annotation. Unlike existing automated tools, CellMaster leverages LLM-encoded knowledge (e.g., GPT-4o) to perform on-the-fly annotation with interpretable rationales, without pre-training or fixed marker databases. Across 9 datasets spanning 8 tissues, CellMaster improved accuracy by 7.1% over best-performing baselines (including CellTypist and scTab) in automatic mode. With human-in-the-loop refinement, this advantage increased to 18.6%, with a 22.1% gain on subtype populations. The system demonstrates particular strength in rare and novel cell states where baselines often fail. Source code and the web application are available at https://github.com/AnonymousGym/CellMaster{https://github.com/AnonymousGym/CellMaster}.