ChatCell: Vereinfachung der Einzelzellanalyse mit natürlicher Sprache
ChatCell: Facilitating Single-Cell Analysis with Natural Language
February 13, 2024
Autoren: Yin Fang, Kangwei Liu, Ningyu Zhang, Xinle Deng, Penghui Yang, Zhuo Chen, Xiangru Tang, Mark Gerstein, Xiaohui Fan, Huajun Chen
cs.AI
Zusammenfassung
Während sich Large Language Models (LLMs) rasant weiterentwickeln, wird ihr Einfluss in der Wissenschaft zunehmend bedeutender. Die aufkommenden Fähigkeiten von LLMs in der Aufgabenverallgemeinerung und im freien Dialog können Bereiche wie Chemie und Biologie erheblich voranbringen. Dennoch steht das Feld der Einzelzellbiologie, das die grundlegenden Bausteine lebender Organismen darstellt, vor mehreren Herausforderungen. Hohe Wissensbarrieren und begrenzte Skalierbarkeit aktueller Methoden schränken die vollständige Nutzung von LLMs bei der Beherrschung von Einzelzelldaten ein, was den direkten Zugang und schnelle Iterationen behindert. Aus diesem Grund stellen wir ChatCell vor, das einen Paradigmenwechsel einleitet, indem es die Einzelzellanalyse mit natürlicher Sprache ermöglicht. Durch Vokabelanpassung und einheitliche Sequenzgenerierung hat ChatCell fundiertes Fachwissen in der Einzelzellbiologie und die Fähigkeit erworben, eine Vielzahl von Analyseaufgaben zu bewältigen. Umfangreiche Experimente zeigen zudem die robuste Leistung von ChatCell und sein Potenzial, Einblicke in die Einzelzellbiologie zu vertiefen, wodurch der Weg für einen zugänglicheren und intuitiveren Zugang in diesem zentralen Bereich geebnet wird. Unsere Projekt-Homepage ist unter https://zjunlp.github.io/project/ChatCell verfügbar.
English
As Large Language Models (LLMs) rapidly evolve, their influence in science is
becoming increasingly prominent. The emerging capabilities of LLMs in task
generalization and free-form dialogue can significantly advance fields like
chemistry and biology. However, the field of single-cell biology, which forms
the foundational building blocks of living organisms, still faces several
challenges. High knowledge barriers and limited scalability in current methods
restrict the full exploitation of LLMs in mastering single-cell data, impeding
direct accessibility and rapid iteration. To this end, we introduce ChatCell,
which signifies a paradigm shift by facilitating single-cell analysis with
natural language. Leveraging vocabulary adaptation and unified sequence
generation, ChatCell has acquired profound expertise in single-cell biology and
the capability to accommodate a diverse range of analysis tasks. Extensive
experiments further demonstrate ChatCell's robust performance and potential to
deepen single-cell insights, paving the way for more accessible and intuitive
exploration in this pivotal field. Our project homepage is available at
https://zjunlp.github.io/project/ChatCell.