ChatCell : Faciliter l'analyse unicellulaire avec le langage naturel
ChatCell: Facilitating Single-Cell Analysis with Natural Language
February 13, 2024
Auteurs: Yin Fang, Kangwei Liu, Ningyu Zhang, Xinle Deng, Penghui Yang, Zhuo Chen, Xiangru Tang, Mark Gerstein, Xiaohui Fan, Huajun Chen
cs.AI
Résumé
Alors que les modèles de langage de grande taille (LLMs) évoluent rapidement, leur influence dans le domaine scientifique devient de plus en plus marquée. Les capacités émergentes des LLMs en matière de généralisation des tâches et de dialogue libre peuvent considérablement faire progresser des domaines comme la chimie et la biologie. Cependant, le domaine de la biologie unicellulaire, qui constitue les éléments fondamentaux des organismes vivants, fait encore face à plusieurs défis. Les barrières élevées en termes de connaissances et la scalabilité limitée des méthodes actuelles restreignent l'exploitation complète des LLMs pour maîtriser les données unicellulaires, entravant l'accessibilité directe et l'itération rapide. À cette fin, nous présentons ChatCell, qui marque un changement de paradigme en facilitant l'analyse unicellulaire avec le langage naturel. En tirant parti de l'adaptation du vocabulaire et de la génération unifiée de séquences, ChatCell a acquis une expertise approfondie en biologie unicellulaire et la capacité de s'adapter à une large gamme de tâches d'analyse. Des expériences approfondies démontrent en outre la performance robuste de ChatCell et son potentiel à approfondir les insights unicellulaires, ouvrant la voie à une exploration plus accessible et intuitive dans ce domaine crucial. Notre page d'accueil du projet est disponible à l'adresse suivante : https://zjunlp.github.io/project/ChatCell.
English
As Large Language Models (LLMs) rapidly evolve, their influence in science is
becoming increasingly prominent. The emerging capabilities of LLMs in task
generalization and free-form dialogue can significantly advance fields like
chemistry and biology. However, the field of single-cell biology, which forms
the foundational building blocks of living organisms, still faces several
challenges. High knowledge barriers and limited scalability in current methods
restrict the full exploitation of LLMs in mastering single-cell data, impeding
direct accessibility and rapid iteration. To this end, we introduce ChatCell,
which signifies a paradigm shift by facilitating single-cell analysis with
natural language. Leveraging vocabulary adaptation and unified sequence
generation, ChatCell has acquired profound expertise in single-cell biology and
the capability to accommodate a diverse range of analysis tasks. Extensive
experiments further demonstrate ChatCell's robust performance and potential to
deepen single-cell insights, paving the way for more accessible and intuitive
exploration in this pivotal field. Our project homepage is available at
https://zjunlp.github.io/project/ChatCell.Summary
AI-Generated Summary