ChatCell: Facilitación del Análisis de Células Individuales mediante Lenguaje Natural
ChatCell: Facilitating Single-Cell Analysis with Natural Language
February 13, 2024
Autores: Yin Fang, Kangwei Liu, Ningyu Zhang, Xinle Deng, Penghui Yang, Zhuo Chen, Xiangru Tang, Mark Gerstein, Xiaohui Fan, Huajun Chen
cs.AI
Resumen
A medida que los Modelos de Lenguaje de Gran Escala (LLMs, por sus siglas en inglés) evolucionan rápidamente, su influencia en la ciencia se está volviendo cada vez más prominente. Las capacidades emergentes de los LLMs en la generalización de tareas y el diálogo de forma libre pueden impulsar significativamente campos como la química y la biología. Sin embargo, el campo de la biología de células individuales, que constituye los bloques fundamentales de los organismos vivos, aún enfrenta varios desafíos. Las altas barreras de conocimiento y la escalabilidad limitada de los métodos actuales restringen la explotación completa de los LLMs para dominar los datos de células individuales, obstaculizando la accesibilidad directa y la iteración rápida. Con este fin, presentamos ChatCell, que marca un cambio de paradigma al facilitar el análisis de células individuales mediante lenguaje natural. Aprovechando la adaptación de vocabulario y la generación unificada de secuencias, ChatCell ha adquirido un profundo conocimiento en biología de células individuales y la capacidad de adaptarse a una amplia gama de tareas de análisis. Experimentos exhaustivos demuestran además el rendimiento robusto de ChatCell y su potencial para profundizar en los conocimientos sobre células individuales, allanando el camino para una exploración más accesible e intuitiva en este campo crucial. La página principal de nuestro proyecto está disponible en https://zjunlp.github.io/project/ChatCell.
English
As Large Language Models (LLMs) rapidly evolve, their influence in science is
becoming increasingly prominent. The emerging capabilities of LLMs in task
generalization and free-form dialogue can significantly advance fields like
chemistry and biology. However, the field of single-cell biology, which forms
the foundational building blocks of living organisms, still faces several
challenges. High knowledge barriers and limited scalability in current methods
restrict the full exploitation of LLMs in mastering single-cell data, impeding
direct accessibility and rapid iteration. To this end, we introduce ChatCell,
which signifies a paradigm shift by facilitating single-cell analysis with
natural language. Leveraging vocabulary adaptation and unified sequence
generation, ChatCell has acquired profound expertise in single-cell biology and
the capability to accommodate a diverse range of analysis tasks. Extensive
experiments further demonstrate ChatCell's robust performance and potential to
deepen single-cell insights, paving the way for more accessible and intuitive
exploration in this pivotal field. Our project homepage is available at
https://zjunlp.github.io/project/ChatCell.