ChatPaper.aiChatPaper

ChatCell: Упрощение анализа данных на уровне отдельных клеток с использованием естественного языка

ChatCell: Facilitating Single-Cell Analysis with Natural Language

February 13, 2024
Авторы: Yin Fang, Kangwei Liu, Ningyu Zhang, Xinle Deng, Penghui Yang, Zhuo Chen, Xiangru Tang, Mark Gerstein, Xiaohui Fan, Huajun Chen
cs.AI

Аннотация

По мере стремительного развития крупных языковых моделей (LLM) их влияние в науке становится все более заметным. Возникающие возможности LLM в области обобщения задач и свободного диалога могут значительно продвинуть такие области, как химия и биология. Однако в области биологии отдельных клеток, которая составляет фундаментальные строительные блоки живых организмов, до сих пор существует несколько проблем. Высокие барьеры знаний и ограниченная масштабируемость современных методов препятствуют полному использованию LLM для анализа данных о единичных клетках, затрудняя прямую доступность и быструю итерацию. В связи с этим мы представляем ChatCell, который знаменует собой смену парадигмы, облегчая анализ единичных клеток с использованием естественного языка. Благодаря адаптации словаря и унифицированной генерации последовательностей, ChatCell приобрел глубокие знания в области биологии единичных клеток и способность адаптироваться к широкому спектру аналитических задач. Многочисленные эксперименты дополнительно демонстрируют устойчивую производительность ChatCell и его потенциал для углубления понимания единичных клеток, прокладывая путь к более доступному и интуитивно понятному исследованию в этой ключевой области. Наш проект доступен по адресу: https://zjunlp.github.io/project/ChatCell.
English
As Large Language Models (LLMs) rapidly evolve, their influence in science is becoming increasingly prominent. The emerging capabilities of LLMs in task generalization and free-form dialogue can significantly advance fields like chemistry and biology. However, the field of single-cell biology, which forms the foundational building blocks of living organisms, still faces several challenges. High knowledge barriers and limited scalability in current methods restrict the full exploitation of LLMs in mastering single-cell data, impeding direct accessibility and rapid iteration. To this end, we introduce ChatCell, which signifies a paradigm shift by facilitating single-cell analysis with natural language. Leveraging vocabulary adaptation and unified sequence generation, ChatCell has acquired profound expertise in single-cell biology and the capability to accommodate a diverse range of analysis tasks. Extensive experiments further demonstrate ChatCell's robust performance and potential to deepen single-cell insights, paving the way for more accessible and intuitive exploration in this pivotal field. Our project homepage is available at https://zjunlp.github.io/project/ChatCell.

Summary

AI-Generated Summary

PDF144December 15, 2024