ChatPaper.aiChatPaper

Perovskite-LLM: Модели больших языков с расширенными знаниями для исследований перовскитных солнечных элементов

Perovskite-LLM: Knowledge-Enhanced Large Language Models for Perovskite Solar Cell Research

February 18, 2025
Авторы: Xiang Liu, Penglei Sun, Shuyan Chen, Longhan Zhang, Peijie Dong, Huajie You, Yongqi Zhang, Chang Yan, Xiaowen Chu, Tong-yi Zhang
cs.AI

Аннотация

Быстрое развитие перовскитных солнечных элементов (PSCs) привело к экспоненциальному росту числа научных публикаций, что создало острую потребность в эффективных системах управления знаниями и рассуждений в этой области. Мы представляем комплексную систему, усиленную знаниями, для PSCs, которая интегрирует три ключевых компонента. Во-первых, мы разработали Perovskite-KG — предметно-ориентированный граф знаний, построенный на основе 1 517 научных статей и содержащий 23 789 сущностей и 22 272 связи. Во-вторых, мы создали два дополняющих набора данных: Perovskite-Chat, включающий 55 101 высококачественную пару вопрос-ответ, сгенерированную с использованием новой многоагентной структуры, и Perovskite-Reasoning, содержащий 2 217 тщательно отобранных задач из области материаловедения. В-третьих, мы представили две специализированные крупные языковые модели: Perovskite-Chat-LLM для оказания помощи в предметно-ориентированных знаниях и Perovskite-Reasoning-LLM для выполнения задач научного рассуждения. Экспериментальные результаты показывают, что наша система значительно превосходит существующие модели как в задачах извлечения предметно-ориентированных знаний, так и в задачах науч
English
The rapid advancement of perovskite solar cells (PSCs) has led to an exponential growth in research publications, creating an urgent need for efficient knowledge management and reasoning systems in this domain. We present a comprehensive knowledge-enhanced system for PSCs that integrates three key components. First, we develop Perovskite-KG, a domain-specific knowledge graph constructed from 1,517 research papers, containing 23,789 entities and 22,272 relationships. Second, we create two complementary datasets: Perovskite-Chat, comprising 55,101 high-quality question-answer pairs generated through a novel multi-agent framework, and Perovskite-Reasoning, containing 2,217 carefully curated materials science problems. Third, we introduce two specialized large language models: Perovskite-Chat-LLM for domain-specific knowledge assistance and Perovskite-Reasoning-LLM for scientific reasoning tasks. Experimental results demonstrate that our system significantly outperforms existing models in both domain-specific knowledge retrieval and scientific reasoning tasks, providing researchers with effective tools for literature review, experimental design, and complex problem-solving in PSC research.

Summary

AI-Generated Summary

PDF22February 19, 2025