ChatPaper.aiChatPaper

Perovskite-LLM : Modèles de Langue de Grande Taille Enrichis de Connaissances pour la Recherche sur les Cellules Solaires à Pérovskite

Perovskite-LLM: Knowledge-Enhanced Large Language Models for Perovskite Solar Cell Research

February 18, 2025
Auteurs: Xiang Liu, Penglei Sun, Shuyan Chen, Longhan Zhang, Peijie Dong, Huajie You, Yongqi Zhang, Chang Yan, Xiaowen Chu, Tong-yi Zhang
cs.AI

Résumé

L'avancée rapide des cellules solaires à pérovskite (PSCs) a entraîné une croissance exponentielle des publications de recherche, créant un besoin urgent de systèmes efficaces de gestion des connaissances et de raisonnement dans ce domaine. Nous présentons un système complet de connaissances enrichies pour les PSCs qui intègre trois composants clés. Premièrement, nous développons Perovskite-KG, un graphe de connaissances spécifique au domaine construit à partir de 1 517 articles de recherche, contenant 23 789 entités et 22 272 relations. Deuxièmement, nous créons deux ensembles de données complémentaires : Perovskite-Chat, comprenant 55 101 paires de questions-réponses de haute qualité générées grâce à un nouveau cadre multi-agent, et Perovskite-Reasoning, contenant 2 217 problèmes de science des matériaux soigneusement sélectionnés. Troisièmement, nous introduisons deux modèles de langage spécialisés : Perovskite-Chat-LLM pour l'assistance en connaissances spécifiques au domaine et Perovskite-Reasoning-LLM pour les tâches de raisonnement scientifique. Les résultats expérimentaux démontrent que notre système surpasse significativement les modèles existants à la fois en matière de récupération de connaissances spécifiques au domaine et en tâches de raisonnement scientifique, offrant aux chercheurs des outils efficaces pour la revue de littérature, la conception expérimentale et la résolution de problèmes complexes dans la recherche sur les PSCs.
English
The rapid advancement of perovskite solar cells (PSCs) has led to an exponential growth in research publications, creating an urgent need for efficient knowledge management and reasoning systems in this domain. We present a comprehensive knowledge-enhanced system for PSCs that integrates three key components. First, we develop Perovskite-KG, a domain-specific knowledge graph constructed from 1,517 research papers, containing 23,789 entities and 22,272 relationships. Second, we create two complementary datasets: Perovskite-Chat, comprising 55,101 high-quality question-answer pairs generated through a novel multi-agent framework, and Perovskite-Reasoning, containing 2,217 carefully curated materials science problems. Third, we introduce two specialized large language models: Perovskite-Chat-LLM for domain-specific knowledge assistance and Perovskite-Reasoning-LLM for scientific reasoning tasks. Experimental results demonstrate that our system significantly outperforms existing models in both domain-specific knowledge retrieval and scientific reasoning tasks, providing researchers with effective tools for literature review, experimental design, and complex problem-solving in PSC research.

Summary

AI-Generated Summary

PDF22February 19, 2025