ChatPaper.aiChatPaper

Perovskite-LLM: Wissensbasierte Large Language Models für die Forschung an Perovskit-Solarzellen

Perovskite-LLM: Knowledge-Enhanced Large Language Models for Perovskite Solar Cell Research

February 18, 2025
Autoren: Xiang Liu, Penglei Sun, Shuyan Chen, Longhan Zhang, Peijie Dong, Huajie You, Yongqi Zhang, Chang Yan, Xiaowen Chu, Tong-yi Zhang
cs.AI

Zusammenfassung

Die rasante Entwicklung von Perowskit-Solarzellen (PSCs) hat zu einem exponentiellen Anstieg von Forschungsveröffentlichungen geführt, wodurch ein dringender Bedarf an effizienten Wissensmanagement- und Reasoning-Systemen in diesem Bereich entstanden ist. Wir präsentieren ein umfassendes, wissensbasiertes System für PSCs, das drei Schlüsselkomponenten integriert. Zunächst entwickeln wir Perovskite-KG, ein domänenspezifisches Wissensgraphen, das aus 1.517 Forschungsarbeiten erstellt wurde und 23.789 Entitäten sowie 22.272 Beziehungen enthält. Zweitens erstellen wir zwei komplementäre Datensätze: Perovskite-Chat, bestehend aus 55.101 hochwertigen Frage-Antwort-Paaren, die durch ein neuartiges Multi-Agenten-Framework generiert wurden, und Perovskite-Reasoning, das 2.217 sorgfältig kuratierte Materialwissenschaftsprobleme enthält. Drittens führen wir zwei spezialisierte Large Language Models ein: Perovskite-Chat-LLM für domänenspezifische Wissensunterstützung und Perovskite-Reasoning-LLM für wissenschaftliche Reasoning-Aufgaben. Experimentelle Ergebnisse zeigen, dass unser System bestehende Modelle sowohl bei der domänenspezifischen Wissensabfrage als auch bei wissenschaftlichen Reasoning-Aufgaben deutlich übertrifft und Forschern effektive Werkzeuge für die Literaturrecherche, das experimentelle Design und die Lösung komplexer Probleme in der PSC-Forschung bietet.
English
The rapid advancement of perovskite solar cells (PSCs) has led to an exponential growth in research publications, creating an urgent need for efficient knowledge management and reasoning systems in this domain. We present a comprehensive knowledge-enhanced system for PSCs that integrates three key components. First, we develop Perovskite-KG, a domain-specific knowledge graph constructed from 1,517 research papers, containing 23,789 entities and 22,272 relationships. Second, we create two complementary datasets: Perovskite-Chat, comprising 55,101 high-quality question-answer pairs generated through a novel multi-agent framework, and Perovskite-Reasoning, containing 2,217 carefully curated materials science problems. Third, we introduce two specialized large language models: Perovskite-Chat-LLM for domain-specific knowledge assistance and Perovskite-Reasoning-LLM for scientific reasoning tasks. Experimental results demonstrate that our system significantly outperforms existing models in both domain-specific knowledge retrieval and scientific reasoning tasks, providing researchers with effective tools for literature review, experimental design, and complex problem-solving in PSC research.

Summary

AI-Generated Summary

PDF22February 19, 2025