Perovskite-LLM: Wissensbasierte Large Language Models für die Forschung an Perovskit-Solarzellen
Perovskite-LLM: Knowledge-Enhanced Large Language Models for Perovskite Solar Cell Research
February 18, 2025
Autoren: Xiang Liu, Penglei Sun, Shuyan Chen, Longhan Zhang, Peijie Dong, Huajie You, Yongqi Zhang, Chang Yan, Xiaowen Chu, Tong-yi Zhang
cs.AI
Zusammenfassung
Die rasante Entwicklung von Perowskit-Solarzellen (PSCs) hat zu einem exponentiellen Anstieg von Forschungsveröffentlichungen geführt, wodurch ein dringender Bedarf an effizienten Wissensmanagement- und Reasoning-Systemen in diesem Bereich entstanden ist. Wir präsentieren ein umfassendes, wissensbasiertes System für PSCs, das drei Schlüsselkomponenten integriert. Zunächst entwickeln wir Perovskite-KG, ein domänenspezifisches Wissensgraphen, das aus 1.517 Forschungsarbeiten erstellt wurde und 23.789 Entitäten sowie 22.272 Beziehungen enthält. Zweitens erstellen wir zwei komplementäre Datensätze: Perovskite-Chat, bestehend aus 55.101 hochwertigen Frage-Antwort-Paaren, die durch ein neuartiges Multi-Agenten-Framework generiert wurden, und Perovskite-Reasoning, das 2.217 sorgfältig kuratierte Materialwissenschaftsprobleme enthält. Drittens führen wir zwei spezialisierte Large Language Models ein: Perovskite-Chat-LLM für domänenspezifische Wissensunterstützung und Perovskite-Reasoning-LLM für wissenschaftliche Reasoning-Aufgaben. Experimentelle Ergebnisse zeigen, dass unser System bestehende Modelle sowohl bei der domänenspezifischen Wissensabfrage als auch bei wissenschaftlichen Reasoning-Aufgaben deutlich übertrifft und Forschern effektive Werkzeuge für die Literaturrecherche, das experimentelle Design und die Lösung komplexer Probleme in der PSC-Forschung bietet.
English
The rapid advancement of perovskite solar cells (PSCs) has led to an
exponential growth in research publications, creating an urgent need for
efficient knowledge management and reasoning systems in this domain. We present
a comprehensive knowledge-enhanced system for PSCs that integrates three key
components. First, we develop Perovskite-KG, a domain-specific knowledge graph
constructed from 1,517 research papers, containing 23,789 entities and 22,272
relationships. Second, we create two complementary datasets: Perovskite-Chat,
comprising 55,101 high-quality question-answer pairs generated through a novel
multi-agent framework, and Perovskite-Reasoning, containing 2,217 carefully
curated materials science problems. Third, we introduce two specialized large
language models: Perovskite-Chat-LLM for domain-specific knowledge assistance
and Perovskite-Reasoning-LLM for scientific reasoning tasks. Experimental
results demonstrate that our system significantly outperforms existing models
in both domain-specific knowledge retrieval and scientific reasoning tasks,
providing researchers with effective tools for literature review, experimental
design, and complex problem-solving in PSC research.Summary
AI-Generated Summary