Perovskite-LLM: Kennisverrijkte Taalmodellen voor Onderzoek naar Perovskite Zonnecellen
Perovskite-LLM: Knowledge-Enhanced Large Language Models for Perovskite Solar Cell Research
February 18, 2025
Auteurs: Xiang Liu, Penglei Sun, Shuyan Chen, Longhan Zhang, Peijie Dong, Huajie You, Yongqi Zhang, Chang Yan, Xiaowen Chu, Tong-yi Zhang
cs.AI
Samenvatting
De snelle vooruitgang van perovskietzonnecellen (PSCs) heeft geleid tot een exponentiële groei in onderzoekspublicaties, wat een dringende behoefte creëert aan efficiënte kennisbeheer- en redeneersystemen op dit gebied. Wij presenteren een uitgebreid kennisversterkt systeem voor PSCs dat drie belangrijke componenten integreert. Ten eerste ontwikkelen we Perovskite-KG, een domeinspecifieke kennisgrafiek opgebouwd uit 1.517 onderzoeksartikelen, met 23.789 entiteiten en 22.272 relaties. Ten tweede creëren we twee complementaire datasets: Perovskite-Chat, bestaande uit 55.101 hoogwaardige vraag-antwoordparen gegenereerd via een innovatief multi-agent raamwerk, en Perovskite-Reasoning, met 2.217 zorgvuldig samengestelde materiaalwetenschappelijke problemen. Ten derde introduceren we twee gespecialiseerde grote taalmodelen: Perovskite-Chat-LLM voor domeinspecifieke kennisondersteuning en Perovskite-Reasoning-LLM voor wetenschappelijke redeneertaken. Experimentele resultaten tonen aan dat ons systeem aanzienlijk beter presteert dan bestaande modellen in zowel domeinspecifieke kennisretrieval als wetenschappelijke redeneertaken, en onderzoekers effectieve tools biedt voor literatuuronderzoek, experimenteel ontwerp en complexe probleemoplossing in PSC-onderzoek.
English
The rapid advancement of perovskite solar cells (PSCs) has led to an
exponential growth in research publications, creating an urgent need for
efficient knowledge management and reasoning systems in this domain. We present
a comprehensive knowledge-enhanced system for PSCs that integrates three key
components. First, we develop Perovskite-KG, a domain-specific knowledge graph
constructed from 1,517 research papers, containing 23,789 entities and 22,272
relationships. Second, we create two complementary datasets: Perovskite-Chat,
comprising 55,101 high-quality question-answer pairs generated through a novel
multi-agent framework, and Perovskite-Reasoning, containing 2,217 carefully
curated materials science problems. Third, we introduce two specialized large
language models: Perovskite-Chat-LLM for domain-specific knowledge assistance
and Perovskite-Reasoning-LLM for scientific reasoning tasks. Experimental
results demonstrate that our system significantly outperforms existing models
in both domain-specific knowledge retrieval and scientific reasoning tasks,
providing researchers with effective tools for literature review, experimental
design, and complex problem-solving in PSC research.Summary
AI-Generated Summary