ChatPaper.aiChatPaper

Perovskite-LLM: Kennisverrijkte Taalmodellen voor Onderzoek naar Perovskite Zonnecellen

Perovskite-LLM: Knowledge-Enhanced Large Language Models for Perovskite Solar Cell Research

February 18, 2025
Auteurs: Xiang Liu, Penglei Sun, Shuyan Chen, Longhan Zhang, Peijie Dong, Huajie You, Yongqi Zhang, Chang Yan, Xiaowen Chu, Tong-yi Zhang
cs.AI

Samenvatting

De snelle vooruitgang van perovskietzonnecellen (PSCs) heeft geleid tot een exponentiële groei in onderzoekspublicaties, wat een dringende behoefte creëert aan efficiënte kennisbeheer- en redeneersystemen op dit gebied. Wij presenteren een uitgebreid kennisversterkt systeem voor PSCs dat drie belangrijke componenten integreert. Ten eerste ontwikkelen we Perovskite-KG, een domeinspecifieke kennisgrafiek opgebouwd uit 1.517 onderzoeksartikelen, met 23.789 entiteiten en 22.272 relaties. Ten tweede creëren we twee complementaire datasets: Perovskite-Chat, bestaande uit 55.101 hoogwaardige vraag-antwoordparen gegenereerd via een innovatief multi-agent raamwerk, en Perovskite-Reasoning, met 2.217 zorgvuldig samengestelde materiaalwetenschappelijke problemen. Ten derde introduceren we twee gespecialiseerde grote taalmodelen: Perovskite-Chat-LLM voor domeinspecifieke kennisondersteuning en Perovskite-Reasoning-LLM voor wetenschappelijke redeneertaken. Experimentele resultaten tonen aan dat ons systeem aanzienlijk beter presteert dan bestaande modellen in zowel domeinspecifieke kennisretrieval als wetenschappelijke redeneertaken, en onderzoekers effectieve tools biedt voor literatuuronderzoek, experimenteel ontwerp en complexe probleemoplossing in PSC-onderzoek.
English
The rapid advancement of perovskite solar cells (PSCs) has led to an exponential growth in research publications, creating an urgent need for efficient knowledge management and reasoning systems in this domain. We present a comprehensive knowledge-enhanced system for PSCs that integrates three key components. First, we develop Perovskite-KG, a domain-specific knowledge graph constructed from 1,517 research papers, containing 23,789 entities and 22,272 relationships. Second, we create two complementary datasets: Perovskite-Chat, comprising 55,101 high-quality question-answer pairs generated through a novel multi-agent framework, and Perovskite-Reasoning, containing 2,217 carefully curated materials science problems. Third, we introduce two specialized large language models: Perovskite-Chat-LLM for domain-specific knowledge assistance and Perovskite-Reasoning-LLM for scientific reasoning tasks. Experimental results demonstrate that our system significantly outperforms existing models in both domain-specific knowledge retrieval and scientific reasoning tasks, providing researchers with effective tools for literature review, experimental design, and complex problem-solving in PSC research.

Summary

AI-Generated Summary

PDF22February 19, 2025