Perovskite-LLM: Modelli Linguistici di Grande Dimensione Potenziati con Conoscenza per la Ricerca sulle Celle Solari a Perovskite
Perovskite-LLM: Knowledge-Enhanced Large Language Models for Perovskite Solar Cell Research
February 18, 2025
Autori: Xiang Liu, Penglei Sun, Shuyan Chen, Longhan Zhang, Peijie Dong, Huajie You, Yongqi Zhang, Chang Yan, Xiaowen Chu, Tong-yi Zhang
cs.AI
Abstract
Il rapido progresso delle celle solari a perovskite (PSCs) ha portato a una crescita esponenziale delle pubblicazioni di ricerca, creando un'urgente necessità di sistemi efficienti di gestione della conoscenza e di ragionamento in questo ambito. Presentiamo un sistema completo potenziato dalla conoscenza per le PSCs che integra tre componenti chiave. In primo luogo, sviluppiamo Perovskite-KG, un grafo della conoscenza specifico per il dominio, costruito a partire da 1.517 articoli di ricerca, contenente 23.789 entità e 22.272 relazioni. In secondo luogo, creiamo due dataset complementari: Perovskite-Chat, composto da 55.101 coppie domanda-risposta di alta qualità generate attraverso un innovativo framework multi-agente, e Perovskite-Reasoning, contenente 2.217 problemi di scienza dei materiali accuratamente selezionati. In terzo luogo, introduciamo due modelli linguistici di grandi dimensioni specializzati: Perovskite-Chat-LLM per l'assistenza nella conoscenza specifica del dominio e Perovskite-Reasoning-LLM per i compiti di ragionamento scientifico. I risultati sperimentali dimostrano che il nostro sistema supera significativamente i modelli esistenti sia nel recupero della conoscenza specifica del dominio che nei compiti di ragionamento scientifico, fornendo ai ricercatori strumenti efficaci per la revisione della letteratura, la progettazione di esperimenti e la risoluzione di problemi complessi nella ricerca sulle PSCs.
English
The rapid advancement of perovskite solar cells (PSCs) has led to an
exponential growth in research publications, creating an urgent need for
efficient knowledge management and reasoning systems in this domain. We present
a comprehensive knowledge-enhanced system for PSCs that integrates three key
components. First, we develop Perovskite-KG, a domain-specific knowledge graph
constructed from 1,517 research papers, containing 23,789 entities and 22,272
relationships. Second, we create two complementary datasets: Perovskite-Chat,
comprising 55,101 high-quality question-answer pairs generated through a novel
multi-agent framework, and Perovskite-Reasoning, containing 2,217 carefully
curated materials science problems. Third, we introduce two specialized large
language models: Perovskite-Chat-LLM for domain-specific knowledge assistance
and Perovskite-Reasoning-LLM for scientific reasoning tasks. Experimental
results demonstrate that our system significantly outperforms existing models
in both domain-specific knowledge retrieval and scientific reasoning tasks,
providing researchers with effective tools for literature review, experimental
design, and complex problem-solving in PSC research.Summary
AI-Generated Summary