ChatPaper.aiChatPaper

Perovskite-LLM: Modelli Linguistici di Grande Dimensione Potenziati con Conoscenza per la Ricerca sulle Celle Solari a Perovskite

Perovskite-LLM: Knowledge-Enhanced Large Language Models for Perovskite Solar Cell Research

February 18, 2025
Autori: Xiang Liu, Penglei Sun, Shuyan Chen, Longhan Zhang, Peijie Dong, Huajie You, Yongqi Zhang, Chang Yan, Xiaowen Chu, Tong-yi Zhang
cs.AI

Abstract

Il rapido progresso delle celle solari a perovskite (PSCs) ha portato a una crescita esponenziale delle pubblicazioni di ricerca, creando un'urgente necessità di sistemi efficienti di gestione della conoscenza e di ragionamento in questo ambito. Presentiamo un sistema completo potenziato dalla conoscenza per le PSCs che integra tre componenti chiave. In primo luogo, sviluppiamo Perovskite-KG, un grafo della conoscenza specifico per il dominio, costruito a partire da 1.517 articoli di ricerca, contenente 23.789 entità e 22.272 relazioni. In secondo luogo, creiamo due dataset complementari: Perovskite-Chat, composto da 55.101 coppie domanda-risposta di alta qualità generate attraverso un innovativo framework multi-agente, e Perovskite-Reasoning, contenente 2.217 problemi di scienza dei materiali accuratamente selezionati. In terzo luogo, introduciamo due modelli linguistici di grandi dimensioni specializzati: Perovskite-Chat-LLM per l'assistenza nella conoscenza specifica del dominio e Perovskite-Reasoning-LLM per i compiti di ragionamento scientifico. I risultati sperimentali dimostrano che il nostro sistema supera significativamente i modelli esistenti sia nel recupero della conoscenza specifica del dominio che nei compiti di ragionamento scientifico, fornendo ai ricercatori strumenti efficaci per la revisione della letteratura, la progettazione di esperimenti e la risoluzione di problemi complessi nella ricerca sulle PSCs.
English
The rapid advancement of perovskite solar cells (PSCs) has led to an exponential growth in research publications, creating an urgent need for efficient knowledge management and reasoning systems in this domain. We present a comprehensive knowledge-enhanced system for PSCs that integrates three key components. First, we develop Perovskite-KG, a domain-specific knowledge graph constructed from 1,517 research papers, containing 23,789 entities and 22,272 relationships. Second, we create two complementary datasets: Perovskite-Chat, comprising 55,101 high-quality question-answer pairs generated through a novel multi-agent framework, and Perovskite-Reasoning, containing 2,217 carefully curated materials science problems. Third, we introduce two specialized large language models: Perovskite-Chat-LLM for domain-specific knowledge assistance and Perovskite-Reasoning-LLM for scientific reasoning tasks. Experimental results demonstrate that our system significantly outperforms existing models in both domain-specific knowledge retrieval and scientific reasoning tasks, providing researchers with effective tools for literature review, experimental design, and complex problem-solving in PSC research.

Summary

AI-Generated Summary

PDF22February 19, 2025