ChatPaper.aiChatPaper

Modello Linguistico di Grande Scala per la Scienza: Uno Studio su P vs. NP

Large Language Model for Science: A Study on P vs. NP

September 11, 2023
Autori: Qingxiu Dong, Li Dong, Ke Xu, Guangyan Zhou, Yaru Hao, Zhifang Sui, Furu Wei
cs.AI

Abstract

In questo lavoro, utilizziamo modelli linguistici di grandi dimensioni (LLM) per potenziare e accelerare la ricerca sul problema P versus NP, uno dei problemi aperti più importanti nell'informatica teorica e nella matematica. Nello specifico, proponiamo il ragionamento socratico, un framework generale che promuove un pensiero approfondito con gli LLM per la risoluzione di problemi complessi. Il ragionamento socratico incoraggia gli LLM a scoprire, risolvere e integrare problemi in modo ricorsivo, facilitando al contempo l'autovalutazione e il perfezionamento. Il nostro studio pilota sul problema P vs. NP dimostra che GPT-4 produce con successo uno schema di prova e si impegna in un ragionamento rigoroso attraverso 97 turni di dialogo, concludendo "P ≠ NP", in linea con (Xu e Zhou, 2023). L'indagine rivela nuove intuizioni all'interno dello spazio di soluzione esteso degli LLM, gettando luce sull'uso degli LLM per la scienza.
English
In this work, we use large language models (LLMs) to augment and accelerate research on the P versus NP problem, one of the most important open problems in theoretical computer science and mathematics. Specifically, we propose Socratic reasoning, a general framework that promotes in-depth thinking with LLMs for complex problem-solving. Socratic reasoning encourages LLMs to recursively discover, solve, and integrate problems while facilitating self-evaluation and refinement. Our pilot study on the P vs. NP problem shows that GPT-4 successfully produces a proof schema and engages in rigorous reasoning throughout 97 dialogue turns, concluding "P neq NP", which is in alignment with (Xu and Zhou, 2023). The investigation uncovers novel insights within the extensive solution space of LLMs, shedding light on LLM for Science.
PDF2136February 15, 2026