ChatPaper.aiChatPaper

Groot Taalmodel voor Wetenschap: Een Studie over P versus NP

Large Language Model for Science: A Study on P vs. NP

September 11, 2023
Auteurs: Qingxiu Dong, Li Dong, Ke Xu, Guangyan Zhou, Yaru Hao, Zhifang Sui, Furu Wei
cs.AI

Samenvatting

In dit werk gebruiken we grote taalmodellen (LLMs) om onderzoek naar het P versus NP-probleem te versterken en te versnellen, een van de belangrijkste open problemen in de theoretische informatica en wiskunde. Specifiek stellen we Socratisch redeneren voor, een algemeen raamwerk dat diepgaand denken met LLMs bevordert voor complexe probleemoplossing. Socratisch redeneren moedigt LLMs aan om problemen recursief te ontdekken, op te lossen en te integreren, terwijl zelfevaluatie en verfijning worden gefaciliteerd. Onze pilotstudie over het P vs. NP-probleem toont aan dat GPT-4 met succes een bewijsschema produceert en zich gedurende 97 dialoogbeurten bezighoudt met rigoureus redeneren, waarbij het concludeert "P ≠ NP", wat in lijn is met (Xu en Zhou, 2023). Het onderzoek onthult nieuwe inzichten binnen de uitgebreide oplossingsruimte van LLMs, wat licht werpt op het gebruik van LLMs voor wetenschap.
English
In this work, we use large language models (LLMs) to augment and accelerate research on the P versus NP problem, one of the most important open problems in theoretical computer science and mathematics. Specifically, we propose Socratic reasoning, a general framework that promotes in-depth thinking with LLMs for complex problem-solving. Socratic reasoning encourages LLMs to recursively discover, solve, and integrate problems while facilitating self-evaluation and refinement. Our pilot study on the P vs. NP problem shows that GPT-4 successfully produces a proof schema and engages in rigorous reasoning throughout 97 dialogue turns, concluding "P neq NP", which is in alignment with (Xu and Zhou, 2023). The investigation uncovers novel insights within the extensive solution space of LLMs, shedding light on LLM for Science.
PDF2136February 15, 2026