ChatPaper.aiChatPaper

Modelo de Linguagem de Grande Escala para Ciência: Um Estudo sobre P versus NP

Large Language Model for Science: A Study on P vs. NP

September 11, 2023
Autores: Qingxiu Dong, Li Dong, Ke Xu, Guangyan Zhou, Yaru Hao, Zhifang Sui, Furu Wei
cs.AI

Resumo

Neste trabalho, utilizamos modelos de linguagem de grande escala (LLMs) para ampliar e acelerar a pesquisa sobre o problema P versus NP, um dos problemas em aberto mais importantes na ciência da computação teórica e na matemática. Especificamente, propomos o raciocínio socrático, um framework geral que promove o pensamento aprofundado com LLMs para a resolução de problemas complexos. O raciocínio socrático incentiva os LLMs a descobrir, resolver e integrar problemas de forma recursiva, ao mesmo tempo que facilita a autoavaliação e o refinamento. Nosso estudo piloto sobre o problema P vs. NP mostra que o GPT-4 produz com sucesso um esquema de prova e se envolve em raciocínios rigorosos ao longo de 97 turnos de diálogo, concluindo que "P ≠ NP", o que está alinhado com (Xu e Zhou, 2023). A investigação revela novos insights dentro do extenso espaço de soluções dos LLMs, lançando luz sobre o uso de LLMs para a Ciência.
English
In this work, we use large language models (LLMs) to augment and accelerate research on the P versus NP problem, one of the most important open problems in theoretical computer science and mathematics. Specifically, we propose Socratic reasoning, a general framework that promotes in-depth thinking with LLMs for complex problem-solving. Socratic reasoning encourages LLMs to recursively discover, solve, and integrate problems while facilitating self-evaluation and refinement. Our pilot study on the P vs. NP problem shows that GPT-4 successfully produces a proof schema and engages in rigorous reasoning throughout 97 dialogue turns, concluding "P neq NP", which is in alignment with (Xu and Zhou, 2023). The investigation uncovers novel insights within the extensive solution space of LLMs, shedding light on LLM for Science.
PDF2136February 15, 2026