ChatPaper.aiChatPaper

HUNYUANPROVER: Un marco escalable de síntesis de datos y búsqueda guiada de árboles para la demostración automática de teoremas

HUNYUANPROVER: A Scalable Data Synthesis Framework and Guided Tree Search for Automated Theorem Proving

December 30, 2024
Autores: Yang Li, Dong Du, Linfeng Song, Chen Li, Weikang Wang, Tao Yang, Haitao Mi
cs.AI

Resumen

Presentamos HunyuanProver, un modelo de lenguaje ajustado finamente a partir del Hunyuan 7B para demostración automática interactiva de teoremas con LEAN4. Para mitigar el problema de la escasez de datos, diseñamos un marco escalable para sintetizar datos de forma iterativa con bajo costo. Además, se diseñaron algoritmos de búsqueda de árbol guiados para habilitar un efectivo "pensamiento del sistema 2" del demostrador. HunyuanProver logra un rendimiento de vanguardia (SOTA) en importantes puntos de referencia. Específicamente, alcanza un 68.4% de aprobación en la miniF2F-test en comparación con el 65.9%, los resultados SOTA actuales. Demuestra 4 declaraciones IMO (imo_1960_p2, imo_1962_p2, imo_1964_p2 e imo_1983_p6) en la miniF2F-test. Para beneficiar a la comunidad, compartiremos de forma abierta un conjunto de datos de 30k instancias sintetizadas, donde cada instancia contiene la pregunta original en lenguaje natural, la declaración convertida por autoformalización y la demostración realizada por HunyuanProver.
English
We introduce HunyuanProver, an language model finetuned from the Hunyuan 7B for interactive automatic theorem proving with LEAN4. To alleviate the data sparsity issue, we design a scalable framework to iterative synthesize data with low cost. Besides, guided tree search algorithms are designed to enable effective ``system 2 thinking`` of the prover. HunyuanProver achieves state-of-the-art (SOTA) performances on major benchmarks. Specifically, it achieves a pass of 68.4% on the miniF2F-test compared to 65.9%, the current SOTA results. It proves 4 IMO statements (imo_1960_p2, imo_1962_p2}, imo_1964_p2 and imo_1983_p6) in miniF2F-test. To benefit the community, we will open-source a dataset of 30k synthesized instances, where each instance contains the original question in natural language, the converted statement by autoformalization, and the proof by HunyuanProver.

Summary

AI-Generated Summary

PDF112January 2, 2025