Een Empirische Studie over het Oplossen van Uitdagende Wiskundige Problemen met GPT-4
An Empirical Study on Challenging Math Problem Solving with GPT-4
June 2, 2023
Auteurs: Yiran Wu, Feiran Jia, Shaokun Zhang, Qingyun Wu, Hangyu Li, Erkang Zhu, Yue Wang, Yin Tat Lee, Richard Peng, Chi Wang
cs.AI
Samenvatting
Het inzetten van Large Language Models (LLMs) om wiskundige problemen aan te pakken is een intrigerend onderzoeksgebied, gezien de overvloed aan wiskundige problemen die in natuurlijke taal worden uitgedrukt in tal van wetenschappelijke en technische vakgebieden. Hoewel verschillende eerdere werken het oplossen van elementaire wiskunde met behulp van LLMs hebben onderzocht, verkent dit werk de grens van het gebruik van GPT-4 voor het oplossen van complexere en uitdagendere wiskundige problemen. We evalueren verschillende manieren om GPT-4 te gebruiken. Sommige daarvan zijn aangepast uit bestaand werk, en één daarvan is \MathChat, een conversatieel probleemoplossend framework dat nieuw wordt voorgesteld in dit werk. We voeren de evaluatie uit op moeilijke middelbare schoolcompetitieproblemen uit de MATH-dataset, wat het voordeel van het voorgestelde conversatiele aanpak aantoont.
English
Employing Large Language Models (LLMs) to address mathematical problems is an
intriguing research endeavor, considering the abundance of math problems
expressed in natural language across numerous science and engineering fields.
While several prior works have investigated solving elementary mathematics
using LLMs, this work explores the frontier of using GPT-4 for solving more
complex and challenging math problems. We evaluate various ways of using GPT-4.
Some of them are adapted from existing work, and one is \MathChat, a
conversational problem-solving framework newly proposed in this work. We
perform the evaluation on difficult high school competition problems from the
MATH dataset, which shows the advantage of the proposed conversational
approach.