GPT-4를 활용한 도전적인 수학 문제 해결에 대한 실증적 연구
An Empirical Study on Challenging Math Problem Solving with GPT-4
June 2, 2023
저자: Yiran Wu, Feiran Jia, Shaokun Zhang, Qingyun Wu, Hangyu Li, Erkang Zhu, Yue Wang, Yin Tat Lee, Richard Peng, Chi Wang
cs.AI
초록
대규모 언어 모델(LLMs)을 활용하여 수학 문제를 해결하는 것은 다양한 과학 및 공학 분야에서 자연어로 표현된 수학 문제가 풍부하다는 점을 고려할 때 매우 흥미로운 연구 주제입니다. 기존의 여러 연구들이 LLMs를 사용하여 기초 수학 문제를 해결하는 방법을 탐구했지만, 본 연구에서는 GPT-4를 활용하여 더 복잡하고 도전적인 수학 문제를 해결하는 최전선을 탐구합니다. 우리는 GPT-4를 사용하는 다양한 방법을 평가하며, 그 중 일부는 기존 연구에서 차용한 것이고, 하나는 본 연구에서 새롭게 제안한 대화형 문제 해결 프레임워크인 \MathChat입니다. 우리는 MATH 데이터셋의 고등학교 수학 경시대회 문제를 대상으로 평가를 수행하며, 이를 통해 제안된 대화형 접근법의 장점을 보여줍니다.
English
Employing Large Language Models (LLMs) to address mathematical problems is an
intriguing research endeavor, considering the abundance of math problems
expressed in natural language across numerous science and engineering fields.
While several prior works have investigated solving elementary mathematics
using LLMs, this work explores the frontier of using GPT-4 for solving more
complex and challenging math problems. We evaluate various ways of using GPT-4.
Some of them are adapted from existing work, and one is \MathChat, a
conversational problem-solving framework newly proposed in this work. We
perform the evaluation on difficult high school competition problems from the
MATH dataset, which shows the advantage of the proposed conversational
approach.