Uno Studio Empirico sulla Risoluzione di Problemi Matematici Complessi con GPT-4

Abstract

L'impiego di Large Language Models (LLM) per affrontare problemi matematici rappresenta un'area di ricerca affascinante, considerando l'abbondanza di problemi matematici espressi in linguaggio naturale in numerosi campi scientifici e ingegneristici. Mentre diversi lavori precedenti hanno esplorato la risoluzione di matematica elementare utilizzando LLM, questo studio si spinge verso la frontiera dell'uso di GPT-4 per risolvere problemi matematici più complessi e impegnativi. Valutiamo vari approcci per utilizzare GPT-4, alcuni dei quali adattati da lavori esistenti, e uno è \MathChat, un framework conversazionale per la risoluzione di problemi proposto per la prima volta in questo lavoro. Eseguiamo la valutazione su problemi difficili tratti da competizioni scolastiche del dataset MATH, dimostrando il vantaggio dell'approccio conversazionale proposto.

English

Employing Large Language Models (LLMs) to address mathematical problems is an intriguing research endeavor, considering the abundance of math problems expressed in natural language across numerous science and engineering fields. While several prior works have investigated solving elementary mathematics using LLMs, this work explores the frontier of using GPT-4 for solving more complex and challenging math problems. We evaluate various ways of using GPT-4. Some of them are adapted from existing work, and one is \MathChat, a conversational problem-solving framework newly proposed in this work. We perform the evaluation on difficult high school competition problems from the MATH dataset, which shows the advantage of the proposed conversational approach.

Uno Studio Empirico sulla Risoluzione di Problemi Matematici Complessi con GPT-4

An Empirical Study on Challenging Math Problem Solving with GPT-4

Abstract

Support