Modelos de Linguagem de Grande Escala como Criadores de Ferramentas
Large Language Models as Tool Makers
May 26, 2023
Autores: Tianle Cai, Xuezhi Wang, Tengyu Ma, Xinyun Chen, Denny Zhou
cs.AI
Resumo
Pesquisas recentes mostram o potencial de aprimorar a capacidade de resolução de problemas de grandes modelos de linguagem (LLMs) por meio do uso de ferramentas externas. No entanto, trabalhos anteriores nessa linha dependem da disponibilidade de ferramentas existentes. Neste trabalho, damos um passo inicial para remover essa dependência propondo uma estrutura de loop fechado, denominada LLMs As Tool Makers (LATM), na qual os LLMs criam suas próprias ferramentas reutilizáveis para a resolução de problemas. Nossa abordagem consiste em duas fases principais: 1) criação de ferramentas: um LLM atua como o criador de ferramentas que desenvolve ferramentas para tarefas específicas, onde uma ferramenta é implementada como uma função utilitária em Python. 2) uso de ferramentas: um LLM atua como o usuário da ferramenta, aplicando a ferramenta construída pelo criador para resolver problemas. O usuário da ferramenta pode ser o mesmo LLM ou um LLM diferente do criador. A criação de ferramentas permite que um LLM gere continuamente ferramentas que podem ser aplicadas a diferentes solicitações, de modo que futuras solicitações possam chamar as APIs correspondentes quando for benéfico para resolver as tarefas. Além disso, a divisão de trabalho entre LLMs para as fases de criação e uso de ferramentas introduz a oportunidade de alcançar eficiência de custos sem degradar a qualidade das ferramentas geradas e das soluções de problemas. Por exemplo, reconhecendo que a criação de ferramentas exige capacidades mais sofisticadas do que o uso de ferramentas, podemos aplicar um modelo poderoso, porém intensivo em recursos, como o criador de ferramentas, e um modelo leve e econômico como o usuário da ferramenta. Validamos a eficácia de nossa abordagem em uma variedade de tarefas complexas de raciocínio, incluindo tarefas do Big-Bench. Com o GPT-4 como criador de ferramentas e o GPT-3.5 como usuário da ferramenta, o LATM pode alcançar um desempenho equivalente ao uso do GPT-4 para ambas as fases, enquanto o custo de inferência é significativamente reduzido.
English
Recent research shows the potential of enhancing the problem-solving ability
of large language models (LLMs) through the use of external tools. However,
prior work along this line depends on the availability of existing tools. In
this work, we take an initial step towards removing this dependency by
proposing a closed-loop framework, referred to as LLMs As Tool Makers (LATM),
where LLMs create their own reusable tools for problem-solving. Our approach
consists of two key phases: 1) tool making: an LLM acts as the tool maker that
crafts tools for given tasks, where a tool is implemented as a Python utility
function. 2) tool using: an LLM acts as the tool user, which applies the tool
built by the tool maker for problem-solving. The tool user can be either the
same or a different LLM from the tool maker. Tool-making enables an LLM to
continually generate tools that can be applied to different requests so that
future requests can call the corresponding APIs when beneficial for solving the
tasks. Furthermore, the division of labor among LLMs for tool-making and
tool-using phases introduces the opportunity to achieve cost effectiveness
without degrading the quality of generated tools and problem solutions. For
example, recognizing that tool-making demands more sophisticated capabilities
than tool-using, we can apply a powerful yet resource-intensive model as the
tool maker, and a lightweight while cost-effective model as the tool user. We
validate the effectiveness of our approach across a variety of complex
reasoning tasks, including Big-Bench tasks. With GPT-4 as the tool maker and
GPT-3.5 as the tool user, LATM can achieve performance that is on par with
using GPT-4 for both tool making and tool using, while the inference cost is
significantly reduced.