ProTIP: La Recuperación Progresiva de Herramientas Mejora la Planificación

Resumen

Los modelos de lenguaje de gran escala (LLMs, por sus siglas en inglés) se emplean cada vez más para tareas de planificación complejas de múltiples pasos, donde la recuperación de herramientas (TR, por sus siglas en inglés) es crucial para lograr resultados exitosos. Dos enfoques predominantes para la TR son la recuperación de un solo paso, que utiliza la consulta completa, y la recuperación secuencial mediante descomposición de tareas (TD, por sus siglas en inglés), donde una consulta completa se segmenta en subtareas atómicas discretas. Mientras que la recuperación de un solo paso carece de la flexibilidad para manejar la "dependencia entre herramientas", el enfoque de TD requiere mantener la "alineación atómica entre subtareas y herramientas", ya que el conjunto de herramientas puede evolucionar dinámicamente. Para abordar estas limitaciones, presentamos el marco de Recuperación Progresiva de Herramientas para Mejorar la Planificación (ProTIP, por sus siglas en inglés). ProTIP es un marco ligero basado en aprendizaje contrastivo que realiza implícitamente la TD sin la necesidad explícita de etiquetas de subtareas, manteniendo simultáneamente la atomicidad entre subtareas y herramientas. En el conjunto de datos ToolBench, ProTIP supera notablemente al enfoque basado en descomposición de tareas de ChatGPT, logrando una mejora del 24% en Recall@K=10 para la TR y un aumento del 41% en la precisión de herramientas para la generación de planes.

English

Large language models (LLMs) are increasingly employed for complex multi-step planning tasks, where the tool retrieval (TR) step is crucial for achieving successful outcomes. Two prevalent approaches for TR are single-step retrieval, which utilizes the complete query, and sequential retrieval using task decomposition (TD), where a full query is segmented into discrete atomic subtasks. While single-step retrieval lacks the flexibility to handle "inter-tool dependency," the TD approach necessitates maintaining "subtask-tool atomicity alignment," as the toolbox can evolve dynamically. To address these limitations, we introduce the Progressive Tool retrieval to Improve Planning (ProTIP) framework. ProTIP is a lightweight, contrastive learning-based framework that implicitly performs TD without the explicit requirement of subtask labels, while simultaneously maintaining subtask-tool atomicity. On the ToolBench dataset, ProTIP outperforms the ChatGPT task decomposition-based approach by a remarkable margin, achieving a 24% improvement in Recall@K=10 for TR and a 41% enhancement in tool accuracy for plan generation.

ProTIP: La Recuperación Progresiva de Herramientas Mejora la Planificación

ProTIP: Progressive Tool Retrieval Improves Planning

Resumen

Support