ADaPT: Bedarfsgerechte Zerlegung und Planung mit Sprachmodellen
ADaPT: As-Needed Decomposition and Planning with Language Models
November 8, 2023
Autoren: Archiki Prasad, Alexander Koller, Mareike Hartmann, Peter Clark, Ashish Sabharwal, Mohit Bansal, Tushar Khot
cs.AI
Zusammenfassung
Große Sprachmodelle (LLMs) werden zunehmend für interaktive Entscheidungsfindungsaufgaben eingesetzt, die Planung und Anpassung an die Umgebung erfordern. Aktuelle Arbeiten verwenden LLMs als Agenten im Wesentlichen auf zwei Arten: iteratives Bestimmen der nächsten Aktion (iterative Executoren) oder das Generieren von Plänen und das Ausführen von Teilaufgaben mithilfe von LLMs (Plan-and-Execute). Diese Methoden stoßen jedoch bei der Bewältigung von Aufgabenkomplexität an Grenzen, da die Unfähigkeit, eine Teilaufgabe auszuführen, zum Scheitern der gesamten Aufgabe führen kann. Um diese Schwächen zu beheben, stellen wir As-Needed Decomposition and Planning for Complex Tasks (ADaPT) vor, einen Ansatz, der komplexe Teilaufgaben explizit plant und bei Bedarf, d. h. wenn das LLM sie nicht ausführen kann, zerlegt. ADaPT zerlegt Teilaufgaben rekursiv, um sich sowohl an die Aufgabenkomplexität als auch an die Fähigkeiten des LLMs anzupassen. Unsere Ergebnisse zeigen, dass ADaPT etablierte starke Baselines deutlich übertrifft und Erfolgsraten von bis zu 28,3 % höher in ALFWorld, 27 % in WebShop und 33 % in TextCraft – einem neu eingeführten kompositionellen Datensatz – erreicht. Durch umfangreiche Analysen verdeutlichen wir die Bedeutung der mehrstufigen Zerlegung und zeigen, dass ADaPT sich dynamisch an die Fähigkeiten des ausführenden LLMs sowie an die Aufgabenkomplexität anpasst.
English
Large Language Models (LLMs) are increasingly being used for interactive
decision-making tasks requiring planning and adapting to the environment.
Recent works employ LLMs-as-agents in broadly two ways: iteratively determining
the next action (iterative executors) or generating plans and executing
sub-tasks using LLMs (plan-and-execute). However, these methods struggle with
task complexity, as the inability to execute any sub-task may lead to task
failure. To address these shortcomings, we introduce As-Needed Decomposition
and Planning for complex Tasks (ADaPT), an approach that explicitly plans and
decomposes complex sub-tasks as-needed, i.e., when the LLM is unable to execute
them. ADaPT recursively decomposes sub-tasks to adapt to both task complexity
and LLM capability. Our results demonstrate that ADaPT substantially
outperforms established strong baselines, achieving success rates up to 28.3%
higher in ALFWorld, 27% in WebShop, and 33% in TextCraft -- a novel
compositional dataset that we introduce. Through extensive analysis, we
illustrate the importance of multilevel decomposition and establish that ADaPT
dynamically adjusts to the capabilities of the executor LLM as well as to task
complexity.