MOCHA: Multiobjektives Chebyshev-Tempern zur Optimierung von Agentenfähigkeiten

Zusammenfassung

LLM-Agenten organisieren ihr Verhalten über Skills – strukturierte, natürlichsprachliche Spezifikationen, die festlegen, wie ein Agent denkt, Informationen abruft und antwortet. Im Gegensatz zu monolithischen Prompts sind Skills mehrfeldrige Artefakte, die harten Plattformbeschränkungen unterliegen: Beschreibungsfelder werden für das Routing gekürzt, Instruktionskörper durch progressive Offenlegung komprimiert, und benachbarte Skills konkurrieren um begrenzte Kontextfenster. Diese Einschränkungen machen die Skill-Optimierung inhärent multiobjektiv: Ein Skill muss gleichzeitig die Aufgabenleistung maximieren und Plattformgrenzen einhalten. Dennoch ignorieren bestehende Prompt-Optimierer diese Zielkonflikte oder bündeln sie in einer gewichteten Summe, wobei Pareto-optimale Varianten in nicht-konvexen Zielregionen übersehen werden. Wir stellen MOCHA (Multi-Objective Chebyshev Annealing) vor, das die Einzelzielselektion durch eine Chebyshev-Skalarisierung ersetzt – die den gesamten Pareto-Frontier einschließlich nicht-konvexer Regionen abdeckt – kombiniert mit exponentiellem Annealing, das von Exploration zu Exploitation übergeht. In unseren Experimenten mit sechs verschiedenen Agenten-Skills – bei denen alle Methoden denselben multiobjektiven Mutationsoperator verwenden und die Basislinien identisches objektweises Textfeedback erhalten – gelingt es bestehenden Optimierern nicht, den Ausgangs-Skill bei 4 von 6 Aufgaben zu verbessern: 1000 Rollouts erzielen keinerlei Fortschritt. MOCHA durchbricht diese Barriere bei jeder Aufgabe und erreicht eine relative Verbesserung der mittleren Korrektheit von 7,5 % gegenüber der stärksten Basislinie (bis zu 14,9 % bei FEVER und 10,4 % bei TheoremQA), während doppelt so viele Pareto-optimale Skill-Varianten entdeckt werden.

English

LLM agents organize behavior through skills - structured natural-language specifications governing how an agent reasons, retrieves, and responds. Unlike monolithic prompts, skills are multi-field artifacts subject to hard platform constraints: description fields are truncated for routing, instruction bodies are compacted via progressive disclosure, and co-resident skills compete for limited context windows. These constraints make skill optimization inherently multi-objective: a skill must simultaneously maximize task performance and satisfy platform limits. Yet existing prompt optimizers either ignore these trade-offs or collapse them into a weighted sum, missing Pareto-optimal variants in non-convex objective regions. We introduce MOCHA (Multi-Objective Chebyshev Annealing), which replaces single-objective selection with Chebyshev scalarization - covering the full Pareto front, including non-convex regions - combined with exponential annealing that transitions from exploration to exploitation. In our experiments across six diverse agent skills - where all methods share the same multi-objective mutation operator and baselines receive identical per-objective textual feedback - existing optimizers fail to improve the seed skill on 4 of 6 tasks: 1000 rollouts yield zero progress. MOCHA breaks through on every task, achieving 7.5% relative improvement in mean correctness over the strongest baseline (up to 14.9% on FEVER and 10.4% on TheoremQA) while discovering twice as many more Pareto-optimal skill variants.