Effiziente Agenten: Entwicklung effektiver Agenten bei gleichzeitiger Kostenreduzierung

papers.abstract

Die bemerkenswerten Fähigkeiten von Large Language Model (LLM)-gesteuerten Agenten haben es fortschrittlichen Systemen ermöglicht, komplexe, mehrstufige Aufgaben zu bewältigen, doch ihre steigenden Kosten gefährden die Skalierbarkeit und Zugänglichkeit. Diese Arbeit präsentiert die erste systematische Studie zum Effizienz-Effektivitäts-Kompromiss in modernen Agentensystemen und adressiert den kritischen Bedarf an kosteneffizienten Designs ohne Leistungseinbußen. Wir untersuchen drei zentrale Fragen: (1) Wie viel Komplexität erfordern agentenbasierte Aufgaben inhärent? (2) Wann führen zusätzliche Module zu abnehmenden Erträgen? (3) Wie viel Effizienz kann durch das Design effizienter Agenten-Frameworks gewonnen werden? Durch eine empirische Analyse auf dem GAIA-Benchmark bewerten wir die Auswirkungen der LLM-Backbone-Auswahl, der Agenten-Framework-Designs und der Skalierungsstrategien zur Testzeit. Mithilfe der Cost-of-Pass-Metrik quantifizieren wir den Effizienz-Leistungs-Kompromiss in diesen Dimensionen. Unsere Erkenntnisse informieren die Entwicklung von Efficient Agents, einem neuartigen Agenten-Framework, das eine optimale Komplexität in Bezug auf die Aufgabenanforderungen aufweist. Efficient Agents behält 96,7 % der Leistung von OWL, einem führenden Open-Source-Agenten-Framework, bei und reduziert gleichzeitig die Betriebskosten von 0,398 auf 0,228, was einer Verbesserung des Cost-of-Pass um 28,4 % entspricht. Unsere Arbeit liefert umsetzbare Erkenntnisse für die Gestaltung effizienter, leistungsstarker Agentensysteme und fördert die Zugänglichkeit und Nachhaltigkeit von KI-gestützten Lösungen.

English

The remarkable capabilities of Large Language Model (LLM)-driven agents have enabled sophisticated systems to tackle complex, multi-step tasks, but their escalating costs threaten scalability and accessibility. This work presents the first systematic study of the efficiency-effectiveness trade-off in modern agent systems, addressing the critical need for cost-effective designs without sacrificing performance. We investigate three key questions: (1) How much complexity do agentic tasks inherently require? (2) When do additional modules yield diminishing returns? (3) How much efficiency can be gained through the design of efficient agent frameworks? Through an empirical analysis on the GAIA benchmark, we evaluate the impact of LLM backbone selection, agent framework designs, and test-time scaling strategies. Using the cost-of-pass metric, we quantify the efficiency-performance trade-off across these dimensions. Our findings inform the development of Efficient Agents , a novel agent framework that has an optimal complexity to task requirements. Efficient Agents retains 96.7% of the performance of OWL, one leading open-source agent framework, while reducing operational costs from 0.398 to 0.228, resulting in a 28.4% improvement in cost-of-pass. Our work provides actionable insights for designing efficient, high-performing agent systems, advancing the accessibility and sustainability of AI-driven solutions.

Effiziente Agenten: Entwicklung effektiver Agenten bei gleichzeitiger Kostenreduzierung

Efficient Agents: Building Effective Agents While Reducing Cost

papers.abstract

Support