LIMI: Weniger ist mehr für Handlungsfähigkeit
LIMI: Less is More for Agency
September 22, 2025
papers.authors: Yang Xiao, Mohan Jiang, Jie Sun, Keyu Li, Jifan Lin, Yumin Zhuang, Ji Zeng, Shijie Xia, Qishuo Hua, Xuefeng Li, Xiaojie Cai, Tongyu Wang, Yue Zhang, Liming Liu, Xia Wu, Jinlong Hou, Yuan Cheng, Wenjie Li, Xiang Wang, Dequan Wang, Pengfei Liu
cs.AI
papers.abstract
Wir definieren Agency als die emergente Fähigkeit von KI-Systemen, als autonome Agenten zu fungieren, die aktiv Probleme entdecken, Hypothesen formulieren und Lösungen durch selbstgesteuertes Engagement mit Umgebungen und Werkzeugen ausführen. Diese grundlegende Fähigkeit markiert den Beginn des Zeitalters der KI-Agency, angetrieben durch einen kritischen Branchenwandel: den dringenden Bedarf an KI-Systemen, die nicht nur denken, sondern auch arbeiten. Während aktuelle KI in der Argumentation und der Generierung von Antworten hervorragt ist, fordern Branchen autonome Agenten, die Aufgaben ausführen, Werkzeuge bedienen und reale Ergebnisse erzielen können. Da agentische Intelligenz zum entscheidenden Merkmal wird, das kognitive Systeme von produktiven Arbeitskräften trennt, wird die effiziente Entwicklung von Maschinenautonomie von größter Bedeutung. Aktuelle Ansätze gehen davon aus, dass mehr Daten zu besserer Agency führen, gemäß den traditionellen Skalierungsgesetzen des Sprachmodellierens. Wir stellen dieses Paradigma grundlegend in Frage. LIMI (Less Is More for Intelligent Agency) zeigt, dass Agency radikal anderen Entwicklungsprinzipien folgt. Durch strategische Konzentration auf kollaborative Softwareentwicklung und wissenschaftliche Forschungsabläufe demonstrieren wir, dass anspruchsvolle agentische Intelligenz aus minimalen, aber strategisch kuratierten Demonstrationen autonomen Verhaltens entstehen kann. Mit nur 78 sorgfältig gestalteten Trainingsbeispielen erreicht LIMI 73,5 % auf umfassenden Agency-Benchmarks und übertrifft damit die aktuellsten Modelle deutlich: Kimi-K2-Instruct (24,1 %), DeepSeek-V3.1 (11,9 %), Qwen3-235B-A22B-Instruct (27,5 %) und GLM-4.5 (45,1 %). Am bemerkenswertesten ist, dass LIMI eine Verbesserung von 53,7 % gegenüber Modellen zeigt, die mit 10.000 Beispielen trainiert wurden – und damit überlegene agentische Intelligenz mit 128-mal weniger Beispielen erreicht. Unsere Ergebnisse etablieren das Agency-Effizienz-Prinzip: Maschinenautonomie entsteht nicht aus Datenfülle, sondern aus der strategischen Kuratierung hochwertiger agentischer Demonstrationen.
English
We define Agency as the emergent capacity of AI systems to function as
autonomous agents actively discovering problems, formulating hypotheses, and
executing solutions through self-directed engagement with environments and
tools. This fundamental capability marks the dawn of the Age of AI Agency,
driven by a critical industry shift: the urgent need for AI systems that don't
just think, but work. While current AI excels at reasoning and generating
responses, industries demand autonomous agents that can execute tasks, operate
tools, and drive real-world outcomes. As agentic intelligence becomes the
defining characteristic separating cognitive systems from productive workers,
efficiently cultivating machine autonomy becomes paramount. Current approaches
assume that more data yields better agency, following traditional scaling laws
from language modeling. We fundamentally challenge this paradigm. LIMI (Less Is
More for Intelligent Agency) demonstrates that agency follows radically
different development principles. Through strategic focus on collaborative
software development and scientific research workflows, we show that
sophisticated agentic intelligence can emerge from minimal but strategically
curated demonstrations of autonomous behavior. Using only 78 carefully designed
training samples, LIMI achieves 73.5% on comprehensive agency benchmarks,
dramatically outperforming state-of-the-art models: Kimi-K2-Instruct (24.1%),
DeepSeek-V3.1 (11.9%), Qwen3-235B-A22B-Instruct (27.5%), and GLM-4.5 (45.1%).
Most strikingly, LIMI demonstrates 53.7% improvement over models trained on
10,000 samples-achieving superior agentic intelligence with 128 times fewer
samples. Our findings establish the Agency Efficiency Principle: machine
autonomy emerges not from data abundance but from strategic curation of
high-quality agentic demonstrations.