LIMI: Minder is Meer voor Agency
LIMI: Less is More for Agency
September 22, 2025
Auteurs: Yang Xiao, Mohan Jiang, Jie Sun, Keyu Li, Jifan Lin, Yumin Zhuang, Ji Zeng, Shijie Xia, Qishuo Hua, Xuefeng Li, Xiaojie Cai, Tongyu Wang, Yue Zhang, Liming Liu, Xia Wu, Jinlong Hou, Yuan Cheng, Wenjie Li, Xiang Wang, Dequan Wang, Pengfei Liu
cs.AI
Samenvatting
We definiëren Agency als het opkomende vermogen van AI-systemen om te functioneren als autonome agenten die actief problemen ontdekken, hypothesen formuleren en oplossingen uitvoeren door middel van zelfgestuurde interactie met omgevingen en tools. Deze fundamentele capaciteit markeert het begin van het Tijdperk van AI Agency, aangedreven door een kritieke verschuiving in de industrie: de dringende behoefte aan AI-systemen die niet alleen denken, maar ook werken. Hoewel huidige AI uitblinkt in redeneren en het genereren van reacties, eisen industrieën autonome agenten die taken kunnen uitvoeren, tools kunnen bedienen en echte resultaten kunnen behalen. Naarmate agentische intelligentie het bepalende kenmerk wordt dat cognitieve systemen scheidt van productieve werkers, wordt het efficiënt ontwikkelen van machine-autonomie van cruciaal belang. Huidige benaderingen gaan ervan uit dat meer data betere agency oplevert, volgens de traditionele schaalwetten uit taalmodelering. Wij dagen dit paradigma fundamenteel uit. LIMI (Less Is More for Intelligent Agency) toont aan dat agency radicaal andere ontwikkelingsprincipes volgt. Door strategisch te focussen op collaboratieve softwareontwikkeling en wetenschappelijke onderzoeksworkflows, laten we zien dat geavanceerde agentische intelligentie kan ontstaan uit minimale maar strategisch samengestelde demonstraties van autonoom gedrag. Met slechts 78 zorgvuldig ontworpen trainingsvoorbeelden behaalt LIMI 73,5% op uitgebreide agency-benchmarks, wat aanzienlijk beter is dan state-of-the-art modellen: Kimi-K2-Instruct (24,1%), DeepSeek-V3.1 (11,9%), Qwen3-235B-A22B-Instruct (27,5%) en GLM-4.5 (45,1%). Het meest opvallend is dat LIMI een verbetering van 53,7% laat zien ten opzichte van modellen die getraind zijn op 10.000 voorbeelden – en zo superieure agentische intelligentie bereikt met 128 keer minder voorbeelden. Onze bevindingen leggen het Agency Efficiency Principle vast: machine-autonomie ontstaat niet uit een overvloed aan data, maar uit de strategische selectie van hoogwaardige agentische demonstraties.
English
We define Agency as the emergent capacity of AI systems to function as
autonomous agents actively discovering problems, formulating hypotheses, and
executing solutions through self-directed engagement with environments and
tools. This fundamental capability marks the dawn of the Age of AI Agency,
driven by a critical industry shift: the urgent need for AI systems that don't
just think, but work. While current AI excels at reasoning and generating
responses, industries demand autonomous agents that can execute tasks, operate
tools, and drive real-world outcomes. As agentic intelligence becomes the
defining characteristic separating cognitive systems from productive workers,
efficiently cultivating machine autonomy becomes paramount. Current approaches
assume that more data yields better agency, following traditional scaling laws
from language modeling. We fundamentally challenge this paradigm. LIMI (Less Is
More for Intelligent Agency) demonstrates that agency follows radically
different development principles. Through strategic focus on collaborative
software development and scientific research workflows, we show that
sophisticated agentic intelligence can emerge from minimal but strategically
curated demonstrations of autonomous behavior. Using only 78 carefully designed
training samples, LIMI achieves 73.5% on comprehensive agency benchmarks,
dramatically outperforming state-of-the-art models: Kimi-K2-Instruct (24.1%),
DeepSeek-V3.1 (11.9%), Qwen3-235B-A22B-Instruct (27.5%), and GLM-4.5 (45.1%).
Most strikingly, LIMI demonstrates 53.7% improvement over models trained on
10,000 samples-achieving superior agentic intelligence with 128 times fewer
samples. Our findings establish the Agency Efficiency Principle: machine
autonomy emerges not from data abundance but from strategic curation of
high-quality agentic demonstrations.