LIMI: Меньше — значит больше для агентности
LIMI: Less is More for Agency
September 22, 2025
Авторы: Yang Xiao, Mohan Jiang, Jie Sun, Keyu Li, Jifan Lin, Yumin Zhuang, Ji Zeng, Shijie Xia, Qishuo Hua, Xuefeng Li, Xiaojie Cai, Tongyu Wang, Yue Zhang, Liming Liu, Xia Wu, Jinlong Hou, Yuan Cheng, Wenjie Li, Xiang Wang, Dequan Wang, Pengfei Liu
cs.AI
Аннотация
Мы определяем Агентность как возникающую способность ИИ-систем функционировать в качестве автономных агентов, активно выявляющих проблемы, формулирующих гипотезы и реализующих решения через самостоятельное взаимодействие с окружением и инструментами. Эта фундаментальная способность знаменует начало Эпохи Агентности ИИ, движимой критическим сдвигом в индустрии: острой потребностью в ИИ-системах, которые не просто думают, но и работают. В то время как современный ИИ преуспевает в рассуждениях и генерации ответов, отрасли требуют автономных агентов, способных выполнять задачи, управлять инструментами и достигать реальных результатов. По мере того как агентный интеллект становится определяющей характеристикой, отделяющей когнитивные системы от продуктивных работников, эффективное развитие машинной автономии становится первостепенным. Современные подходы предполагают, что больше данных приводит к лучшей агентности, следуя традиционным законам масштабирования из области языкового моделирования. Мы принципиально оспариваем эту парадигму. LIMI (Less Is More for Intelligent Agency) демонстрирует, что агентность следует радикально иным принципам развития. Благодаря стратегической фокусировке на совместной разработке программного обеспечения и научно-исследовательских процессах, мы показываем, что сложный агентный интеллект может возникать из минимальных, но стратегически отобранных демонстраций автономного поведения. Используя всего 78 тщательно разработанных обучающих примеров, LIMI достигает 73,5% на комплексных тестах агентности, значительно превосходя современные модели: Kimi-K2-Instruct (24,1%), DeepSeek-V3.1 (11,9%), Qwen3-235B-A22B-Instruct (27,5%) и GLM-4.5 (45,1%). Наиболее поразительно, что LIMI демонстрирует улучшение на 53,7% по сравнению с моделями, обученными на 10 000 примеров, достигая превосходного агентного интеллекта при использовании в 128 раз меньшего количества данных. Наши результаты устанавливают Принцип Эффективности Агентности: машинная автономия возникает не из изобилия данных, а из стратегического отбора высококачественных демонстраций агентного поведения.
English
We define Agency as the emergent capacity of AI systems to function as
autonomous agents actively discovering problems, formulating hypotheses, and
executing solutions through self-directed engagement with environments and
tools. This fundamental capability marks the dawn of the Age of AI Agency,
driven by a critical industry shift: the urgent need for AI systems that don't
just think, but work. While current AI excels at reasoning and generating
responses, industries demand autonomous agents that can execute tasks, operate
tools, and drive real-world outcomes. As agentic intelligence becomes the
defining characteristic separating cognitive systems from productive workers,
efficiently cultivating machine autonomy becomes paramount. Current approaches
assume that more data yields better agency, following traditional scaling laws
from language modeling. We fundamentally challenge this paradigm. LIMI (Less Is
More for Intelligent Agency) demonstrates that agency follows radically
different development principles. Through strategic focus on collaborative
software development and scientific research workflows, we show that
sophisticated agentic intelligence can emerge from minimal but strategically
curated demonstrations of autonomous behavior. Using only 78 carefully designed
training samples, LIMI achieves 73.5% on comprehensive agency benchmarks,
dramatically outperforming state-of-the-art models: Kimi-K2-Instruct (24.1%),
DeepSeek-V3.1 (11.9%), Qwen3-235B-A22B-Instruct (27.5%), and GLM-4.5 (45.1%).
Most strikingly, LIMI demonstrates 53.7% improvement over models trained on
10,000 samples-achieving superior agentic intelligence with 128 times fewer
samples. Our findings establish the Agency Efficiency Principle: machine
autonomy emerges not from data abundance but from strategic curation of
high-quality agentic demonstrations.