ChatPaper.aiChatPaper

LIMI: エージェンシーにおける少なさの価値

LIMI: Less is More for Agency

September 22, 2025
著者: Yang Xiao, Mohan Jiang, Jie Sun, Keyu Li, Jifan Lin, Yumin Zhuang, Ji Zeng, Shijie Xia, Qishuo Hua, Xuefeng Li, Xiaojie Cai, Tongyu Wang, Yue Zhang, Liming Liu, Xia Wu, Jinlong Hou, Yuan Cheng, Wenjie Li, Xiang Wang, Dequan Wang, Pengfei Liu
cs.AI

要旨

我々は、エージェンシー(Agency)を、AIシステムが自律エージェントとして機能し、環境やツールとの自己主導的な関わりを通じて、問題を発見し、仮説を立て、解決策を実行するという創発的な能力として定義する。この基本的な能力は、AIエージェンシーの時代の幕開けを示しており、重要な産業の転換点によって推進されている:つまり、単に考えるだけでなく、実際に働くAIシステムの緊急の必要性である。現在のAIは推論や応答生成に優れているが、産業界はタスクを実行し、ツールを操作し、現実世界の成果を生み出す自律エージェントを求めている。エージェント的知能が、認知システムと生産的な労働者を分ける決定的な特徴となるにつれ、機械の自律性を効率的に育成することが最重要課題となる。現在のアプローチでは、言語モデリングの伝統的なスケーリング則に従い、より多くのデータがより良いエージェンシーを生み出すと仮定されている。我々はこのパラダイムに根本的に異議を唱える。LIMI(Less Is More for Intelligent Agency)は、エージェンシーが全く異なる発展原理に従うことを示している。共同ソフトウェア開発と科学研究ワークフローに戦略的に焦点を当てることで、自律行動の最小限だが戦略的に選ばれたデモンストレーションから、洗練されたエージェント的知能が創発することを示す。わずか78の慎重に設計されたトレーニングサンプルを使用して、LIMIは包括的なエージェンシーベンチマークで73.5%を達成し、最先端のモデルを大幅に上回った:Kimi-K2-Instruct(24.1%)、DeepSeek-V3.1(11.9%)、Qwen3-235B-A22B-Instruct(27.5%)、GLM-4.5(45.1%)。最も驚くべきことに、LIMIは10,000サンプルでトレーニングされたモデルよりも53.7%の改善を示し、128分の1のサンプルで優れたエージェント的知能を達成した。我々の研究結果は、エージェンシー効率原則を確立する:機械の自律性は、データの多さではなく、高品質なエージェント的デモンストレーションの戦略的なキュレーションから生まれる。
English
We define Agency as the emergent capacity of AI systems to function as autonomous agents actively discovering problems, formulating hypotheses, and executing solutions through self-directed engagement with environments and tools. This fundamental capability marks the dawn of the Age of AI Agency, driven by a critical industry shift: the urgent need for AI systems that don't just think, but work. While current AI excels at reasoning and generating responses, industries demand autonomous agents that can execute tasks, operate tools, and drive real-world outcomes. As agentic intelligence becomes the defining characteristic separating cognitive systems from productive workers, efficiently cultivating machine autonomy becomes paramount. Current approaches assume that more data yields better agency, following traditional scaling laws from language modeling. We fundamentally challenge this paradigm. LIMI (Less Is More for Intelligent Agency) demonstrates that agency follows radically different development principles. Through strategic focus on collaborative software development and scientific research workflows, we show that sophisticated agentic intelligence can emerge from minimal but strategically curated demonstrations of autonomous behavior. Using only 78 carefully designed training samples, LIMI achieves 73.5% on comprehensive agency benchmarks, dramatically outperforming state-of-the-art models: Kimi-K2-Instruct (24.1%), DeepSeek-V3.1 (11.9%), Qwen3-235B-A22B-Instruct (27.5%), and GLM-4.5 (45.1%). Most strikingly, LIMI demonstrates 53.7% improvement over models trained on 10,000 samples-achieving superior agentic intelligence with 128 times fewer samples. Our findings establish the Agency Efficiency Principle: machine autonomy emerges not from data abundance but from strategic curation of high-quality agentic demonstrations.
PDF944September 23, 2025