LIMI: 에이전시를 위한 '적은 것이 더 많다'
LIMI: Less is More for Agency
September 22, 2025
저자: Yang Xiao, Mohan Jiang, Jie Sun, Keyu Li, Jifan Lin, Yumin Zhuang, Ji Zeng, Shijie Xia, Qishuo Hua, Xuefeng Li, Xiaojie Cai, Tongyu Wang, Yue Zhang, Liming Liu, Xia Wu, Jinlong Hou, Yuan Cheng, Wenjie Li, Xiang Wang, Dequan Wang, Pengfei Liu
cs.AI
초록
우리는 에이전시(Agency)를 AI 시스템이 환경과 도구와의 자율적 상호작용을 통해 능동적으로 문제를 발견하고, 가설을 수립하며, 해결책을 실행하는 자율 에이전트로서 기능하는 창발적 능력으로 정의합니다. 이 근본적인 능력은 AI 에이전시 시대의 시작을 알리는 것으로, 단순히 사고하는 것이 아니라 실제로 작업을 수행할 수 있는 AI 시스템에 대한 산업계의 긴급한 요구에 의해 주도되고 있습니다. 현재의 AI는 추론과 응답 생성에서 뛰어난 성능을 보이지만, 산업계는 작업을 실행하고 도구를 조작하며 현실 세계의 결과를 이끌어낼 수 있는 자율 에이전트를 요구하고 있습니다. 에이전트 지능이 인지 시스템과 생산적 작업자 간의 차이를 정의하는 특성이 되면서, 기계 자율성을 효율적으로 육성하는 것이 최우선 과제가 되었습니다. 현재의 접근 방식은 언어 모델링의 전통적인 스케일링 법칙을 따라 더 많은 데이터가 더 나은 에이전시를 가져온다고 가정합니다. 우리는 이 패러다임에 근본적으로 도전합니다. LIMI(Less Is More for Intelligent Agency)는 에이전시가 근본적으로 다른 개발 원칙을 따름을 보여줍니다. 협업 소프트웨어 개발 및 과학 연구 워크플로우에 대한 전략적 초점을 통해, 우리는 최소한이지만 전략적으로 선별된 자율 행동 시연에서 정교한 에이전트 지능이 창발할 수 있음을 입증합니다. 단 78개의 신중하게 설계된 훈련 샘플만을 사용하여, LIMI는 포괄적인 에이전시 벤치마크에서 73.5%를 달성하며, 최첨단 모델들을 크게 앞섭니다: Kimi-K2-Instruct(24.1%), DeepSeek-V3.1(11.9%), Qwen3-235B-A22B-Instruct(27.5%), GLM-4.5(45.1%). 가장 놀라운 점은, LIMI는 10,000개의 샘플로 훈련된 모델들보다 53.7% 더 나은 성능을 보이며, 128배 적은 샘플로 우수한 에이전트 지능을 달성했습니다. 우리의 연구 결과는 에이전시 효율성 원칙(Agency Efficiency Principle)을 확립합니다: 기계 자율성은 데이터의 풍부함이 아니라 고품질 에이전시 시연의 전략적 선별에서 창발합니다.
English
We define Agency as the emergent capacity of AI systems to function as
autonomous agents actively discovering problems, formulating hypotheses, and
executing solutions through self-directed engagement with environments and
tools. This fundamental capability marks the dawn of the Age of AI Agency,
driven by a critical industry shift: the urgent need for AI systems that don't
just think, but work. While current AI excels at reasoning and generating
responses, industries demand autonomous agents that can execute tasks, operate
tools, and drive real-world outcomes. As agentic intelligence becomes the
defining characteristic separating cognitive systems from productive workers,
efficiently cultivating machine autonomy becomes paramount. Current approaches
assume that more data yields better agency, following traditional scaling laws
from language modeling. We fundamentally challenge this paradigm. LIMI (Less Is
More for Intelligent Agency) demonstrates that agency follows radically
different development principles. Through strategic focus on collaborative
software development and scientific research workflows, we show that
sophisticated agentic intelligence can emerge from minimal but strategically
curated demonstrations of autonomous behavior. Using only 78 carefully designed
training samples, LIMI achieves 73.5% on comprehensive agency benchmarks,
dramatically outperforming state-of-the-art models: Kimi-K2-Instruct (24.1%),
DeepSeek-V3.1 (11.9%), Qwen3-235B-A22B-Instruct (27.5%), and GLM-4.5 (45.1%).
Most strikingly, LIMI demonstrates 53.7% improvement over models trained on
10,000 samples-achieving superior agentic intelligence with 128 times fewer
samples. Our findings establish the Agency Efficiency Principle: machine
autonomy emerges not from data abundance but from strategic curation of
high-quality agentic demonstrations.