小型言語モデルはエージェンシックAIの未来である
Small Language Models are the Future of Agentic AI
June 2, 2025
著者: Peter Belcak, Greg Heinrich, Shizhe Diao, Yonggan Fu, Xin Dong, Saurav Muralidharan, Yingyan Celine Lin, Pavlo Molchanov
cs.AI
要旨
大規模言語モデル(LLM)は、幅広いタスクにおいて人間に近い性能を示し、一般的な会話を維持する能力が高く評価されています。しかし、エージェント型AIシステムの台頭により、言語モデルが少数の専門タスクを繰り返し、ほとんど変化なく実行するアプリケーションが大量に出現しています。
ここでは、小規模言語モデル(SLM)が十分に強力であり、本質的に適しており、エージェントシステムにおける多くの呼び出しにおいて必然的に経済的であるため、エージェント型AIの未来であるという立場を提示します。私たちの主張は、SLMが示す現在の能力レベル、エージェントシステムの一般的なアーキテクチャ、および言語モデル展開の経済性に基づいています。さらに、汎用会話能力が不可欠な状況では、異種エージェントシステム(つまり、複数の異なるモデルを呼び出すエージェント)が自然な選択であると主張します。エージェントシステムにおけるSLMの採用に対する潜在的な障壁について議論し、一般的なLLMからSLMへのエージェント変換アルゴリズムの概要を説明します。
私たちの立場は、価値声明として定式化され、LLMからSLMへの部分的シフトがAIエージェント業界に与える運用および経済的影響の重要性を強調しています。AIリソースの効果的な使用に関する議論を刺激し、現在のAIコストを下げる取り組みを進めることを目指しています。私たちの立場に対する貢献と批判の両方を呼びかけ、そのようなすべての対応をhttps://research.nvidia.com/labs/lpr/slm-agentsで公開することを約束します。
English
Large language models (LLMs) are often praised for exhibiting near-human
performance on a wide range of tasks and valued for their ability to hold a
general conversation. The rise of agentic AI systems is, however, ushering in a
mass of applications in which language models perform a small number of
specialized tasks repetitively and with little variation.
Here we lay out the position that small language models (SLMs) are
sufficiently powerful, inherently more suitable, and necessarily more
economical for many invocations in agentic systems, and are therefore the
future of agentic AI. Our argumentation is grounded in the current level of
capabilities exhibited by SLMs, the common architectures of agentic systems,
and the economy of LM deployment. We further argue that in situations where
general-purpose conversational abilities are essential, heterogeneous agentic
systems (i.e., agents invoking multiple different models) are the natural
choice. We discuss the potential barriers for the adoption of SLMs in agentic
systems and outline a general LLM-to-SLM agent conversion algorithm.
Our position, formulated as a value statement, highlights the significance of
the operational and economic impact even a partial shift from LLMs to SLMs is
to have on the AI agent industry. We aim to stimulate the discussion on the
effective use of AI resources and hope to advance the efforts to lower the
costs of AI of the present day. Calling for both contributions to and critique
of our position, we commit to publishing all such correspondence at
https://research.nvidia.com/labs/lpr/slm-agents.