ALPINE:揭示自回归学习在语言模型中的规划能力ALPINE: Unveiling the Planning Capability of Autoregressive Learning in
Language Models
本文介绍了我们的ALPINE项目的研究结果,ALPINE代表“Autoregressive Learning for Planning In NEtworks”。ALPINE项目通过自回归学习机制对基于Transformer的语言模型中规划能力的发展进行了理论研究,旨在识别它们规划能力中的潜在限制。我们将规划抽象为一项网络路径查找任务,其目标是从指定的源节点生成到指定目标节点的有效路径。在表达能力方面,我们展示了Transformer能够通过将邻接矩阵和可达性矩阵嵌入其权重中来执行路径查找。我们对Transformer基于梯度的学习动态进行的理论分析揭示了Transformer能够学习邻接矩阵和有限形式的可达性矩阵。这些理论观点随后通过实验证实,实验证明Transformer确实学习了邻接矩阵和不完整的可达性矩阵,这与我们理论分析中的预测一致。此外,当将我们的方法应用于名为Blocksworld的现实世界规划基准时,我们的观察结果保持一致。我们的理论和实证分析进一步揭示了Transformer在路径查找中的潜在限制:它无法通过传递性识别可达性关系,因此在需要路径串联生成路径时会失败。总之,我们的研究结果揭示了自回归学习的内部机制如何实现网络规划。这项研究可能有助于我们了解其他相关领域的一般规划能力。