ALPINE : Révéler la capacité de planification dans l'apprentissage autorégressif des modèles de langageALPINE: Unveiling the Planning Capability of Autoregressive Learning in
Language Models
Dans cet article, nous présentons les résultats de notre projet ALPINE, qui signifie « Apprentissage Autoregressif pour la Planification dans les Réseaux ». Le projet ALPINE initie une investigation théorique sur le développement des capacités de planification dans les modèles de langage basés sur les Transformateurs, à travers leurs mécanismes d'apprentissage autoregressif, dans le but d'identifier d'éventuelles limitations dans leurs aptitudes à planifier. Nous modélisons la planification comme une tâche de recherche de chemin dans un réseau, où l'objectif est de générer un chemin valide d'un nœud source spécifié à un nœud cible désigné. En termes d'expressivité, nous montrons que le Transformer est capable d'exécuter la recherche de chemin en intégrant les matrices d'adjacence et d'accessibilité dans ses poids. Notre analyse théorique de la dynamique d'apprentissage basée sur les gradients du Transformer révèle que celui-ci est capable d'apprendre à la fois la matrice d'adjacence et une forme limitée de la matrice d'accessibilité. Ces insights théoriques sont ensuite validés par des expériences, qui démontrent que le Transformer apprend effectivement la matrice d'adjacence et une matrice d'accessibilité incomplète, ce qui correspond aux prédictions de notre analyse théorique. De plus, lorsque nous appliquons notre méthodologie à un benchmark de planification du monde réel, appelé Blocksworld, nos observations restent cohérentes. Nos analyses théoriques et empiriques révèlent également une limitation potentielle du Transformer dans la recherche de chemin : il ne peut pas identifier les relations d'accessibilité par transitivité, et échoue donc lorsque la concaténation de chemins est nécessaire pour générer un chemin. En résumé, nos résultats apportent un nouvel éclairage sur la manière dont les mécanismes internes de l'apprentissage autoregressif permettent la planification dans les réseaux. Cette étude pourrait contribuer à notre compréhension des capacités générales de planification dans d'autres domaines connexes.