ALPINE: Enthüllung der Planungsfähigkeit des autoregressiven Lernens in SprachmodellenALPINE: Unveiling the Planning Capability of Autoregressive Learning in
Language Models
In diesem Paper präsentieren wir die Ergebnisse unseres Projekts ALPINE, was für "Autoregressive Learning for Planning In NEtworks" steht. Das Projekt ALPINE leitet eine theoretische Untersuchung zur Entwicklung von Planungsfähigkeiten in auf Transformer basierenden Sprachmodellen durch ihre autoregressiven Lernmechanismen ein, mit dem Ziel, potenzielle Einschränkungen in ihren Planungsfähigkeiten zu identifizieren. Wir abstrahieren die Planung als eine Netzwerk-Pfadfindungsaufgabe, bei der das Ziel darin besteht, einen gültigen Pfad von einem spezifizierten Ausgangsknoten zu einem bestimmten Zielpunkt zu generieren. Hinsichtlich der Ausdrucksfähigkeit zeigen wir, dass der Transformer in der Lage ist, die Pfadfindung auszuführen, indem er die Adjazenz- und Erreichbarkeitsmatrizen in seine Gewichte einbettet. Unsere theoretische Analyse der gradientenbasierten Lerndynamik des Transformers zeigt, dass der Transformer sowohl die Adjazenzmatrix als auch eine begrenzte Form der Erreichbarkeitsmatrix erlernen kann. Diese theoretischen Erkenntnisse werden dann durch Experimente validiert, die zeigen, dass der Transformer tatsächlich die Adjazenzmatrix und eine unvollständige Erreichbarkeitsmatrix lernt, was mit den Vorhersagen unserer theoretischen Analyse übereinstimmt. Darüber hinaus bleiben unsere Beobachtungen konsistent, wenn wir unsere Methodik auf einen realen Planungs-Benchmark namens Blocksworld anwenden. Unsere theoretischen und empirischen Analysen enthüllen weiterhin eine potenzielle Einschränkung des Transformers in der Pfadfindung: Er kann keine Erreichbarkeitsbeziehungen durch Transitivität identifizieren und würde daher scheitern, wenn Pfadverkettungen erforderlich sind, um einen Pfad zu generieren. Zusammenfassend werfen unsere Ergebnisse ein neues Licht darauf, wie die internen Mechanismen des autoregressiven Lernens die Planung in Netzwerken ermöglichen. Diese Studie könnte zu unserem Verständnis der allgemeinen Planungsfähigkeiten in anderen verwandten Bereichen beitragen.