ChatPaper.aiChatPaper

Kognitive Karte für Sprachmodelle: Optimale Planung durch verbale Darstellung des Weltmodells

Cognitive Map for Language Models: Optimal Planning via Verbally Representing the World Model

June 21, 2024
Autoren: Doyoung Kim, Jongwon Lee, Jinho Park, Minjoon Seo
cs.AI

Zusammenfassung

Sprachmodelle haben beeindruckende Fähigkeiten in verschiedenen natürlichen Sprachverarbeitungsaufgaben gezeigt, kämpfen jedoch mit Planungsaufgaben, die mehrstufige Simulationen erfordern. Inspiriert von menschlichen kognitiven Prozessen untersucht diese Arbeit die optimale Planungsfähigkeit von Sprachmodellen, die eine kognitive Karte einer gegebenen Umgebung erstellen können. Unsere Experimente zeigen, dass die kognitive Karte die Leistung sowohl der optimalen als auch der erreichbaren Planungsfähigkeit bei der Pfadplanung in der Gridworld signifikant verbessert. Wir beobachten, dass unsere Methode zwei Schlüsselmerkmale ähnlich der menschlichen Kognition aufweist: die Verallgemeinerung der Planungsfähigkeit auf extrapolierte Umgebungen und die schnelle Anpassung mit begrenzten Trainingsdaten. Wir hoffen, dass unsere Erkenntnisse in der Gridworld-Aufgabe Einblicke in die Modellierung menschlicher kognitiver Prozesse in Sprachmodellen liefern und möglicherweise zur Entwicklung fortschrittlicherer und robusterer Systeme führen, die der menschlichen Kognition besser ähneln.
English
Language models have demonstrated impressive capabilities across various natural language processing tasks, yet they struggle with planning tasks requiring multi-step simulations. Inspired by human cognitive processes, this paper investigates the optimal planning power of language models that can construct a cognitive map of a given environment. Our experiments demonstrate that cognitive map significantly enhances the performance of both optimal and reachable planning generation ability in the Gridworld path planning task. We observe that our method showcases two key characteristics similar to human cognition: generalization of its planning ability to extrapolated environments and rapid adaptation with limited training data. We hope our findings in the Gridworld task provide insights into modeling human cognitive processes in language models, potentially leading to the development of more advanced and robust systems that better resemble human cognition.

Summary

AI-Generated Summary

PDF120November 29, 2024