ChatPaper.aiChatPaper

Cognitieve Kaart voor Taalmodellen: Optimale Planning door Verbale Representatie van het Wereldmodel

Cognitive Map for Language Models: Optimal Planning via Verbally Representing the World Model

June 21, 2024
Auteurs: Doyoung Kim, Jongwon Lee, Jinho Park, Minjoon Seo
cs.AI

Samenvatting

Taalmodellen hebben indrukwekkende prestaties getoond bij diverse taken binnen natuurlijke taalverwerking, maar ze hebben moeite met planningsopdrachten die multi-stapsimulaties vereisen. Geïnspireerd door menselijke cognitieve processen, onderzoekt dit artikel het optimale planningsvermogen van taalmodellen die een cognitieve kaart van een gegeven omgeving kunnen construeren. Onze experimenten tonen aan dat een cognitieve kaart de prestaties aanzienlijk verbetert bij zowel het genereren van optimale als bereikbare plannen in de Gridworld-padplanningsopdracht. We observeren dat onze methode twee belangrijke kenmerken vertoont die vergelijkbaar zijn met menselijke cognitie: generalisatie van het planningsvermogen naar geëxtrapoleerde omgevingen en snelle aanpassing met beperkte trainingsdata. We hopen dat onze bevindingen in de Gridworld-opdracht inzichten bieden in het modelleren van menselijke cognitieve processen in taalmodellen, wat mogelijk kan leiden tot de ontwikkeling van geavanceerdere en robuustere systemen die meer lijken op menselijke cognitie.
English
Language models have demonstrated impressive capabilities across various natural language processing tasks, yet they struggle with planning tasks requiring multi-step simulations. Inspired by human cognitive processes, this paper investigates the optimal planning power of language models that can construct a cognitive map of a given environment. Our experiments demonstrate that cognitive map significantly enhances the performance of both optimal and reachable planning generation ability in the Gridworld path planning task. We observe that our method showcases two key characteristics similar to human cognition: generalization of its planning ability to extrapolated environments and rapid adaptation with limited training data. We hope our findings in the Gridworld task provide insights into modeling human cognitive processes in language models, potentially leading to the development of more advanced and robust systems that better resemble human cognition.
PDF120November 29, 2024