Agente MSI: Incorporando Perspectivas Multiescala en Agentes Incorporados para una Planificación y Toma de Decisiones Superiores
MSI-Agent: Incorporating Multi-Scale Insight into Embodied Agents for Superior Planning and Decision-Making
September 25, 2024
Autores: Dayuan Fu, Biqing Qi, Yihuai Gao, Che Jiang, Guanting Dong, Bowen Zhou
cs.AI
Resumen
La memoria a largo plazo es significativa para los agentes, en la cual las percepciones juegan un papel crucial. Sin embargo, la aparición de percepciones irrelevantes y la falta de percepciones generales pueden socavar enormemente la efectividad de las percepciones. Para resolver este problema, en este documento presentamos el Agente de Percepción Multi-Escala (MSI-Agent), un agente incorporado diseñado para mejorar la planificación y la capacidad de toma de decisiones de los LLMs al resumir y utilizar percepciones de manera efectiva en diferentes escalas. MSI logra esto a través del selector de experiencias, el generador de percepciones y el selector de percepciones. Aprovechando un proceso de tres partes, MSI puede generar percepciones específicas de tareas y de alto nivel, almacenarlas en una base de datos y luego utilizar percepciones relevantes de la misma para ayudar en la toma de decisiones. Nuestros experimentos muestran que MSI supera a otra estrategia de percepción al planificar con GPT3.5. Además, profundizamos en las estrategias para seleccionar experiencias iniciales y percepciones, con el objetivo de proporcionar a LLM percepciones más útiles y relevantes para una mejor toma de decisiones. Nuestras observaciones también indican que MSI muestra una mejor robustez al enfrentar escenarios de cambio de dominio.
English
Long-term memory is significant for agents, in which insights play a crucial
role. However, the emergence of irrelevant insight and the lack of general
insight can greatly undermine the effectiveness of insight. To solve this
problem, in this paper, we introduce Multi-Scale Insight Agent (MSI-Agent), an
embodied agent designed to improve LLMs' planning and decision-making ability
by summarizing and utilizing insight effectively across different scales. MSI
achieves this through the experience selector, insight generator, and insight
selector. Leveraging a three-part pipeline, MSI can generate task-specific and
high-level insight, store it in a database, and then use relevant insight from
it to aid in decision-making. Our experiments show that MSI outperforms another
insight strategy when planning by GPT3.5. Moreover, We delve into the
strategies for selecting seed experience and insight, aiming to provide LLM
with more useful and relevant insight for better decision-making. Our
observations also indicate that MSI exhibits better robustness when facing
domain-shifting scenarios.Summary
AI-Generated Summary