Explorador de Mundo GenerativoGenerative World Explorer
O planeamento com observação parcial é um desafio central na IA incorporada. A maioria dos trabalhos anteriores abordou esse desafio desenvolvendo agentes que exploram fisicamente seu ambiente para atualizar suas crenças sobre o estado do mundo. Em contraste, os humanos podem imaginar partes não vistas do mundo através de uma exploração mental e revisar suas crenças com observações imaginadas. Tais crenças atualizadas podem permitir que tomem decisões mais informadas, sem necessidade de explorar fisicamente o mundo o tempo todo. Para alcançar essa habilidade semelhante à humana, introduzimos o Explorador de Mundo Generativo (Genex), um framework de exploração de mundo egocêntrico que permite a um agente explorar mentalmente um mundo 3D em grande escala (por exemplo, cenas urbanas) e adquirir observações imaginadas para atualizar sua crença. Essa crença atualizada ajudará então o agente a tomar uma decisão mais informada no passo atual. Para treinar o Genex, criamos um conjunto de dados sintético de cenas urbanas, Genex-DB. Nossos resultados experimentais demonstram que (1) o Genex pode gerar observações de alta qualidade e consistentes durante a exploração de longo prazo de um mundo físico virtual em grande escala e (2) as crenças atualizadas com as observações geradas podem informar um modelo de tomada de decisão existente (por exemplo, um agente LLM) para fazer planos melhores.