Explorateur de Mondes GénératifGenerative World Explorer
La planification avec une observation partielle est un défi central en intelligence artificielle incarnée. La majorité des travaux antérieurs ont abordé ce défi en développant des agents qui explorent physiquement leur environnement pour mettre à jour leurs croyances sur l'état du monde. En revanche, les humains peuvent imaginer des parties invisibles du monde à travers une exploration mentale et réviser leurs croyances avec des observations imaginées. De telles croyances mises à jour peuvent leur permettre de prendre des décisions plus éclairées, sans nécessiter l'exploration physique du monde en permanence. Pour atteindre cette capacité semblable à celle des humains, nous introduisons le Générateur d'Exploration du Monde (Genex), un cadre d'exploration du monde égocentrique qui permet à un agent d'explorer mentalement un monde 3D à grande échelle (par exemple, des scÚnes urbaines) et d'acquérir des observations imaginées pour mettre à jour sa croyance. Cette croyance mise à jour aidera ensuite l'agent à prendre une décision plus éclairée à l'étape actuelle. Pour entraßner Genex, nous créons un ensemble de données de scÚnes urbaines synthétiques, Genex-DB. Nos résultats expérimentaux démontrent que (1) Genex peut générer des observations de haute qualité et cohérentes lors de l'exploration à long terme d'un grand monde physique virtuel et (2) les croyances mises à jour avec les observations générées peuvent informer un modÚle de prise de décision existant (par exemple, un agent LLM) pour élaborer de meilleurs plans.