Entsteht räumliches Denken in Grenzmodellen?
Does Spatial Cognition Emerge in Frontier Models?
October 9, 2024
Autoren: Santhosh Kumar Ramakrishnan, Erik Wijmans, Philipp Kraehenbuehl, Vladlen Koltun
cs.AI
Zusammenfassung
Noch nicht. Wir präsentieren SPACE, einen Benchmark, der die räumliche Wahrnehmung in modernen Modellen systematisch bewertet. Unser Benchmark baut auf jahrzehntelanger Forschung in der Kognitionswissenschaft auf. Er bewertet die Fähigkeiten zur großflächigen Kartierung, die zum Einsatz kommen, wenn ein Organismus physische Umgebungen durchquert, das kleinskalige Denken über Objektformen und -layouts sowie kognitive Infrastrukturen wie räumliche Aufmerksamkeit und Gedächtnis. Für viele Aufgaben stellen wir parallele Darstellungen über Text und Bilder bereit, um sowohl große Sprachmodelle als auch große multimodale Modelle zu bewerten. Die Ergebnisse legen nahe, dass moderne Spitzenmodelle in Bezug auf die räumliche Intelligenz von Tieren hinterherhinken und bei einer Reihe von klassischen Tests zur tierischen Kognition nahe dem Zufallsniveau abschneiden.
English
Not yet. We present SPACE, a benchmark that systematically evaluates spatial
cognition in frontier models. Our benchmark builds on decades of research in
cognitive science. It evaluates large-scale mapping abilities that are brought
to bear when an organism traverses physical environments, smaller-scale
reasoning about object shapes and layouts, and cognitive infrastructure such as
spatial attention and memory. For many tasks, we instantiate parallel
presentations via text and images, allowing us to benchmark both large language
models and large multimodal models. Results suggest that contemporary frontier
models fall short of the spatial intelligence of animals, performing near
chance level on a number of classic tests of animal cognition.Summary
AI-Generated Summary