AlphaSpace: Het mogelijk maken van robotacties via semantische tokenisatie en symbolisch redeneren
AlphaSpace: Enabling Robotic Actions through Semantic Tokenization and Symbolic Reasoning
March 24, 2025
Auteurs: Alan Dao, Dinh Bach Vu, Bui Quang Huy
cs.AI
Samenvatting
Dit artikel presenteert AlphaSpace, een nieuwe methodologie die is ontworpen om de ruimtelijke redeneervaardigheden van grote taalmodellen (LLMs) te verbeteren voor navigatie in 3D Cartesiaanse ruimte. AlphaSpace maakt gebruik van een op semantiek gebaseerde tokenisatiestrategie, waarbij hoogte-informatie wordt gecodeerd via gespecialiseerde semantische tokens, en integreert voornamelijk symbolische synthetische redeneergegevens. Deze aanpak stelt LLMs in staat om objecten nauwkeurig te manipuleren door ze te positioneren op specifieke [x, y, z] coördinaten. Experimentele resultaten tonen aan dat AlphaSpace aanzienlijk beter presteert dan bestaande modellen bij manipulatiesubtaken, met een totale nauwkeurigheid van 66,67%, vergeleken met 37,5% voor GPT-4o en 29,17% voor Claude 3.5 Sonnet.
English
This paper presents AlphaSpace, a novel methodology designed to enhance the
spatial reasoning capabilities of large language models (LLMs) for 3D Cartesian
space navigation. AlphaSpace employs a semantics-based tokenization strategy,
encoding height information through specialized semantic tokens, and integrates
primarily symbolic synthetic reasoning data. This approach enables LLMs to
accurately manipulate objects by positioning them at specific [x, y, z]
coordinates. Experimental results demonstrate that AlphaSpace significantly
outperforms existing models on manipulation subtasks, achieving a total
accuracy of 66.67%, compared to 37.5% for GPT-4o and 29.17% for Claude 3.5
Sonnet.Summary
AI-Generated Summary