AlphaSpace: Habilitación de Acciones Robóticas mediante Tokenización Semántica y Razonamiento Simbólico
AlphaSpace: Enabling Robotic Actions through Semantic Tokenization and Symbolic Reasoning
March 24, 2025
Autores: Alan Dao, Dinh Bach Vu, Bui Quang Huy
cs.AI
Resumen
Este artículo presenta AlphaSpace, una metodología novedosa diseñada para mejorar las capacidades de razonamiento espacial de los modelos de lenguaje de gran escala (LLMs) en la navegación del espacio cartesiano 3D. AlphaSpace emplea una estrategia de tokenización basada en semántica, codificando información de altura mediante tokens semánticos especializados, e integra principalmente datos sintéticos de razonamiento simbólico. Este enfoque permite a los LLMs manipular objetos con precisión al posicionarlos en coordenadas específicas [x, y, z]. Los resultados experimentales demuestran que AlphaSpace supera significativamente a los modelos existentes en subtareas de manipulación, logrando una precisión total del 66.67%, en comparación con el 37.5% de GPT-4o y el 29.17% de Claude 3.5 Sonnet.
English
This paper presents AlphaSpace, a novel methodology designed to enhance the
spatial reasoning capabilities of large language models (LLMs) for 3D Cartesian
space navigation. AlphaSpace employs a semantics-based tokenization strategy,
encoding height information through specialized semantic tokens, and integrates
primarily symbolic synthetic reasoning data. This approach enables LLMs to
accurately manipulate objects by positioning them at specific [x, y, z]
coordinates. Experimental results demonstrate that AlphaSpace significantly
outperforms existing models on manipulation subtasks, achieving a total
accuracy of 66.67%, compared to 37.5% for GPT-4o and 29.17% for Claude 3.5
Sonnet.Summary
AI-Generated Summary