RoboChallenge: Großangelegte Echt-Roboter-Bewertung verkörperter Richtlinien

papers.abstract

Tests an echten Maschinen sind für Robotiksteuerungsalgorithmen unverzichtbar. Im Kontext lernbasierter Algorithmen, insbesondere von VLA-Modellen, wird die Forderung nach groß angelegten Evaluationen – also dem Testen einer großen Anzahl von Modellen an einer Vielzahl von Aufgaben – zunehmend dringlicher. Dies jedoch korrekt umzusetzen ist äußerst anspruchsvoll, insbesondere wenn Skalierbarkeit und Reproduzierbarkeit berücksichtigt werden. In diesem Bericht beschreiben wir unsere Methodik zur Entwicklung von RoboChallenge, eines Online-Bewertungssystems zum Testen von Robotiksteuerungsalgorithmen, sowie unsere Untersuchung aktueller state-of-the-art VLA-Modelle mithilfe unseres initialen Benchmarks Table30.

English

Testing on real machines is indispensable for robotic control algorithms. In the context of learning-based algorithms, especially VLA models, demand for large-scale evaluation, i.e. testing a large number of models on a large number of tasks, is becoming increasingly urgent. However, doing this right is highly non-trivial, especially when scalability and reproducibility is taken into account. In this report, we describe our methodology for constructing RoboChallenge, an online evaluation system to test robotic control algorithms, and our survey of recent state-of-the-art VLA models using our initial benchmark Table30.

RoboChallenge: Großangelegte Echt-Roboter-Bewertung verkörperter Richtlinien

RoboChallenge: Large-scale Real-robot Evaluation of Embodied Policies

papers.abstract

Support