ChatPaper.aiChatPaper

ThinkGrasp : Un système vision-langage pour la préhension stratégique de pièces dans un environnement encombré

ThinkGrasp: A Vision-Language System for Strategic Part Grasping in Clutter

July 16, 2024
Auteurs: Yaoyao Qian, Xupeng Zhu, Ondrej Biza, Shuo Jiang, Linfeng Zhao, Haojie Huang, Yu Qi, Robert Platt
cs.AI

Résumé

La préhension robotique dans des environnements encombrés reste un défi majeur en raison des occlusions et des arrangements complexes d'objets. Nous avons développé ThinkGrasp, un système de préhension vision-langage plug-and-play qui exploite le raisonnement contextuel avancé de GPT-4o pour élaborer des stratégies de préhension dans des environnements fortement encombrés. ThinkGrasp est capable d'identifier et de générer efficacement des poses de préhension pour les objets cibles, même lorsqu'ils sont fortement obstrués ou presque invisibles, en utilisant un langage orienté vers un objectif pour guider l'élimination des objets obstructifs. Cette approche dévoile progressivement l'objet cible et finit par le saisir en quelques étapes avec un taux de réussite élevé. Dans des expériences à la fois simulées et réelles, ThinkGrasp a atteint un taux de réussite élevé et a surpassé de manière significative les méthodes de pointe dans des environnements fortement encombrés ou avec des objets divers et inconnus, démontrant ainsi de solides capacités de généralisation.
English
Robotic grasping in cluttered environments remains a significant challenge due to occlusions and complex object arrangements. We have developed ThinkGrasp, a plug-and-play vision-language grasping system that makes use of GPT-4o's advanced contextual reasoning for heavy clutter environment grasping strategies. ThinkGrasp can effectively identify and generate grasp poses for target objects, even when they are heavily obstructed or nearly invisible, by using goal-oriented language to guide the removal of obstructing objects. This approach progressively uncovers the target object and ultimately grasps it with a few steps and a high success rate. In both simulated and real experiments, ThinkGrasp achieved a high success rate and significantly outperformed state-of-the-art methods in heavily cluttered environments or with diverse unseen objects, demonstrating strong generalization capabilities.

Summary

AI-Generated Summary

PDF52November 28, 2024