SRT-H: Un Framework Gerarchico per la Chirurgia Autonoma tramite Apprendimento per Imitazione Condizionato al Linguaggio
SRT-H: A Hierarchical Framework for Autonomous Surgery via Language Conditioned Imitation Learning
May 15, 2025
Autori: Ji Woong Kim, Juo-Tung Chen, Pascal Hansen, Lucy X. Shi, Antony Goldenberg, Samuel Schmidgall, Paul Maria Scheikl, Anton Deguet, Brandon M. White, De Ru Tsai, Richard Cha, Jeffrey Jopling, Chelsea Finn, Axel Krieger
cs.AI
Abstract
La ricerca sulla chirurgia autonoma si è concentrata principalmente sull'automazione di compiti semplici in ambienti controllati. Tuttavia, le applicazioni chirurgiche nel mondo reale richiedono una manipolazione abile per periodi prolungati e la generalizzazione alla variabilità intrinseca dei tessuti umani. Queste sfide rimangono difficili da affrontare utilizzando approcci esistenti basati sulla logica o sull'apprendimento end-to-end convenzionale. Per colmare questa lacuna, proponiamo un framework gerarchico per eseguire passaggi chirurgici abili e a lungo termine. Il nostro approccio utilizza una politica di alto livello per la pianificazione dei compiti e una politica di basso livello per la generazione di traiettorie del robot. Il pianificatore di alto livello opera nello spazio linguistico, generando istruzioni a livello di compito o correttive che guidano il robot attraverso i passaggi a lungo termine e correggono gli errori della politica di basso livello. Validiamo il nostro framework attraverso esperimenti ex vivo sulla colecistectomia, una procedura minimamente invasiva comunemente praticata, e conduciamo studi di ablazione per valutare i componenti chiave del sistema. Il nostro metodo raggiunge un tasso di successo del 100% su otto cistifellee ex vivo mai viste, operando in modo completamente autonomo senza intervento umano. Questo lavoro dimostra l'autonomia a livello di passaggio in una procedura chirurgica, segnando una pietra miliare verso il dispiegamento clinico di sistemi chirurgici autonomi.
English
Research on autonomous surgery has largely focused on simple task automation
in controlled environments. However, real-world surgical applications demand
dexterous manipulation over extended durations and generalization to the
inherent variability of human tissue. These challenges remain difficult to
address using existing logic-based or conventional end-to-end learning
approaches. To address this gap, we propose a hierarchical framework for
performing dexterous, long-horizon surgical steps. Our approach utilizes a
high-level policy for task planning and a low-level policy for generating robot
trajectories. The high-level planner plans in language space, generating
task-level or corrective instructions that guide the robot through the
long-horizon steps and correct for the low-level policy's errors. We validate
our framework through ex vivo experiments on cholecystectomy, a
commonly-practiced minimally invasive procedure, and conduct ablation studies
to evaluate key components of the system. Our method achieves a 100\% success
rate across eight unseen ex vivo gallbladders, operating fully autonomously
without human intervention. This work demonstrates step-level autonomy in a
surgical procedure, marking a milestone toward clinical deployment of
autonomous surgical systems.