SRT-H:言語条件付き模倣学習による自律手術のための階層的フレームワーク
SRT-H: A Hierarchical Framework for Autonomous Surgery via Language Conditioned Imitation Learning
May 15, 2025
著者: Ji Woong Kim, Juo-Tung Chen, Pascal Hansen, Lucy X. Shi, Antony Goldenberg, Samuel Schmidgall, Paul Maria Scheikl, Anton Deguet, Brandon M. White, De Ru Tsai, Richard Cha, Jeffrey Jopling, Chelsea Finn, Axel Krieger
cs.AI
要旨
自律手術に関する研究は、これまで主に制御された環境下での単純なタスク自動化に焦点が当てられてきた。しかし、現実世界の手術応用では、長時間にわたる器用な操作と、人体組織の本質的な変動性への一般化が求められる。これらの課題は、既存の論理ベースの手法や従来のエンドツーエンド学習アプローチでは解決が困難である。このギャップを埋めるため、我々は器用的で長期的な手術ステップを実行するための階層的フレームワークを提案する。本アプローチでは、タスク計画のための高レベルポリシーと、ロボット軌道生成のための低レベルポリシーを利用する。高レベルプランナーは言語空間で計画を立て、タスクレベルの指示や修正指示を生成し、ロボットを長期的なステップに導き、低レベルポリシーの誤りを修正する。我々は、一般的に行われる低侵襲手術である胆嚢摘出術のex vivo実験を通じて本フレームワークを検証し、システムの主要コンポーネントを評価するためのアブレーション研究を実施した。本手法は、8つの未見のex vivo胆嚢において、人間の介入なしに完全自律的に動作し、100%の成功率を達成した。本研究は、手術手順におけるステップレベルの自律性を示し、自律手術システムの臨床導入に向けた重要なマイルストーンを示すものである。
English
Research on autonomous surgery has largely focused on simple task automation
in controlled environments. However, real-world surgical applications demand
dexterous manipulation over extended durations and generalization to the
inherent variability of human tissue. These challenges remain difficult to
address using existing logic-based or conventional end-to-end learning
approaches. To address this gap, we propose a hierarchical framework for
performing dexterous, long-horizon surgical steps. Our approach utilizes a
high-level policy for task planning and a low-level policy for generating robot
trajectories. The high-level planner plans in language space, generating
task-level or corrective instructions that guide the robot through the
long-horizon steps and correct for the low-level policy's errors. We validate
our framework through ex vivo experiments on cholecystectomy, a
commonly-practiced minimally invasive procedure, and conduct ablation studies
to evaluate key components of the system. Our method achieves a 100\% success
rate across eight unseen ex vivo gallbladders, operating fully autonomously
without human intervention. This work demonstrates step-level autonomy in a
surgical procedure, marking a milestone toward clinical deployment of
autonomous surgical systems.