ChatPaper.aiChatPaper

TourPlanner: 旅行計画のための制約ゲート型強化学習を用いた競合的コンセンサスフレームワーク

TourPlanner: A Competitive Consensus Framework with Constraint-Gated Reinforcement Learning for Travel Planning

January 8, 2026
著者: Yinuo Wang, Mining Tan, Wenxiang Jiao, Xiaoxi Li, Hao Wang, Xuanyu Zhang, Yuan Lu, Weiming Dong
cs.AI

要旨

旅行計画の策定は、多面的な情報を統合して旅程を構築する高度な意思決定プロセスである。しかし、既存の旅行計画手法には以下の課題がある:(1) 候補となる観光スポット(POI)を高再現率で選定すること、(2) 単一の推論経路では実行可能解空間の探索能力が制限されること、(3) 硬制約と軟制約の同時最適化が困難であること。これらの課題に対処するため、我々はマルチパス推論と制約ゲート強化学習を特徴とする総合フレームワークTourPlannerを提案する。具体的には、まず空間情報を考慮した候補POIセットを構築するための個人化再現・空間最適化(PReSO)ワークフローを導入する。次に、実行可能解空間の探索能力を向上させるマルチパス推論パラダイムである競合合意連鎖思考(CCoT)を提案する。計画をさらに洗練させるため、シグモイドベースのゲート機構を強化学習段階に統合し、硬制約が満たされた後に軟制約の充足を動的に優先する。旅行計画ベンチマークによる実験結果から、TourPlannerが既存手法を大幅に上回る実行可能性とユーザ嗜好への適合性を達成し、最先端の性能を実現することが示された。
English
Travel planning is a sophisticated decision-making process that requires synthesizing multifaceted information to construct itineraries. However, existing travel planning approaches face several challenges: (1) Pruning candidate points of interest (POIs) while maintaining a high recall rate; (2) A single reasoning path restricts the exploration capability within the feasible solution space for travel planning; (3) Simultaneously optimizing hard constraints and soft constraints remains a significant difficulty. To address these challenges, we propose TourPlanner, a comprehensive framework featuring multi-path reasoning and constraint-gated reinforcement learning. Specifically, we first introduce a Personalized Recall and Spatial Optimization (PReSO) workflow to construct spatially-aware candidate POIs' set. Subsequently, we propose Competitive consensus Chain-of-Thought (CCoT), a multi-path reasoning paradigm that improves the ability of exploring the feasible solution space. To further refine the plan, we integrate a sigmoid-based gating mechanism into the reinforcement learning stage, which dynamically prioritizes soft-constraint satisfaction only after hard constraints are met. Experimental results on travel planning benchmarks demonstrate that TourPlanner achieves state-of-the-art performance, significantly surpassing existing methods in both feasibility and user-preference alignment.
PDF103January 31, 2026