ChatPaper.aiChatPaper

ニューラル予測子-修正子:強化学習によるホモトピー問題の解法

Neural Predictor-Corrector: Solving Homotopy Problems with Reinforcement Learning

February 3, 2026
著者: Jiayao Mai, Bangyan Liao, Zhenjun Zhao, Yingping Zeng, Haoang Li, Javier Civera, Tailin Wu, Yi Zhou, Peidong Liu
cs.AI

要旨

ホモトピー法は、困難な問題を解決するための一般的原理として、ロバスト最適化、大域的最適化、多項式の根の探索、サンプリングなど多様な領域で見られる。これらの問題に対する実用的なソルバーは通常、予測子-修正子(PC)構造に従うが、ステップサイズや反復終了条件において手作りのヒューリスティクスに依存しており、それらはしばしば最適ではなくタスク特化的である。この問題に対処するため、我々はこれらの問題を単一の枠組みに統合し、一般的なニューラルソルバーの設計を可能にする。この統一的な視点に基づき、手作りのヒューリスティクスを自動学習されたポリシーで置き換えるNeural Predictor-Corrector(NPC)を提案する。NPCはポリシー選択を逐次意思決定問題として定式化し、強化学習を活用して効率的な戦略を自動発見する。汎化性をさらに高めるため、一連の問題群に対して一度のオフライン訓練を行い、新しいインスタンスに対して効率的なオンライン推論を可能とする償却化訓練メカニズムを導入する。4つの代表的なホモトピー問題による実験では、本手法が未見のインスタンスに対しても効果的に汎化することを実証した。提案手法は、古典的かつ特化したベースラインを効率性で一貫して上回り、タスク横断的に優れた安定性を示すことで、ホモトピー法を単一のニューラル枠組みに統合する価値を明らかにした。
English
The Homotopy paradigm, a general principle for solving challenging problems, appears across diverse domains such as robust optimization, global optimization, polynomial root-finding, and sampling. Practical solvers for these problems typically follow a predictor-corrector (PC) structure, but rely on hand-crafted heuristics for step sizes and iteration termination, which are often suboptimal and task-specific. To address this, we unify these problems under a single framework, which enables the design of a general neural solver. Building on this unified view, we propose Neural Predictor-Corrector (NPC), which replaces hand-crafted heuristics with automatically learned policies. NPC formulates policy selection as a sequential decision-making problem and leverages reinforcement learning to automatically discover efficient strategies. To further enhance generalization, we introduce an amortized training mechanism, enabling one-time offline training for a class of problems and efficient online inference on new instances. Experiments on four representative homotopy problems demonstrate that our method generalizes effectively to unseen instances. It consistently outperforms classical and specialized baselines in efficiency while demonstrating superior stability across tasks, highlighting the value of unifying homotopy methods into a single neural framework.
PDF111February 5, 2026