ChatPaper.aiChatPaper

Prédicteur-Correcteur Neuronal : Résolution de Problèmes d'Homotopie par Apprentissage par Renforcement

Neural Predictor-Corrector: Solving Homotopy Problems with Reinforcement Learning

February 3, 2026
papers.authors: Jiayao Mai, Bangyan Liao, Zhenjun Zhao, Yingping Zeng, Haoang Li, Javier Civera, Tailin Wu, Yi Zhou, Peidong Liu
cs.AI

papers.abstract

Le paradigme de l'homotopie, principe général pour résoudre des problèmes complexes, apparaît dans divers domaines tels que l'optimisation robuste, l'optimisation globale, la recherche de racines polynomiales et l'échantillonnage. Les solveurs pratiques pour ces problèmes suivent généralement une structure prédicteur-correcteur (PC), mais reposent sur des heuristiques artisanales pour les tailles de pas et la terminaison des itérations, qui sont souvent sous-optimales et spécifiques à la tâche. Pour remédier à cela, nous unifions ces problèmes sous un cadre unique, permettant la conception d'un solveur neuronal général. Sur la base de cette vision unifiée, nous proposons le Prédicteur-Correcteur Neuronal (NPC), qui remplace les heuristiques artisanales par des politiques apprises automatiquement. NPC formule la sélection de politique comme un problème décisionnel séquentiel et utilise l'apprentissage par renforcement pour découvrir automatiquement des stratégies efficaces. Pour améliorer davantage la généralisation, nous introduisons un mécanisme d'entraînement amorti, permettant un entraînement hors ligne unique pour une classe de problèmes et une inférence en ligne efficace sur de nouvelles instances. Les expériences sur quatre problèmes d'homotopie représentatifs démontrent que notre méthode généralise efficacement à des instances non vues. Elle surpasse constamment les méthodes de référence classiques et spécialisées en efficacité tout en démontrant une stabilité supérieure across les tâches, soulignant la valeur de l'unification des méthodes d'homotopie dans un cadre neuronal unique.
English
The Homotopy paradigm, a general principle for solving challenging problems, appears across diverse domains such as robust optimization, global optimization, polynomial root-finding, and sampling. Practical solvers for these problems typically follow a predictor-corrector (PC) structure, but rely on hand-crafted heuristics for step sizes and iteration termination, which are often suboptimal and task-specific. To address this, we unify these problems under a single framework, which enables the design of a general neural solver. Building on this unified view, we propose Neural Predictor-Corrector (NPC), which replaces hand-crafted heuristics with automatically learned policies. NPC formulates policy selection as a sequential decision-making problem and leverages reinforcement learning to automatically discover efficient strategies. To further enhance generalization, we introduce an amortized training mechanism, enabling one-time offline training for a class of problems and efficient online inference on new instances. Experiments on four representative homotopy problems demonstrate that our method generalizes effectively to unseen instances. It consistently outperforms classical and specialized baselines in efficiency while demonstrating superior stability across tasks, highlighting the value of unifying homotopy methods into a single neural framework.
PDF111February 5, 2026