ChatPaper.aiChatPaper

Predictor-Corrector Neuronal: Resolución de Problemas de Homotopía con Aprendizaje por Refuerzo

Neural Predictor-Corrector: Solving Homotopy Problems with Reinforcement Learning

February 3, 2026
Autores: Jiayao Mai, Bangyan Liao, Zhenjun Zhao, Yingping Zeng, Haoang Li, Javier Civera, Tailin Wu, Yi Zhou, Peidong Liu
cs.AI

Resumen

El paradigma de la homotopía, un principio general para resolver problemas complejos, aparece en diversos dominios como la optimización robusta, optimización global, búsqueda de raíces polinómicas y muestreo. Los solucionadores prácticos para estos problemas suelen seguir una estructura predictor-corrector (PC), pero dependen de heurísticas artesanales para tamaños de paso y terminación de iteraciones, que a menudo son subóptimas y específicas de cada tarea. Para abordar esto, unificamos estos problemas bajo un marco único, lo que permite diseñar un solucionador neuronal general. Basándonos en esta visión unificada, proponemos Neural Predictor-Corrector (NPC), que reemplaza las heurísticas artesanales con políticas aprendidas automáticamente. NPC formula la selección de políticas como un problema de toma de decisiones secuencial y aprovecha el aprendizaje por refuerzo para descubrir automáticamente estrategias eficientes. Para mejorar aún más la generalización, introducimos un mecanismo de entrenamiento amortizado, permitiendo un entrenamiento único fuera de línea para una clase de problemas y una inferencia en línea eficiente en nuevas instancias. Los experimentos en cuatro problemas de homotopía representativos demuestran que nuestro método generaliza efectivamente a instancias no vistas. Supera consistentemente a los métodos clásicos y especializados en eficiencia, mientras demuestra una estabilidad superior entre tareas, destacando el valor de unificar los métodos de homotopía en un marco neuronal único.
English
The Homotopy paradigm, a general principle for solving challenging problems, appears across diverse domains such as robust optimization, global optimization, polynomial root-finding, and sampling. Practical solvers for these problems typically follow a predictor-corrector (PC) structure, but rely on hand-crafted heuristics for step sizes and iteration termination, which are often suboptimal and task-specific. To address this, we unify these problems under a single framework, which enables the design of a general neural solver. Building on this unified view, we propose Neural Predictor-Corrector (NPC), which replaces hand-crafted heuristics with automatically learned policies. NPC formulates policy selection as a sequential decision-making problem and leverages reinforcement learning to automatically discover efficient strategies. To further enhance generalization, we introduce an amortized training mechanism, enabling one-time offline training for a class of problems and efficient online inference on new instances. Experiments on four representative homotopy problems demonstrate that our method generalizes effectively to unseen instances. It consistently outperforms classical and specialized baselines in efficiency while demonstrating superior stability across tasks, highlighting the value of unifying homotopy methods into a single neural framework.
PDF111February 5, 2026