ChatPaper.aiChatPaper

Нейронный предиктор-корректор: решение гомотопических задач с помощью обучения с подкреплением

Neural Predictor-Corrector: Solving Homotopy Problems with Reinforcement Learning

February 3, 2026
Авторы: Jiayao Mai, Bangyan Liao, Zhenjun Zhao, Yingping Zeng, Haoang Li, Javier Civera, Tailin Wu, Yi Zhou, Peidong Liu
cs.AI

Аннотация

Парадигма гомотопии, представляющая собой общий принцип решения сложных задач, встречается в самых различных областях, таких как робастная оптимизация, глобальная оптимизация, поиск корней полиномов и сэмплирование. Практические решатели для этих задач обычно следуют структуре «предиктор-корректор» (ПК), но опираются на эвристики, задаваемые вручную для выбора размера шага и критериев остановки итераций, которые часто являются субоптимальными и специфичными для конкретной задачи. Чтобы решить эту проблему, мы объединяем эти задачи в единую framework, что позволяет разработать универсальный нейросетевой решатель. Основываясь на этом унифицированном подходе, мы предлагаем Нейросетевой Предиктор-Корректор (НПК), который заменяет ручные эвристики автоматически обучаемыми политиками. НПК формулирует выбор политики как проблему последовательного принятия решений и использует обучение с подкреплением для автоматического обнаружения эффективных стратегий. Для дальнейшего повышения обобщающей способности мы вводим амортизированный механизм обучения, позволяющий проводить одноразовое офлайн-обучение для целого класса задач и эффективный онлайн-вывод на новых экземплярах. Эксперименты на четырех репрезентативных задачах гомотопии демонстрируют, что наш метод эффективно обобщается на незнакомые экземпляры. Он стабильно превосходит классические и специализированные базовые методы по эффективности, одновременно демонстрируя превосходную стабильность across tasks, что подчеркивает ценность объединения методов гомотопии в единую нейросетевую framework.
English
The Homotopy paradigm, a general principle for solving challenging problems, appears across diverse domains such as robust optimization, global optimization, polynomial root-finding, and sampling. Practical solvers for these problems typically follow a predictor-corrector (PC) structure, but rely on hand-crafted heuristics for step sizes and iteration termination, which are often suboptimal and task-specific. To address this, we unify these problems under a single framework, which enables the design of a general neural solver. Building on this unified view, we propose Neural Predictor-Corrector (NPC), which replaces hand-crafted heuristics with automatically learned policies. NPC formulates policy selection as a sequential decision-making problem and leverages reinforcement learning to automatically discover efficient strategies. To further enhance generalization, we introduce an amortized training mechanism, enabling one-time offline training for a class of problems and efficient online inference on new instances. Experiments on four representative homotopy problems demonstrate that our method generalizes effectively to unseen instances. It consistently outperforms classical and specialized baselines in efficiency while demonstrating superior stability across tasks, highlighting the value of unifying homotopy methods into a single neural framework.
PDF111February 5, 2026