신경망 예측-보정 기법: 강화 학습을 이용한 호모토피 문제 해결
Neural Predictor-Corrector: Solving Homotopy Problems with Reinforcement Learning
February 3, 2026
저자: Jiayao Mai, Bangyan Liao, Zhenjun Zhao, Yingping Zeng, Haoang Li, Javier Civera, Tailin Wu, Yi Zhou, Peidong Liu
cs.AI
초록
호모토피 패러다임은 난해한 문제를 해결하기 위한 일반 원리로, 강건 최적화, 전역 최적화, 다항식 근 찾기, 샘플링 등 다양한 영역에서 나타납니다. 이러한 문제들을 위한 실용적인 솔버는 일반적으로 예측자-수정자 구조를 따르지만, 단계 크기와 반복 종료를 위해 수작업으로 설계된 휴리스틱에 의존하는 경우가 많으며, 이는 종종 최적이 아니거나 특정 작업에만 국한됩니다. 이를 해결하기 위해 우리는 이러한 문제들을 단일 프레임워크로 통합하여 일반적인 신경망 솔버 설계를 가능하게 합니다. 이 통합된 관점을 바탕으로 우리는 수작업 휴리스틱을 자동 학습된 정책으로 대체하는 Neural Predictor-Corrector(NPC)를 제안합니다. NPC는 정책 선택을 순차적 의사 결정 문제로 공식화하고 강화 학습을 활용하여 효율적인 전략을 자동으로 발견합니다. 일반화 성능을 더욱 향상시키기 위해, 우리는 분할 상환 훈련 기법을 도입하여 문제 클래스에 대해 일회성 오프라인 훈련과 새로운 인스턴스에 대한 효율적인 온라인 추론을 가능하게 합니다. 4가지 대표적인 호모토피 문제에 대한 실험 결과, 우리 방법이 보이지 않는 인스턴스에 효과적으로 일반화됨을 보여줍니다. 본 방법은 효율성 측면에서 기존의 전통적 및 특화된 기준 방법들을 지속적으로 능가할 뿐만 아니라, 작업 전반에 걸쳐 우수한 안정성을 보여주어 호모토피 방법을 단일 신경망 프레임워크로 통합하는 가치를 부각합니다.
English
The Homotopy paradigm, a general principle for solving challenging problems, appears across diverse domains such as robust optimization, global optimization, polynomial root-finding, and sampling. Practical solvers for these problems typically follow a predictor-corrector (PC) structure, but rely on hand-crafted heuristics for step sizes and iteration termination, which are often suboptimal and task-specific. To address this, we unify these problems under a single framework, which enables the design of a general neural solver. Building on this unified view, we propose Neural Predictor-Corrector (NPC), which replaces hand-crafted heuristics with automatically learned policies. NPC formulates policy selection as a sequential decision-making problem and leverages reinforcement learning to automatically discover efficient strategies. To further enhance generalization, we introduce an amortized training mechanism, enabling one-time offline training for a class of problems and efficient online inference on new instances. Experiments on four representative homotopy problems demonstrate that our method generalizes effectively to unseen instances. It consistently outperforms classical and specialized baselines in efficiency while demonstrating superior stability across tasks, highlighting the value of unifying homotopy methods into a single neural framework.