ChatPaper.aiChatPaper

Поиск, проверка и обратная связь: к следующему поколению посттренировочной парадигмы фундаментальных моделей через инженерию верификаторов.

Search, Verify and Feedback: Towards Next Generation Post-training Paradigm of Foundation Models via Verifier Engineering

November 18, 2024
Авторы: Xinyan Guan, Yanjiang Liu, Xinyu Lu, Boxi Cao, Ben He, Xianpei Han, Le Sun, Jie Lou, Bowen Yu, Yaojie Lu, Hongyu Lin
cs.AI

Аннотация

Эволюция машинного обучения все более акцентирует внимание на разработке мощных моделей и более масштабируемых сигналов надзора. Однако появление фундаментальных моделей представляет существенные вызовы в обеспечении эффективных сигналов надзора, необходимых для дальнейшего улучшения их возможностей. Следовательно, существует настоятельная необходимость исследования новых сигналов надзора и технических подходов. В данной статье мы предлагаем концепцию инженерии верификации, новую парадигму посттренировочного этапа, специально разработанную для эпохи фундаментальных моделей. Основу инженерии верификации составляет использование набора автоматизированных верификаторов для выполнения задач верификации и предоставления содержательной обратной связи фундаментальным моделям. Мы систематически классифицируем процесс инженерии верификации на три основных этапа: поиск, верификация и обратная связь, и предоставляем всесторонний обзор последних достижений в области исследований в рамках каждого этапа. Мы считаем, что инженерия верификации представляет собой фундаментальный путь к достижению искусственного общего интеллекта.
English
The evolution of machine learning has increasingly prioritized the development of powerful models and more scalable supervision signals. However, the emergence of foundation models presents significant challenges in providing effective supervision signals necessary for further enhancing their capabilities. Consequently, there is an urgent need to explore novel supervision signals and technical approaches. In this paper, we propose verifier engineering, a novel post-training paradigm specifically designed for the era of foundation models. The core of verifier engineering involves leveraging a suite of automated verifiers to perform verification tasks and deliver meaningful feedback to foundation models. We systematically categorize the verifier engineering process into three essential stages: search, verify, and feedback, and provide a comprehensive review of state-of-the-art research developments within each stage. We believe that verifier engineering constitutes a fundamental pathway toward achieving Artificial General Intelligence.

Summary

AI-Generated Summary

PDF232November 19, 2024