ChatPaper.aiChatPaper

LPZero : Recherche de proxy à coût nul pour les modèles linguistiques à partir de zéro

LPZero: Language Model Zero-cost Proxy Search from Zero

October 7, 2024
Auteurs: Peijie Dong, Lujun Li, Xiang Liu, Zhenheng Tang, Xuebo Liu, Qiang Wang, Xiaowen Chu
cs.AI

Résumé

Malgré ses performances exceptionnelles, la Recherche d'Architecture Neuronale (RAN) est critiquée pour sa consommation massive de calcul. Récemment, la RAN sans entraînement préalable est apparue comme une approche prometteuse en exploitant des proxies sans coût (ZC), qui réduisent considérablement les exigences computationnelles. Malgré cela, les proxies ZC existants reposent fortement sur des connaissances d'experts et entraînent des coûts significatifs d'essais et d'erreurs. Particulièrement dans les tâches de Traitement du Langage Naturel (NLP), la plupart des proxies ZC existants ne parviennent pas à surpasser les performances de la ligne de base naïve. Pour relever ces défis, nous introduisons un nouveau cadre, LPZero, qui est le premier à concevoir automatiquement des proxies ZC pour diverses tâches, obtenant une meilleure cohérence de classement que les proxies conçus par des humains. Plus précisément, nous modélisons le proxy ZC comme une équation symbolique et incorporons un espace de recherche de proxy unifié qui englobe les proxies ZC existants, composés d'un ensemble prédéfini de symboles mathématiques. Pour rechercher de manière heuristique le meilleur proxy ZC, LPZero intègre la programmation génétique pour trouver la composition symbolique optimale. Nous proposons une Stratégie d'Élagage Basée sur des Règles (RPS), qui élimine de manière préventive les proxies peu prometteurs, atténuant ainsi le risque de dégradation des proxies. Des expériences approfondies sur FlexiBERT, GPT-2 et LLaMA-7B démontrent la capacité de classement supérieure de LPZero et ses performances sur les tâches en aval par rapport aux approches actuelles.
English
In spite of the outstanding performance, Neural Architecture Search (NAS) is criticized for massive computation. Recently, Zero-shot NAS has emerged as a promising approach by exploiting Zero-cost (ZC) proxies, which markedly reduce computational demands. Despite this, existing ZC proxies heavily rely on expert knowledge and incur significant trial-and-error costs. Particularly in NLP tasks, most existing ZC proxies fail to surpass the performance of the naive baseline. To address these challenges, we introduce a novel framework, LPZero, which is the first to automatically design ZC proxies for various tasks, achieving higher ranking consistency than human-designed proxies. Specifically, we model the ZC proxy as a symbolic equation and incorporate a unified proxy search space that encompasses existing ZC proxies, which are composed of a predefined set of mathematical symbols. To heuristically search for the best ZC proxy, LPZero incorporates genetic programming to find the optimal symbolic composition. We propose a Rule-based Pruning Strategy (RPS), which preemptively eliminates unpromising proxies, thereby mitigating the risk of proxy degradation. Extensive experiments on FlexiBERT, GPT-2, and LLaMA-7B demonstrate LPZero's superior ranking ability and performance on downstream tasks compared to current approaches.

Summary

AI-Generated Summary

PDF22November 16, 2024