ChatPaper.aiChatPaper

AIDE: Esplorazione Guidata dall'Intelligenza Artificiale nello Spazio del Codice

AIDE: AI-Driven Exploration in the Space of Code

February 18, 2025
Autori: Zhengyao Jiang, Dominik Schmidt, Dhruv Srikanth, Dixing Xu, Ian Kaplan, Deniss Jacenko, Yuxiang Wu
cs.AI

Abstract

Il machine learning, fondamento dell'intelligenza artificiale moderna, ha guidato innovazioni che hanno trasformato radicalmente il mondo. Tuttavia, dietro questi progressi si nasconde un processo complesso e spesso tedioso, che richiede un'intensa iterazione e sperimentazione in termini di risorse computazionali e lavoro. Gli ingegneri e gli scienziati che sviluppano modelli di machine learning dedicano gran parte del loro tempo a compiti di prova ed errore, anziché concentrarsi sulla concettualizzazione di soluzioni innovative o ipotesi di ricerca. Per affrontare questa sfida, introduciamo AI-Driven Exploration (AIDE), un agente di ingegneria del machine learning alimentato da modelli linguistici di grandi dimensioni (LLM). AIDE inquadra l'ingegneria del machine learning come un problema di ottimizzazione del codice e formula il processo di prova ed errore come una ricerca ad albero nello spazio delle soluzioni potenziali. Riusando e affinando strategicamente le soluzioni promettenti, AIDE scambia efficacemente risorse computazionali con prestazioni migliorate, raggiungendo risultati all'avanguardia su molteplici benchmark di ingegneria del machine learning, tra cui le nostre valutazioni su Kaggle, OpenAI MLE-Bench e METRs RE-Bench.
English
Machine learning, the foundation of modern artificial intelligence, has driven innovations that have fundamentally transformed the world. Yet, behind advancements lies a complex and often tedious process requiring labor and compute intensive iteration and experimentation. Engineers and scientists developing machine learning models spend much of their time on trial-and-error tasks instead of conceptualizing innovative solutions or research hypotheses. To address this challenge, we introduce AI-Driven Exploration (AIDE), a machine learning engineering agent powered by large language models (LLMs). AIDE frames machine learning engineering as a code optimization problem, and formulates trial-and-error as a tree search in the space of potential solutions. By strategically reusing and refining promising solutions, AIDE effectively trades computational resources for enhanced performance, achieving state-of-the-art results on multiple machine learning engineering benchmarks, including our Kaggle evaluations, OpenAI MLE-Bench and METRs RE-Bench.

Summary

AI-Generated Summary

PDF76February 20, 2025