LAMBDA: Un Agente Dati Basato su Modelli di Grande Dimensione
LAMBDA: A Large Model Based Data Agent
July 24, 2024
Autori: Maojun Sun, Ruijian Han, Binyan Jiang, Houduo Qi, Defeng Sun, Yancheng Yuan, Jian Huang
cs.AI
Abstract
Introduciamo "LAMBDA", un innovativo sistema open-source e senza codice per l'analisi dati multi-agente che sfrutta la potenza dei modelli di grandi dimensioni. LAMBDA è progettato per affrontare le sfide dell'analisi dati in applicazioni complesse basate sui dati attraverso l'utilizzo di agenti dati progettati in modo innovativo, che operano in modo iterativo e generativo utilizzando il linguaggio naturale. Al cuore di LAMBDA ci sono due ruoli chiave degli agenti: il programmatore e l'ispettore, progettati per lavorare insieme in modo fluido. Nello specifico, il programmatore genera codice basandosi sulle istruzioni dell'utente e sulla conoscenza specifica del dominio, potenziata da modelli avanzati. Nel frattempo, l'ispettore esegue il debug del codice quando necessario. Per garantire robustezza e gestire scenari avversi, LAMBDA include un'interfaccia utente che consente un intervento diretto dell'utente nel ciclo operativo. Inoltre, LAMBDA può integrare in modo flessibile modelli e algoritmi esterni attraverso il nostro meccanismo di integrazione della conoscenza, rispondendo alle esigenze di analisi dati personalizzate. LAMBDA ha dimostrato prestazioni solide su vari dataset di machine learning. Ha il potenziale di migliorare la pratica e il paradigma dell'analisi dati integrando in modo fluido l'intelligenza umana e artificiale, rendendola più accessibile, efficace ed efficiente per individui provenienti da contesti diversi. Le solide prestazioni di LAMBDA nella risoluzione di problemi di data science sono dimostrate in diversi casi di studio, presentati su https://www.polyu.edu.hk/ama/cmfai/lambda.html.
English
We introduce ``LAMBDA," a novel open-source, code-free multi-agent data
analysis system that that harnesses the power of large models. LAMBDA is
designed to address data analysis challenges in complex data-driven
applications through the use of innovatively designed data agents that operate
iteratively and generatively using natural language. At the core of LAMBDA are
two key agent roles: the programmer and the inspector, which are engineered to
work together seamlessly. Specifically, the programmer generates code based on
the user's instructions and domain-specific knowledge, enhanced by advanced
models. Meanwhile, the inspector debugs the code when necessary. To ensure
robustness and handle adverse scenarios, LAMBDA features a user interface that
allows direct user intervention in the operational loop. Additionally, LAMBDA
can flexibly integrate external models and algorithms through our knowledge
integration mechanism, catering to the needs of customized data analysis.
LAMBDA has demonstrated strong performance on various machine learning
datasets. It has the potential to enhance data science practice and analysis
paradigm by seamlessly integrating human and artificial intelligence, making it
more accessible, effective, and efficient for individuals from diverse
backgrounds. The strong performance of LAMBDA in solving data science problems
is demonstrated in several case studies, which are presented at
https://www.polyu.edu.hk/ama/cmfai/lambda.html.