LAMBDA : Un agent de données basé sur un grand modèle
LAMBDA: A Large Model Based Data Agent
July 24, 2024
Auteurs: Maojun Sun, Ruijian Han, Binyan Jiang, Houduo Qi, Defeng Sun, Yancheng Yuan, Jian Huang
cs.AI
Résumé
Nous présentons « LAMBDA », un nouveau système d'analyse de données multi-agent open-source et sans code, qui exploite la puissance des grands modèles. LAMBDA est conçu pour relever les défis de l'analyse de données dans des applications complexes basées sur les données, grâce à l'utilisation d'agents de données innovants qui opèrent de manière itérative et générative en utilisant le langage naturel. Au cœur de LAMBDA se trouvent deux rôles clés d'agents : le programmeur et l'inspecteur, conçus pour fonctionner ensemble de manière fluide. Plus précisément, le programmeur génère du code en fonction des instructions de l'utilisateur et des connaissances spécifiques au domaine, enrichies par des modèles avancés. Pendant ce temps, l'inspecteur débogue le code si nécessaire. Pour garantir la robustesse et gérer les scénarios défavorables, LAMBDA dispose d'une interface utilisateur qui permet une intervention directe de l'utilisateur dans la boucle opérationnelle. De plus, LAMBDA peut intégrer de manière flexible des modèles et algorithmes externes grâce à notre mécanisme d'intégration de connaissances, répondant ainsi aux besoins d'analyse de données personnalisées. LAMBDA a démontré de solides performances sur divers ensembles de données d'apprentissage automatique. Il a le potentiel d'améliorer la pratique et le paradigme de l'analyse en science des données en intégrant de manière fluide l'intelligence humaine et artificielle, le rendant plus accessible, efficace et efficient pour des individus issus de divers horizons. Les solides performances de LAMBDA dans la résolution de problèmes de science des données sont illustrées dans plusieurs études de cas, présentées à l'adresse suivante : https://www.polyu.edu.hk/ama/cmfai/lambda.html.
English
We introduce ``LAMBDA," a novel open-source, code-free multi-agent data
analysis system that that harnesses the power of large models. LAMBDA is
designed to address data analysis challenges in complex data-driven
applications through the use of innovatively designed data agents that operate
iteratively and generatively using natural language. At the core of LAMBDA are
two key agent roles: the programmer and the inspector, which are engineered to
work together seamlessly. Specifically, the programmer generates code based on
the user's instructions and domain-specific knowledge, enhanced by advanced
models. Meanwhile, the inspector debugs the code when necessary. To ensure
robustness and handle adverse scenarios, LAMBDA features a user interface that
allows direct user intervention in the operational loop. Additionally, LAMBDA
can flexibly integrate external models and algorithms through our knowledge
integration mechanism, catering to the needs of customized data analysis.
LAMBDA has demonstrated strong performance on various machine learning
datasets. It has the potential to enhance data science practice and analysis
paradigm by seamlessly integrating human and artificial intelligence, making it
more accessible, effective, and efficient for individuals from diverse
backgrounds. The strong performance of LAMBDA in solving data science problems
is demonstrated in several case studies, which are presented at
https://www.polyu.edu.hk/ama/cmfai/lambda.html.Summary
AI-Generated Summary