LAMBDA: Een Groot Model Gebaseerde Data Agent
LAMBDA: A Large Model Based Data Agent
July 24, 2024
Auteurs: Maojun Sun, Ruijian Han, Binyan Jiang, Houduo Qi, Defeng Sun, Yancheng Yuan, Jian Huang
cs.AI
Samenvatting
We introduceren ``LAMBDA," een nieuw open-source, code-vrij multi-agent data-analyse systeem dat gebruikmaakt van de kracht van grote modellen. LAMBDA is ontworpen om data-analyse uitdagingen in complexe data-gedreven toepassingen aan te pakken door het gebruik van innovatief ontworpen data-agents die iteratief en generatief werken met natuurlijke taal. De kern van LAMBDA bestaat uit twee belangrijke agentrollen: de programmeur en de inspecteur, die naadloos samenwerken. Specifiek genereert de programmeur code op basis van de instructies van de gebruiker en domeinspecifieke kennis, versterkt door geavanceerde modellen. Tegelijkertijd debugt de inspecteur de code wanneer nodig. Om robuustheid te waarborgen en ongunstige scenario's te hanteren, beschikt LAMBDA over een gebruikersinterface die directe gebruikersinterventie in de operationele loop mogelijk maakt. Daarnaast kan LAMBDA flexibel externe modellen en algoritmen integreren via ons kennisintegratiemechanisme, waardoor het voldoet aan de behoeften van op maat gemaakte data-analyse. LAMBDA heeft sterke prestaties getoond op diverse machine learning datasets. Het heeft het potentieel om de praktijk en het analyseparadigma van datawetenschap te verbeteren door menselijke en kunstmatige intelligentie naadloos te integreren, waardoor het toegankelijker, effectiever en efficiënter wordt voor individuen met diverse achtergronden. De sterke prestaties van LAMBDA bij het oplossen van datawetenschapsproblemen worden gedemonstreerd in verschillende casestudies, die te vinden zijn op https://www.polyu.edu.hk/ama/cmfai/lambda.html.
English
We introduce ``LAMBDA," a novel open-source, code-free multi-agent data
analysis system that that harnesses the power of large models. LAMBDA is
designed to address data analysis challenges in complex data-driven
applications through the use of innovatively designed data agents that operate
iteratively and generatively using natural language. At the core of LAMBDA are
two key agent roles: the programmer and the inspector, which are engineered to
work together seamlessly. Specifically, the programmer generates code based on
the user's instructions and domain-specific knowledge, enhanced by advanced
models. Meanwhile, the inspector debugs the code when necessary. To ensure
robustness and handle adverse scenarios, LAMBDA features a user interface that
allows direct user intervention in the operational loop. Additionally, LAMBDA
can flexibly integrate external models and algorithms through our knowledge
integration mechanism, catering to the needs of customized data analysis.
LAMBDA has demonstrated strong performance on various machine learning
datasets. It has the potential to enhance data science practice and analysis
paradigm by seamlessly integrating human and artificial intelligence, making it
more accessible, effective, and efficient for individuals from diverse
backgrounds. The strong performance of LAMBDA in solving data science problems
is demonstrated in several case studies, which are presented at
https://www.polyu.edu.hk/ama/cmfai/lambda.html.