LAMBDA: Un Agente de Datos Basado en un Modelo Grande
LAMBDA: A Large Model Based Data Agent
July 24, 2024
Autores: Maojun Sun, Ruijian Han, Binyan Jiang, Houduo Qi, Defeng Sun, Yancheng Yuan, Jian Huang
cs.AI
Resumen
Presentamos "LAMBDA", un novedoso sistema de análisis de datos multiagente de código abierto y sin necesidad de programación que aprovecha el poder de modelos grandes. LAMBDA está diseñado para abordar los desafíos del análisis de datos en aplicaciones complejas basadas en datos mediante el uso de agentes de datos diseñados de manera innovadora que operan de forma iterativa y generativa utilizando lenguaje natural. En el núcleo de LAMBDA se encuentran dos roles clave de agentes: el programador y el inspector, que están diseñados para trabajar juntos de manera fluida. Específicamente, el programador genera código basado en las instrucciones del usuario y el conocimiento específico del dominio, mejorado por modelos avanzados. Mientras tanto, el inspector depura el código cuando es necesario. Para garantizar la robustez y manejar escenarios adversos, LAMBDA cuenta con una interfaz de usuario que permite la intervención directa del usuario en el bucle operativo. Además, LAMBDA puede integrar de manera flexible modelos y algoritmos externos a través de nuestro mecanismo de integración de conocimientos, adaptándose a las necesidades del análisis de datos personalizado. LAMBDA ha demostrado un rendimiento sólido en varios conjuntos de datos de aprendizaje automático. Tiene el potencial de mejorar la práctica de la ciencia de datos y el paradigma de análisis al integrar de manera fluida la inteligencia humana y artificial, haciéndolo más accesible, efectivo y eficiente para personas de diversos orígenes. El sólido rendimiento de LAMBDA en la resolución de problemas de ciencia de datos se demuestra en varios estudios de caso, que se presentan en https://www.polyu.edu.hk/ama/cmfai/lambda.html.
English
We introduce ``LAMBDA," a novel open-source, code-free multi-agent data
analysis system that that harnesses the power of large models. LAMBDA is
designed to address data analysis challenges in complex data-driven
applications through the use of innovatively designed data agents that operate
iteratively and generatively using natural language. At the core of LAMBDA are
two key agent roles: the programmer and the inspector, which are engineered to
work together seamlessly. Specifically, the programmer generates code based on
the user's instructions and domain-specific knowledge, enhanced by advanced
models. Meanwhile, the inspector debugs the code when necessary. To ensure
robustness and handle adverse scenarios, LAMBDA features a user interface that
allows direct user intervention in the operational loop. Additionally, LAMBDA
can flexibly integrate external models and algorithms through our knowledge
integration mechanism, catering to the needs of customized data analysis.
LAMBDA has demonstrated strong performance on various machine learning
datasets. It has the potential to enhance data science practice and analysis
paradigm by seamlessly integrating human and artificial intelligence, making it
more accessible, effective, and efficient for individuals from diverse
backgrounds. The strong performance of LAMBDA in solving data science problems
is demonstrated in several case studies, which are presented at
https://www.polyu.edu.hk/ama/cmfai/lambda.html.Summary
AI-Generated Summary