LML: Aprendizaje de Modelo de Lenguaje en un Conjunto de Datos para Predicción con Datos Aumentados
LML: Language Model Learning a Dataset for Data-Augmented Prediction
September 27, 2024
Autores: Praneeth Vadlapati
cs.AI
Resumen
Este artículo presenta un nuevo enfoque para utilizar Modelos de Lenguaje Grande (LLMs) en tareas de clasificación, que típicamente se manejan utilizando modelos de Aprendizaje Automático (ML). A diferencia de los modelos de ML que dependen en gran medida de la limpieza de datos y la ingeniería de características, este método simplifica el proceso utilizando LLMs. Este artículo propone un nuevo concepto llamado "Aprendizaje de Modelos de Lenguaje (LML)" impulsado por un nuevo método llamado "Predicción Aumentada de Datos (DAP)". La clasificación se realiza por LLMs utilizando un método similar a la exploración y comprensión manual de los datos por humanos y la toma de decisiones de clasificación utilizando los datos como referencia. Los datos de entrenamiento se resumen y evalúan para determinar las características que más influyen en la clasificación de cada etiqueta. En el proceso de DAP, el sistema utiliza el resumen de datos para crear automáticamente una consulta, que se utiliza para recuperar filas relevantes del conjunto de datos. Una clasificación es generada por el LLM utilizando el resumen de datos y las filas relevantes, asegurando una precisión satisfactoria incluso con datos complejos. El uso de resúmenes de datos y datos similares en DAP garantiza la toma de decisiones contextualmente consciente. El método propuesto utiliza las palabras "Actuar como un Modelo de Aprendizaje Automático Explicable" en la solicitud para mejorar la interpretabilidad de las predicciones al permitir a los usuarios revisar la lógica detrás de cada predicción. En algunos casos de prueba, el sistema obtuvo una precisión superior al 90%, demostrando la efectividad del sistema y su potencial para superar a los modelos de ML convencionales en varios escenarios. El código está disponible en https://github.com/Pro-GenAI/LML-DAP.
English
This paper introduces a new approach to using Large Language Models (LLMs)
for classification tasks, which are typically handled using Machine Learning
(ML) models. Unlike ML models that rely heavily on data cleaning and feature
engineering, this method streamlines the process using LLMs. This paper
proposes a new concept called "Language Model Learning (LML)" powered by a new
method called "Data-Augmented Prediction (DAP)". The classification is
performed by LLMs using a method similar to humans manually exploring and
understanding the data and deciding classifications using data as a reference.
Training data is summarized and evaluated to determine the features that lead
to the classification of each label the most. In the process of DAP, the system
uses the data summary to automatically create a query, which is used to
retrieve relevant rows from the dataset. A classification is generated by the
LLM using data summary and relevant rows, ensuring satisfactory accuracy even
with complex data. Usage of data summary and similar data in DAP ensures
context-aware decision-making. The proposed method uses the words "Act as an
Explainable Machine Learning Model" in the prompt to enhance the
interpretability of the predictions by allowing users to review the logic
behind each prediction. In some test cases, the system scored an accuracy above
90%, proving the effectiveness of the system and its potential to outperform
conventional ML models in various scenarios. The code is available at
https://github.com/Pro-GenAI/LML-DAPSummary
AI-Generated Summary