Table-GPT : GPT adapté aux tableaux pour diverses tâches tabulaires

papers.abstract

Les modèles de langage, tels que GPT-3.5 et ChatGPT, démontrent des capacités remarquables à suivre des instructions humaines variées et à accomplir un large éventail de tâches. Cependant, lorsqu'on explore ces modèles de langage à l'aide d'une série de tâches élémentaires de compréhension de tableaux, on observe que les modèles actuels restent sous-optimaux pour de nombreuses tâches liées aux tableaux, probablement parce qu'ils sont pré-entraînés principalement sur des textes en langage naturel unidimensionnels, alors que les tableaux relationnels sont des objets bidimensionnels. Dans ce travail, nous proposons un nouveau paradigme d'"ajustement sur tableaux" (table-tuning), où nous continuons à entraîner/affiner des modèles de langage comme GPT-3.5 et ChatGPT, en utilisant des tâches variées synthétisées à partir de tableaux réels comme données d'entraînement, dans le but d'améliorer la capacité des modèles de langage à comprendre les tableaux et à effectuer des tâches liées aux tableaux. Nous montrons que nos modèles Table-GPT résultants démontrent (1) de meilleures capacités de compréhension des tableaux, en surpassant systématiquement les versions standard de GPT-3.5 et ChatGPT sur un large éventail de tâches de tableaux, y compris des tâches inédites non vues lors de l'entraînement, et (2) une forte généralisation, dans leur capacité à répondre à des instructions humaines variées pour effectuer de nouvelles tâches de tableaux, d'une manière similaire à GPT-3.5 et ChatGPT.

English

Language models, such as GPT-3.5 and ChatGPT, demonstrate remarkable abilities to follow diverse human instructions and perform a wide range of tasks. However, when probing language models using a range of basic table-understanding tasks, we observe that today's language models are still sub-optimal in many table-related tasks, likely because they are pre-trained predominantly on one-dimensional natural-language texts, whereas relational tables are two-dimensional objects. In this work, we propose a new "table-tuning" paradigm, where we continue to train/fine-tune language models like GPT-3.5 and ChatGPT, using diverse table-tasks synthesized from real tables as training data, with the goal of enhancing language models' ability to understand tables and perform table tasks. We show that our resulting Table-GPT models demonstrate (1) better table-understanding capabilities, by consistently outperforming the vanilla GPT-3.5 and ChatGPT, on a wide-range of table tasks, including holdout unseen tasks, and (2) strong generalizability, in its ability to respond to diverse human instructions to perform new table-tasks, in a manner similar to GPT-3.5 and ChatGPT.

Table-GPT : GPT adapté aux tableaux pour diverses tâches tabulaires

Table-GPT: Table-tuned GPT for Diverse Table Tasks

papers.abstract

Support