ChatPaper.aiChatPaper

Décomposition et interprétation du langage naturel pour les énoncés complexes

Natural Language Decomposition and Interpretation of Complex Utterances

May 15, 2023
Auteurs: Harsh Jhamtani, Hao Fang, Patrick Xia, Eran Levy, Jacob Andreas, Ben Van Durme
cs.AI

Résumé

Les interfaces en langage naturel nécessitent souvent des données supervisées pour traduire les requêtes des utilisateurs en programmes, requêtes de base de données ou autres représentations structurées d'intention. Lors de la collecte de données, il peut être difficile d'anticiper et de formaliser l'ensemble des besoins des utilisateurs. Par exemple, dans un système conçu pour gérer des requêtes simples (comme trouver mes réunions demain ou déplacer ma réunion avec mon manager à midi), les utilisateurs peuvent également exprimer des requêtes plus élaborées (comme échanger tous mes appels de lundi et mardi). Nous introduisons une approche pour équiper un modèle simple de conversion du langage en code afin de gérer des énoncés complexes via un processus de décomposition hiérarchique du langage naturel. Notre approche utilise un modèle de langage pré-entraîné pour décomposer un énoncé complexe en une séquence d'étapes plus petites en langage naturel, puis interprète chaque étape à l'aide du modèle de conversion du langage en code. Pour tester notre approche, nous collectons et publions DeCU -- un nouveau benchmark NL-to-program pour évaluer la Décomposition des Énoncés Complexes. Les expériences montrent que l'approche proposée permet l'interprétation d'énoncés complexes avec presque aucune donnée d'entraînement complexe, tout en surpassant les approches standard de prompting en few-shot.
English
Natural language interfaces often require supervised data to translate user requests into programs, database queries, or other structured intent representations. During data collection, it can be difficult to anticipate and formalize the full range of user needs -- for example, in a system designed to handle simple requests (like find my meetings tomorrow or move my meeting with my manager to noon), users may also express more elaborate requests (like swap all my calls on Monday and Tuesday). We introduce an approach for equipping a simple language-to-code model to handle complex utterances via a process of hierarchical natural language decomposition. Our approach uses a pre-trained language model to decompose a complex utterance into a sequence of smaller natural language steps, then interprets each step using the language-to-code model. To test our approach, we collect and release DeCU -- a new NL-to-program benchmark to evaluate Decomposition of Complex Utterances. Experiments show that the proposed approach enables the interpretation of complex utterances with almost no complex training data, while outperforming standard few-shot prompting approaches.
PDF20December 15, 2024