ChatPaper.aiChatPaper

Natürliche Sprachsteuerung durch Programmsynthese

Natural Language Commanding via Program Synthesis

June 6, 2023
Autoren: Apurva Gandhi, Thong Q. Nguyen, Huitian Jiao, Robert Steen, Ameya Bhatawdekar
cs.AI

Zusammenfassung

Wir stellen Semantic Interpreter vor, ein KI-System für Produktivitätssoftware wie Microsoft Office, das benutzerfreundlich für natürliche Sprache ist und große Sprachmodelle (LLMs) nutzt, um Benutzerabsichten über Anwendungsfunktionen hinweg auszuführen. Während LLMs hervorragend darin sind, Benutzerabsichten zu verstehen, die in natürlicher Sprache ausgedrückt werden, reichen sie allein nicht aus, um anwendungsspezifische Benutzerabsichten zu erfüllen, die mehr als Text-zu-Text-Transformationen erfordern. Daher führen wir die Office Domain Specific Language (ODSL) ein, eine prägnante, hochrangige Sprache, die speziell für die Ausführung von Aktionen und die Interaktion mit Entitäten in Office-Anwendungen entwickelt wurde. Semantic Interpreter nutzt eine Analyse-Retrieval-Prompt-Konstruktionsmethode mit LLMs für die Programmsynthese, indem es Benutzeräußerungen in natürlicher Sprache in ODSL-Programme übersetzt, die dann in Anwendungs-APIs transpiliert und ausgeführt werden können. Unsere Diskussion konzentriert sich hauptsächlich auf eine Forschungsexploration für Microsoft PowerPoint.
English
We present Semantic Interpreter, a natural language-friendly AI system for productivity software such as Microsoft Office that leverages large language models (LLMs) to execute user intent across application features. While LLMs are excellent at understanding user intent expressed as natural language, they are not sufficient for fulfilling application-specific user intent that requires more than text-to-text transformations. We therefore introduce the Office Domain Specific Language (ODSL), a concise, high-level language specialized for performing actions in and interacting with entities in Office applications. Semantic Interpreter leverages an Analysis-Retrieval prompt construction method with LLMs for program synthesis, translating natural language user utterances to ODSL programs that can be transpiled to application APIs and then executed. We focus our discussion primarily on a research exploration for Microsoft PowerPoint.
PDF22December 15, 2024