프로그램 합성을 통한 자연어 명령어 처리
Natural Language Commanding via Program Synthesis
June 6, 2023
저자: Apurva Gandhi, Thong Q. Nguyen, Huitian Jiao, Robert Steen, Ameya Bhatawdekar
cs.AI
초록
본 논문에서는 Microsoft Office와 같은 생산성 소프트웨어를 위한 자연어 친화적 AI 시스템인 Semantic Interpreter를 소개한다. 이 시스템은 대규모 언어 모델(LLMs)을 활용하여 애플리케이션 기능 간에 사용자 의도를 실행한다. LLMs는 자연어로 표현된 사용자 의도를 이해하는 데 탁월하지만, 텍스트 간 변환 이상의 애플리케이션 특화 사용자 의도를 충족시키기에는 부족하다. 따라서 우리는 Office 애플리케이션 내에서 동작을 수행하고 엔티티와 상호작용하기 위해 특화된 간결하고 고수준의 언어인 Office 도메인 특화 언어(ODSL)를 도입한다. Semantic Interpreter는 LLMs를 활용한 분석-검색 프롬프트 구성 방법을 통해 프로그램 합성을 수행하며, 자연어 사용자 발화를 ODSL 프로그램으로 변환하여 애플리케이션 API로 트랜스파일링한 후 실행할 수 있도록 한다. 본 논문에서는 주로 Microsoft PowerPoint에 대한 연구 탐구를 중심으로 논의를 진행한다.
English
We present Semantic Interpreter, a natural language-friendly AI system for
productivity software such as Microsoft Office that leverages large language
models (LLMs) to execute user intent across application features. While LLMs
are excellent at understanding user intent expressed as natural language, they
are not sufficient for fulfilling application-specific user intent that
requires more than text-to-text transformations. We therefore introduce the
Office Domain Specific Language (ODSL), a concise, high-level language
specialized for performing actions in and interacting with entities in Office
applications. Semantic Interpreter leverages an Analysis-Retrieval prompt
construction method with LLMs for program synthesis, translating natural
language user utterances to ODSL programs that can be transpiled to application
APIs and then executed. We focus our discussion primarily on a research
exploration for Microsoft PowerPoint.