ChatPaper.aiChatPaper

Lemur: Armonizzazione tra Linguaggio Naturale e Codice per Agenti Linguistici

Lemur: Harmonizing Natural Language and Code for Language Agents

October 10, 2023
Autori: Yiheng Xu, Hongjin Su, Chen Xing, Boyu Mi, Qian Liu, Weijia Shi, Binyuan Hui, Fan Zhou, Yitao Liu, Tianbao Xie, Zhoujun Cheng, Siheng Zhao, Lingpeng Kong, Bailin Wang, Caiming Xiong, Tao Yu
cs.AI

Abstract

Introduciamo Lemur e Lemur-Chat, modelli linguistici accessibili pubblicamente e ottimizzati sia per le capacità di linguaggio naturale che di programmazione, progettati per fungere da spina dorsale di agenti linguistici versatili. L'evoluzione dai modelli di chat linguistici a veri e propri agenti linguistici funzionali richiede che i modelli non solo padroneggino l'interazione umana, il ragionamento e la pianificazione, ma anche che siano radicati negli ambienti rilevanti. Ciò richiede un'armoniosa combinazione di capacità linguistiche e di programmazione nei modelli. Lemur e Lemur-Chat sono proposti per affrontare questa necessità, dimostrando competenze bilanciate in entrambi i domini, a differenza dei modelli open-source esistenti che tendono a specializzarsi in uno solo. Attraverso un'attenta pre-addestramento su un corpus ricco di codice e un fine-tuning su dati di testo e codice, i nostri modelli raggiungono prestazioni medie all'avanguardia su una vasta gamma di benchmark di testo e programmazione tra i modelli open-source. Esperimenti completi dimostrano la superiorità di Lemur rispetto ai modelli open-source esistenti e la sua competenza in vari compiti di agenti che coinvolgono la comunicazione umana, l'uso di strumenti e l'interazione in ambienti completamente e parzialmente osservabili. L'armonizzazione tra linguaggio naturale e linguaggi di programmazione consente a Lemur-Chat di ridurre significativamente il divario con i modelli proprietari nelle capacità degli agenti, fornendo intuizioni chiave per lo sviluppo di agenti open-source avanzati, abili nel ragionamento, nella pianificazione e nel funzionamento senza soluzione di continuità tra diversi ambienti. https://github.com/OpenLemur/Lemur
English
We introduce Lemur and Lemur-Chat, openly accessible language models optimized for both natural language and coding capabilities to serve as the backbone of versatile language agents. The evolution from language chat models to functional language agents demands that models not only master human interaction, reasoning, and planning but also ensure grounding in the relevant environments. This calls for a harmonious blend of language and coding capabilities in the models. Lemur and Lemur-Chat are proposed to address this necessity, demonstrating balanced proficiencies in both domains, unlike existing open-source models that tend to specialize in either. Through meticulous pre-training using a code-intensive corpus and instruction fine-tuning on text and code data, our models achieve state-of-the-art averaged performance across diverse text and coding benchmarks among open-source models. Comprehensive experiments demonstrate Lemur's superiority over existing open-source models and its proficiency across various agent tasks involving human communication, tool usage, and interaction under fully- and partially- observable environments. The harmonization between natural and programming languages enables Lemur-Chat to significantly narrow the gap with proprietary models on agent abilities, providing key insights into developing advanced open-source agents adept at reasoning, planning, and operating seamlessly across environments. https://github.com/OpenLemur/Lemur
PDF333April 17, 2026