ChatPaper.aiChatPaper

La Collezione ShareLM e il Plugin: Contribuire con Chat Umano-Modello per il Beneficio della Comunità

The ShareLM Collection and Plugin: Contributing Human-Model Chats for the Benefit of the Community

August 15, 2024
Autori: Shachar Don-Yehiya, Leshem Choshen, Omri Abend
cs.AI

Abstract

Le conversazioni uomo-modello offrono una finestra sugli scenari del mondo reale, sui comportamenti e sulle esigenze degli utenti, rappresentando quindi una risorsa preziosa per lo sviluppo e la ricerca sui modelli. Mentre le aziende a scopo di lucro raccolgono dati degli utenti attraverso le API dei loro modelli, utilizzandoli internamente per migliorare i propri sistemi, la comunità open source e di ricerca rimane indietro. Presentiamo la raccolta ShareLM, un insieme unificato di conversazioni umane con modelli linguistici di grandi dimensioni, e il relativo plugin, un'estensione web per contribuire volontariamente alle conversazioni utente-modello. Mentre poche piattaforme condividono le loro chat, il plugin ShareLM aggiunge questa funzionalità, consentendo agli utenti di condividere conversazioni dalla maggior parte delle piattaforme. Il plugin permette all'utente di valutare le proprie conversazioni, sia a livello di dialogo che di singola risposta, e di eliminare le conversazioni che preferisce mantenere private prima che queste lascino la memoria locale dell'utente. Rilasciamo le conversazioni raccolte tramite il plugin come parte della raccolta ShareLM e invitiamo a un maggiore impegno della comunità nel campo dei dati aperti sulle interazioni uomo-modello. Il codice, il plugin e i dati sono disponibili.
English
Human-model conversations provide a window into users' real-world scenarios, behavior, and needs, and thus are a valuable resource for model development and research. While for-profit companies collect user data through the APIs of their models, using it internally to improve their own models, the open source and research community lags behind. We introduce the ShareLM collection, a unified set of human conversations with large language models, and its accompanying plugin, a Web extension for voluntarily contributing user-model conversations. Where few platforms share their chats, the ShareLM plugin adds this functionality, thus, allowing users to share conversations from most platforms. The plugin allows the user to rate their conversations, both at the conversation and the response levels, and delete conversations they prefer to keep private before they ever leave the user's local storage. We release the plugin conversations as part of the ShareLM collection, and call for more community effort in the field of open human-model data. The code, plugin, and data are available.
PDF111November 26, 2024