ChatPaper.aiChatPaper

La Collection ShareLM et son Plugin : Contribuer aux Conversations Humain-Modèle pour le Bien de la Communauté

The ShareLM Collection and Plugin: Contributing Human-Model Chats for the Benefit of the Community

August 15, 2024
papers.authors: Shachar Don-Yehiya, Leshem Choshen, Omri Abend
cs.AI

papers.abstract

Les conversations entre humains et modèles offrent un aperçu des scénarios réels des utilisateurs, de leurs comportements et de leurs besoins, constituant ainsi une ressource précieuse pour le développement et la recherche sur les modèles. Alors que les entreprises à but lucratif collectent des données utilisateurs via les API de leurs modèles, les utilisant en interne pour améliorer leurs propres modèles, la communauté open source et de recherche est à la traîne. Nous présentons la collection ShareLM, un ensemble unifié de conversations humaines avec des grands modèles de langage, ainsi que son plugin d'accompagnement, une extension Web permettant de contribuer volontairement des conversations utilisateur-modèle. Alors que peu de plateformes partagent leurs discussions, le plugin ShareLM ajoute cette fonctionnalité, permettant ainsi aux utilisateurs de partager des conversations provenant de la plupart des plateformes. Le plugin permet à l'utilisateur d'évaluer ses conversations, à la fois au niveau de la conversation et des réponses, et de supprimer les conversations qu'il préfère garder privées avant qu'elles ne quittent le stockage local de l'utilisateur. Nous publions les conversations du plugin dans le cadre de la collection ShareLM, et appelons à un effort communautaire accru dans le domaine des données ouvertes humain-modèle. Le code, le plugin et les données sont disponibles.
English
Human-model conversations provide a window into users' real-world scenarios, behavior, and needs, and thus are a valuable resource for model development and research. While for-profit companies collect user data through the APIs of their models, using it internally to improve their own models, the open source and research community lags behind. We introduce the ShareLM collection, a unified set of human conversations with large language models, and its accompanying plugin, a Web extension for voluntarily contributing user-model conversations. Where few platforms share their chats, the ShareLM plugin adds this functionality, thus, allowing users to share conversations from most platforms. The plugin allows the user to rate their conversations, both at the conversation and the response levels, and delete conversations they prefer to keep private before they ever leave the user's local storage. We release the plugin conversations as part of the ShareLM collection, and call for more community effort in the field of open human-model data. The code, plugin, and data are available.
PDF111November 26, 2024