ChatPaper.aiChatPaper

ShareLMコレクションとプラグイン:コミュニティの利益のための人間とモデルのチャットの貢献

The ShareLM Collection and Plugin: Contributing Human-Model Chats for the Benefit of the Community

August 15, 2024
著者: Shachar Don-Yehiya, Leshem Choshen, Omri Abend
cs.AI

要旨

人間とモデルの対話は、ユーザーの現実世界のシナリオ、行動、ニーズを垣間見る窓となり、モデルの開発と研究にとって貴重なリソースです。営利企業は自社モデルのAPIを通じてユーザーデータを収集し、内部で使用して自社モデルを改善していますが、オープンソースおよび研究コミュニティは遅れを取っています。 私たちは、大規模言語モデルとの人間の対話を統一したデータセットであるShareLMコレクションと、それに付随するプラグインを紹介します。このプラグインは、ユーザーが自発的にモデルとの対話を提供できるWeb拡張機能です。チャットを共有するプラットフォームがほとんどない中、ShareLMプラグインはこの機能を追加し、ユーザーがほとんどのプラットフォームからの対話を共有できるようにします。プラグインは、ユーザーが対話全体および個々の応答に対して評価を行い、ローカルストレージから離れる前に非公開にしたい対話を削除することを可能にします。私たちはプラグインを通じて収集された対話をShareLMコレクションの一部として公開し、オープンな人間とモデルのデータの分野におけるさらなるコミュニティの取り組みを呼びかけます。 コード、プラグイン、データは公開されています。
English
Human-model conversations provide a window into users' real-world scenarios, behavior, and needs, and thus are a valuable resource for model development and research. While for-profit companies collect user data through the APIs of their models, using it internally to improve their own models, the open source and research community lags behind. We introduce the ShareLM collection, a unified set of human conversations with large language models, and its accompanying plugin, a Web extension for voluntarily contributing user-model conversations. Where few platforms share their chats, the ShareLM plugin adds this functionality, thus, allowing users to share conversations from most platforms. The plugin allows the user to rate their conversations, both at the conversation and the response levels, and delete conversations they prefer to keep private before they ever leave the user's local storage. We release the plugin conversations as part of the ShareLM collection, and call for more community effort in the field of open human-model data. The code, plugin, and data are available.

Summary

AI-Generated Summary

PDF111November 26, 2024