ShareLMコレクションとプラグイン:コミュニティの利益のための人間とモデルのチャットの貢献
The ShareLM Collection and Plugin: Contributing Human-Model Chats for the Benefit of the Community
August 15, 2024
著者: Shachar Don-Yehiya, Leshem Choshen, Omri Abend
cs.AI
要旨
人間とモデルの対話は、ユーザーの現実世界のシナリオ、行動、ニーズを垣間見る窓となり、モデルの開発と研究にとって貴重なリソースです。営利企業は自社モデルのAPIを通じてユーザーデータを収集し、内部で使用して自社モデルを改善していますが、オープンソースおよび研究コミュニティは遅れを取っています。
私たちは、大規模言語モデルとの人間の対話を統一したデータセットであるShareLMコレクションと、それに付随するプラグインを紹介します。このプラグインは、ユーザーが自発的にモデルとの対話を提供できるWeb拡張機能です。チャットを共有するプラットフォームがほとんどない中、ShareLMプラグインはこの機能を追加し、ユーザーがほとんどのプラットフォームからの対話を共有できるようにします。プラグインは、ユーザーが対話全体および個々の応答に対して評価を行い、ローカルストレージから離れる前に非公開にしたい対話を削除することを可能にします。私たちはプラグインを通じて収集された対話をShareLMコレクションの一部として公開し、オープンな人間とモデルのデータの分野におけるさらなるコミュニティの取り組みを呼びかけます。
コード、プラグイン、データは公開されています。
English
Human-model conversations provide a window into users' real-world scenarios,
behavior, and needs, and thus are a valuable resource for model development and
research. While for-profit companies collect user data through the APIs of
their models, using it internally to improve their own models, the open source
and research community lags behind.
We introduce the ShareLM collection, a unified set of human conversations
with large language models, and its accompanying plugin, a Web extension for
voluntarily contributing user-model conversations. Where few platforms share
their chats, the ShareLM plugin adds this functionality, thus, allowing users
to share conversations from most platforms. The plugin allows the user to rate
their conversations, both at the conversation and the response levels, and
delete conversations they prefer to keep private before they ever leave the
user's local storage. We release the plugin conversations as part of the
ShareLM collection, and call for more community effort in the field of open
human-model data.
The code, plugin, and data are available.Summary
AI-Generated Summary