De ShareLM-collectie en -plugin: Het bijdragen van mens-model chats ten behoeve van de gemeenschap
The ShareLM Collection and Plugin: Contributing Human-Model Chats for the Benefit of the Community
August 15, 2024
Auteurs: Shachar Don-Yehiya, Leshem Choshen, Omri Abend
cs.AI
Samenvatting
Gesprekken tussen mensen en modellen bieden een inkijk in real-world scenario's, gedrag en behoeften van gebruikers, en zijn daarom een waardevolle bron voor modelontwikkeling en onderzoek. Terwijl bedrijven met winstoogmerk gebruikersgegevens verzamelen via de API's van hun modellen en deze intern gebruiken om hun eigen modellen te verbeteren, loopt de open source- en onderzoeksgemeenschap achter.
Wij introduceren de ShareLM-collectie, een uniforme set van menselijke gesprekken met grote taalmodellen, en de bijbehorende plugin, een webextensie voor het vrijwillig bijdragen van gebruikers-modelgesprekken. Waar weinig platforms hun chats delen, voegt de ShareLM-plugin deze functionaliteit toe, waardoor gebruikers gesprekken van de meeste platforms kunnen delen. De plugin stelt gebruikers in staat om hun gesprekken te beoordelen, zowel op gespreks- als op reactieniveau, en gesprekken die ze privé willen houden te verwijderen voordat deze ooit de lokale opslag van de gebruiker verlaten. We geven de plugin-gesprekken vrij als onderdeel van de ShareLM-collectie en roepen op tot meer gemeenschapsinspanningen op het gebied van open mens-modeldata.
De code, plugin en data zijn beschikbaar.
English
Human-model conversations provide a window into users' real-world scenarios,
behavior, and needs, and thus are a valuable resource for model development and
research. While for-profit companies collect user data through the APIs of
their models, using it internally to improve their own models, the open source
and research community lags behind.
We introduce the ShareLM collection, a unified set of human conversations
with large language models, and its accompanying plugin, a Web extension for
voluntarily contributing user-model conversations. Where few platforms share
their chats, the ShareLM plugin adds this functionality, thus, allowing users
to share conversations from most platforms. The plugin allows the user to rate
their conversations, both at the conversation and the response levels, and
delete conversations they prefer to keep private before they ever leave the
user's local storage. We release the plugin conversations as part of the
ShareLM collection, and call for more community effort in the field of open
human-model data.
The code, plugin, and data are available.