A Coleção ShareLM e o Plugin: Contribuindo com Conversas entre Humanos e Modelos para o Benefício da Comunidade
The ShareLM Collection and Plugin: Contributing Human-Model Chats for the Benefit of the Community
August 15, 2024
Autores: Shachar Don-Yehiya, Leshem Choshen, Omri Abend
cs.AI
Resumo
As conversas entre humanos e modelos fornecem uma visão das situações, comportamentos e necessidades do usuário no mundo real, sendo assim um recurso valioso para o desenvolvimento e pesquisa de modelos. Enquanto empresas com fins lucrativos coletam dados do usuário por meio das APIs de seus modelos, utilizando-os internamente para aprimorar seus próprios modelos, a comunidade de código aberto e de pesquisa está atrasada.
Apresentamos a coleção ShareLM, um conjunto unificado de conversas humanas com grandes modelos de linguagem, e seu plugin correspondente, uma extensão da Web para contribuir voluntariamente com conversas entre usuário e modelo. Enquanto poucas plataformas compartilham suas conversas, o plugin ShareLM adiciona essa funcionalidade, permitindo assim que os usuários compartilhem conversas de praticamente todas as plataformas. O plugin permite que o usuário avalie suas conversas, tanto no nível da conversa quanto no nível da resposta, e exclua conversas que preferem manter privadas antes que saiam do armazenamento local do usuário. Lançamos as conversas do plugin como parte da coleção ShareLM e solicitamos mais esforços da comunidade no campo de dados abertos entre humanos e modelos.
O código, o plugin e os dados estão disponíveis.
English
Human-model conversations provide a window into users' real-world scenarios,
behavior, and needs, and thus are a valuable resource for model development and
research. While for-profit companies collect user data through the APIs of
their models, using it internally to improve their own models, the open source
and research community lags behind.
We introduce the ShareLM collection, a unified set of human conversations
with large language models, and its accompanying plugin, a Web extension for
voluntarily contributing user-model conversations. Where few platforms share
their chats, the ShareLM plugin adds this functionality, thus, allowing users
to share conversations from most platforms. The plugin allows the user to rate
their conversations, both at the conversation and the response levels, and
delete conversations they prefer to keep private before they ever leave the
user's local storage. We release the plugin conversations as part of the
ShareLM collection, and call for more community effort in the field of open
human-model data.
The code, plugin, and data are available.Summary
AI-Generated Summary