La colección y complemento ShareLM: Contribuyendo a las conversaciones humano-modelo en beneficio de la comunidad.
The ShareLM Collection and Plugin: Contributing Human-Model Chats for the Benefit of the Community
August 15, 2024
Autores: Shachar Don-Yehiya, Leshem Choshen, Omri Abend
cs.AI
Resumen
Las conversaciones humano-modelo ofrecen una ventana a los escenarios, comportamientos y necesidades del usuario en el mundo real, por lo tanto, son un recurso valioso para el desarrollo y la investigación de modelos. Mientras que las empresas con ánimo de lucro recopilan datos de usuario a través de las API de sus modelos, utilizándolos internamente para mejorar sus propios modelos, la comunidad de código abierto e investigación se queda rezagada.
Presentamos la colección ShareLM, un conjunto unificado de conversaciones humanas con grandes modelos de lenguaje, y su complemento correspondiente, una extensión web para contribuir voluntariamente con conversaciones usuario-modelo. Donde pocas plataformas comparten sus chats, el complemento ShareLM añade esta funcionalidad, permitiendo a los usuarios compartir conversaciones desde la mayoría de las plataformas. El complemento permite al usuario calificar sus conversaciones, tanto a nivel de la conversación como de la respuesta, y eliminar conversaciones que prefieran mantener privadas antes de que abandonen el almacenamiento local del usuario. Publicamos las conversaciones del complemento como parte de la colección ShareLM, y solicitamos un mayor esfuerzo comunitario en el campo de los datos abiertos humano-modelo.
El código, el complemento y los datos están disponibles.
English
Human-model conversations provide a window into users' real-world scenarios,
behavior, and needs, and thus are a valuable resource for model development and
research. While for-profit companies collect user data through the APIs of
their models, using it internally to improve their own models, the open source
and research community lags behind.
We introduce the ShareLM collection, a unified set of human conversations
with large language models, and its accompanying plugin, a Web extension for
voluntarily contributing user-model conversations. Where few platforms share
their chats, the ShareLM plugin adds this functionality, thus, allowing users
to share conversations from most platforms. The plugin allows the user to rate
their conversations, both at the conversation and the response levels, and
delete conversations they prefer to keep private before they ever leave the
user's local storage. We release the plugin conversations as part of the
ShareLM collection, and call for more community effort in the field of open
human-model data.
The code, plugin, and data are available.Summary
AI-Generated Summary