ChatPaper.aiChatPaper

Die ShareLM-Sammlung und das Plugin: Beitrag von menschlichen Modell-Chats zum Nutzen der Gemeinschaft

The ShareLM Collection and Plugin: Contributing Human-Model Chats for the Benefit of the Community

August 15, 2024
Autoren: Shachar Don-Yehiya, Leshem Choshen, Omri Abend
cs.AI

Zusammenfassung

Mensch-Modell-Gespräche bieten Einblicke in die realen Szenarien, Verhaltensweisen und Bedürfnisse der Benutzer und sind somit eine wertvolle Ressource für die Modellentwicklung und -forschung. Während gewinnorientierte Unternehmen Benutzerdaten über die APIs ihrer Modelle sammeln und intern zur Verbesserung ihrer eigenen Modelle nutzen, hinkt die Open-Source- und Forschungsgemeinschaft hinterher. Wir stellen die ShareLM-Sammlung vor, eine vereinheitlichte Sammlung von menschlichen Gesprächen mit großen Sprachmodellen, und das dazugehörige Plugin, eine Web-Erweiterung zur freiwilligen Beitragung von Benutzer-Modell-Gesprächen. Während nur wenige Plattformen ihre Chats teilen, fügt das ShareLM-Plugin diese Funktionalität hinzu und ermöglicht es Benutzern somit, Gespräche von den meisten Plattformen zu teilen. Das Plugin ermöglicht es dem Benutzer, seine Gespräche sowohl auf Gesprächs- als auch auf Antwortebene zu bewerten und Gespräche, die er lieber privat halten möchte, zu löschen, bevor sie jemals den lokalen Speicher des Benutzers verlassen. Wir veröffentlichen die Plugin-Gespräche als Teil der ShareLM-Sammlung und rufen zu mehr gemeinschaftlichen Anstrengungen im Bereich offener menschlich-modellbasierter Daten auf. Der Code, das Plugin und die Daten sind verfügbar.
English
Human-model conversations provide a window into users' real-world scenarios, behavior, and needs, and thus are a valuable resource for model development and research. While for-profit companies collect user data through the APIs of their models, using it internally to improve their own models, the open source and research community lags behind. We introduce the ShareLM collection, a unified set of human conversations with large language models, and its accompanying plugin, a Web extension for voluntarily contributing user-model conversations. Where few platforms share their chats, the ShareLM plugin adds this functionality, thus, allowing users to share conversations from most platforms. The plugin allows the user to rate their conversations, both at the conversation and the response levels, and delete conversations they prefer to keep private before they ever leave the user's local storage. We release the plugin conversations as part of the ShareLM collection, and call for more community effort in the field of open human-model data. The code, plugin, and data are available.

Summary

AI-Generated Summary

PDF111November 26, 2024