TalkPlay-Tools : Recommandation musicale conversationnelle avec l'outil LLM Calling

papers.abstract

Alors que les récents développements des modèles de langage de grande taille (LLMs) ont permis avec succès la création de systèmes de recommandation génératifs avec des interactions en langage naturel, leur comportement de recommandation reste limité, laissant d'autres composants plus simples mais cruciaux, tels que le filtrage par métadonnées ou attributs, sous-utilisés dans le système. Nous proposons un système de recommandation musicale basé sur un LLM avec appel d'outils pour servir de pipeline unifié de récupération et de reclassement. Notre système positionne un LLM comme un système de recommandation de bout en bout qui interprète l'intention de l'utilisateur, planifie les invocations d'outils et orchestre des composants spécialisés : filtres booléens (SQL), récupération parcimonieuse (BM25), récupération dense (similarité d'embeddings) et récupération générative (IDs sémantiques). Grâce à la planification des outils, le système prédit les types d'outils à utiliser, leur ordre d'exécution et les arguments nécessaires pour trouver de la musique correspondant aux préférences de l'utilisateur, en supportant des modalités diverses tout en intégrant de manière transparente plusieurs méthodes de filtrage de bases de données. Nous démontrons que ce cadre unifié d'appel d'outils atteint des performances compétitives dans divers scénarios de recommandation en employant de manière sélective les méthodes de récupération appropriées en fonction des requêtes des utilisateurs, envisageant ainsi un nouveau paradigme pour les systèmes de recommandation musicale conversationnels.

English

While the recent developments in large language models (LLMs) have successfully enabled generative recommenders with natural language interactions, their recommendation behavior is limited, leaving other simpler yet crucial components such as metadata or attribute filtering underutilized in the system. We propose an LLM-based music recommendation system with tool calling to serve as a unified retrieval-reranking pipeline. Our system positions an LLM as an end-to-end recommendation system that interprets user intent, plans tool invocations, and orchestrates specialized components: boolean filters (SQL), sparse retrieval (BM25), dense retrieval (embedding similarity), and generative retrieval (semantic IDs). Through tool planning, the system predicts which types of tools to use, their execution order, and the arguments needed to find music matching user preferences, supporting diverse modalities while seamlessly integrating multiple database filtering methods. We demonstrate that this unified tool-calling framework achieves competitive performance across diverse recommendation scenarios by selectively employing appropriate retrieval methods based on user queries, envisioning a new paradigm for conversational music recommendation systems.

TalkPlay-Tools : Recommandation musicale conversationnelle avec l'outil LLM Calling

TalkPlay-Tools: Conversational Music Recommendation with LLM Tool Calling

papers.abstract

Support