TalkPlay-Tools : Recommandation musicale conversationnelle avec l'outil LLM Calling
TalkPlay-Tools: Conversational Music Recommendation with LLM Tool Calling
October 2, 2025
papers.authors: Seungheon Doh, Keunwoo Choi, Juhan Nam
cs.AI
papers.abstract
Alors que les récents développements des modèles de langage de grande taille (LLMs) ont permis avec succès la création de systèmes de recommandation génératifs avec des interactions en langage naturel, leur comportement de recommandation reste limité, laissant d'autres composants plus simples mais cruciaux, tels que le filtrage par métadonnées ou attributs, sous-utilisés dans le système. Nous proposons un système de recommandation musicale basé sur un LLM avec appel d'outils pour servir de pipeline unifié de récupération et de reclassement. Notre système positionne un LLM comme un système de recommandation de bout en bout qui interprète l'intention de l'utilisateur, planifie les invocations d'outils et orchestre des composants spécialisés : filtres booléens (SQL), récupération parcimonieuse (BM25), récupération dense (similarité d'embeddings) et récupération générative (IDs sémantiques). Grâce à la planification des outils, le système prédit les types d'outils à utiliser, leur ordre d'exécution et les arguments nécessaires pour trouver de la musique correspondant aux préférences de l'utilisateur, en supportant des modalités diverses tout en intégrant de manière transparente plusieurs méthodes de filtrage de bases de données. Nous démontrons que ce cadre unifié d'appel d'outils atteint des performances compétitives dans divers scénarios de recommandation en employant de manière sélective les méthodes de récupération appropriées en fonction des requêtes des utilisateurs, envisageant ainsi un nouveau paradigme pour les systèmes de recommandation musicale conversationnels.
English
While the recent developments in large language models (LLMs) have
successfully enabled generative recommenders with natural language
interactions, their recommendation behavior is limited, leaving other simpler
yet crucial components such as metadata or attribute filtering underutilized in
the system. We propose an LLM-based music recommendation system with tool
calling to serve as a unified retrieval-reranking pipeline. Our system
positions an LLM as an end-to-end recommendation system that interprets user
intent, plans tool invocations, and orchestrates specialized components:
boolean filters (SQL), sparse retrieval (BM25), dense retrieval (embedding
similarity), and generative retrieval (semantic IDs). Through tool planning,
the system predicts which types of tools to use, their execution order, and the
arguments needed to find music matching user preferences, supporting diverse
modalities while seamlessly integrating multiple database filtering methods. We
demonstrate that this unified tool-calling framework achieves competitive
performance across diverse recommendation scenarios by selectively employing
appropriate retrieval methods based on user queries, envisioning a new paradigm
for conversational music recommendation systems.