ChatPaper.aiChatPaper

TalkPlay-Tools: Raccomandazione Musicale Conversazionale con Chiamata di Strumenti LLM

TalkPlay-Tools: Conversational Music Recommendation with LLM Tool Calling

October 2, 2025
Autori: Seungheon Doh, Keunwoo Choi, Juhan Nam
cs.AI

Abstract

Mentre i recenti sviluppi nei modelli linguistici di grandi dimensioni (LLM) hanno abilitato con successo sistemi di raccomandazione generativi con interazioni in linguaggio naturale, il loro comportamento di raccomandazione è limitato, lasciando altri componenti più semplici ma cruciali come il filtraggio dei metadati o degli attributi sottoutilizzati nel sistema. Proponiamo un sistema di raccomandazione musicale basato su LLM con chiamata di strumenti per fungere da pipeline unificata di recupero e riordinamento. Il nostro sistema posiziona un LLM come sistema di raccomandazione end-to-end che interpreta l'intento dell'utente, pianifica le invocazioni degli strumenti e orchestra componenti specializzati: filtri booleani (SQL), recupero sparso (BM25), recupero denso (similarità di embedding) e recupero generativo (ID semantici). Attraverso la pianificazione degli strumenti, il sistema prevede quali tipi di strumenti utilizzare, il loro ordine di esecuzione e gli argomenti necessari per trovare musica corrispondente alle preferenze dell'utente, supportando diverse modalità integrando in modo fluido più metodi di filtraggio del database. Dimostriamo che questo framework unificato di chiamata degli strumenti raggiunge prestazioni competitive in diversi scenari di raccomandazione, impiegando selettivamente metodi di recupero appropriati in base alle query degli utenti, immaginando un nuovo paradigma per i sistemi di raccomandazione musicale conversazionali.
English
While the recent developments in large language models (LLMs) have successfully enabled generative recommenders with natural language interactions, their recommendation behavior is limited, leaving other simpler yet crucial components such as metadata or attribute filtering underutilized in the system. We propose an LLM-based music recommendation system with tool calling to serve as a unified retrieval-reranking pipeline. Our system positions an LLM as an end-to-end recommendation system that interprets user intent, plans tool invocations, and orchestrates specialized components: boolean filters (SQL), sparse retrieval (BM25), dense retrieval (embedding similarity), and generative retrieval (semantic IDs). Through tool planning, the system predicts which types of tools to use, their execution order, and the arguments needed to find music matching user preferences, supporting diverse modalities while seamlessly integrating multiple database filtering methods. We demonstrate that this unified tool-calling framework achieves competitive performance across diverse recommendation scenarios by selectively employing appropriate retrieval methods based on user queries, envisioning a new paradigm for conversational music recommendation systems.
PDF42October 6, 2025