ChatPaper.aiChatPaper

TalkPlay-Tools: Recomendación Musical Conversacional con Herramienta de LLM y Llamadas

TalkPlay-Tools: Conversational Music Recommendation with LLM Tool Calling

October 2, 2025
Autores: Seungheon Doh, Keunwoo Choi, Juhan Nam
cs.AI

Resumen

Si bien los recientes avances en los modelos de lenguaje de gran escala (LLMs, por sus siglas en inglés) han permitido con éxito la creación de recomendadores generativos con interacciones en lenguaje natural, su comportamiento de recomendación es limitado, dejando otros componentes más simples pero cruciales, como el filtrado de metadatos o atributos, subutilizados en el sistema. Proponemos un sistema de recomendación de música basado en LLMs con invocación de herramientas para funcionar como una canalización unificada de recuperación y reordenamiento. Nuestro sistema posiciona un LLM como un sistema de recomendación de extremo a extremo que interpreta la intención del usuario, planifica las invocaciones de herramientas y orquesta componentes especializados: filtros booleanos (SQL), recuperación dispersa (BM25), recuperación densa (similitud de embeddings) y recuperación generativa (IDs semánticos). A través de la planificación de herramientas, el sistema predice qué tipos de herramientas utilizar, el orden de ejecución y los argumentos necesarios para encontrar música que coincida con las preferencias del usuario, apoyando diversas modalidades mientras integra de manera fluida múltiples métodos de filtrado de bases de datos. Demostramos que este marco unificado de invocación de herramientas logra un rendimiento competitivo en diversos escenarios de recomendación al emplear selectivamente métodos de recuperación apropiados según las consultas del usuario, vislumbrando un nuevo paradigma para los sistemas de recomendación de música conversacional.
English
While the recent developments in large language models (LLMs) have successfully enabled generative recommenders with natural language interactions, their recommendation behavior is limited, leaving other simpler yet crucial components such as metadata or attribute filtering underutilized in the system. We propose an LLM-based music recommendation system with tool calling to serve as a unified retrieval-reranking pipeline. Our system positions an LLM as an end-to-end recommendation system that interprets user intent, plans tool invocations, and orchestrates specialized components: boolean filters (SQL), sparse retrieval (BM25), dense retrieval (embedding similarity), and generative retrieval (semantic IDs). Through tool planning, the system predicts which types of tools to use, their execution order, and the arguments needed to find music matching user preferences, supporting diverse modalities while seamlessly integrating multiple database filtering methods. We demonstrate that this unified tool-calling framework achieves competitive performance across diverse recommendation scenarios by selectively employing appropriate retrieval methods based on user queries, envisioning a new paradigm for conversational music recommendation systems.
PDF42October 6, 2025