ChatPaper.aiChatPaper

Libretto: LLM-agenten een gevoel van muzikale structuur geven

Libretto: Giving LLM Agents a Sense of Musical Structure

June 21, 2026
Auteurs: Yichen Xu
cs.AI

Samenvatting

Generatieve muzieksystemen kunnen nu indrukwekkende audio genereren op basis van tekstprompts, maar audio-uitgangen zijn moeilijk te inspecteren, bewerken en diagnosticeren als muzikale structuur. We introduceren Libretto, een agentgericht raamwerk voor symbolische muziekgeneratie en -revisie. Libretto gebruikt een LLM-native grammatica met expliciete onset-slots, stemmen en maatniveau-organisatie, en evalueert vervolgens elk stuk in een corpus-gekalibreerde statistische ruimte over ritme, harmonie, melodie, textuur, vorm en variatie. Dezelfde structurele assen ondersteunen retrieval, diagnose, kopieerrisicobeheersing en iteratieve zelfrevisie. Bij gatvulling, referentiegeleide volledige-stukgeneratie, geleidelijke morfing en educatieve muziekgeneratie verandert Libretto symbolische muziek van een ruwe tokenreeks in een meetbaar en bewerkbaar object voor taalmodellenagenten.
English
Generative music systems can now produce impressive audio from text prompts, but audio outputs are difficult to inspect, edit, and diagnose as musical structure. We introduce Libretto, an agent-facing framework for symbolic music generation and revision. Libretto uses an LLM-native grammar with explicit onset slots, voices, and bar-level organization, then evaluates each piece in a corpus-calibrated statistical space over rhythm, harmony, melody, texture, form, and variation. The same structural axes support retrieval, diagnosis, copy-risk control, and iterative self-revision. Across gap filling, reference-guided full-piece generation, gradual morphing, and educational music generation, Libretto turns symbolic music from a raw token sequence into a measurable and editable object for language-model agents.