ChatPaper.aiChatPaper

Libretto: LLM-Agenten ein Gespür für musikalische Struktur geben

Libretto: Giving LLM Agents a Sense of Musical Structure

June 21, 2026
Autoren: Yichen Xu
cs.AI

Zusammenfassung

Generative Musiksysteme können mittlerweile beeindruckende Audioausgaben aus Textvorgaben erzeugen, jedoch sind Audioausgaben hinsichtlich musikalischer Struktur schwer zu überprüfen, zu bearbeiten und zu diagnostizieren. Wir stellen Libretto vor, ein agentenorientiertes Framework zur symbolischen Musikerzeugung und -revision. Libretto verwendet eine LLM-native Grammatik mit expliziten Einsatzzeitschlitzen, Stimmen und einer Organisation auf Taktebene und bewertet anschließend jedes Stück in einem korpuskalibrierten statistischen Raum, der Rhythmus, Harmonik, Melodik, Textur, Form und Variation umfasst. Dieselben Strukturachsen unterstützen Abruf, Diagnose, Kopierrisikokontrolle und iterative Selbstrevision. In den Anwendungen Lückenfüllung, referenzgeführte Gesamtstückgenerierung, graduelles Morphen und pädagogische Musikgenerierung verwandelt Libretto symbolische Musik von einer rohen Token-Sequenz in ein messbares und editierbares Objekt für Sprachmodell-Agenten.
English
Generative music systems can now produce impressive audio from text prompts, but audio outputs are difficult to inspect, edit, and diagnose as musical structure. We introduce Libretto, an agent-facing framework for symbolic music generation and revision. Libretto uses an LLM-native grammar with explicit onset slots, voices, and bar-level organization, then evaluates each piece in a corpus-calibrated statistical space over rhythm, harmony, melody, texture, form, and variation. The same structural axes support retrieval, diagnosis, copy-risk control, and iterative self-revision. Across gap filling, reference-guided full-piece generation, gradual morphing, and educational music generation, Libretto turns symbolic music from a raw token sequence into a measurable and editable object for language-model agents.