Lenguaje de Marcado para la Orquestación de Prompts
Prompt Orchestration Markup Language
August 19, 2025
Autores: Yuge Zhang, Nan Chen, Jiahang Xu, Yuqing Yang
cs.AI
Resumen
Los Modelos de Lenguaje de Gran Escala (LLMs, por sus siglas en inglés) requieren técnicas de *prompting* sofisticadas, aunque las prácticas actuales enfrentan desafíos en estructura, integración de datos, sensibilidad al formato y herramientas disponibles. Los métodos existentes carecen de soluciones integrales para organizar *prompts* complejos que involucren diversos tipos de datos (documentos, tablas, imágenes) o para gestionar variaciones de presentación de manera sistemática. Para abordar estas limitaciones, presentamos POML (Lenguaje de Marcado para la Orquestación de *Prompts*). POML utiliza un marcado basado en componentes para la estructura lógica (roles, tareas, ejemplos), etiquetas especializadas para una integración fluida de datos y un sistema de estilos similar a CSS para separar el contenido de la presentación, reduciendo la sensibilidad al formato. Incluye plantillas para *prompts* dinámicos y un conjunto completo de herramientas para desarrolladores (soporte para IDE, SDKs) para mejorar el control de versiones y la colaboración. Validamos POML mediante dos estudios de caso que demuestran su impacto en la integración de aplicaciones complejas (PomLink) y en el rendimiento de precisión (TableQA), así como un estudio de usuario que evalúa su eficacia en escenarios de desarrollo del mundo real.
English
Large Language Models (LLMs) require sophisticated prompting, yet current
practices face challenges in structure, data integration, format sensitivity,
and tooling. Existing methods lack comprehensive solutions for organizing
complex prompts involving diverse data types (documents, tables, images) or
managing presentation variations systematically. To address these gaps, we
introduce POML (Prompt Orchestration Markup Language). POML employs
component-based markup for logical structure (roles, tasks, examples),
specialized tags for seamless data integration, and a CSS-like styling system
to decouple content from presentation, reducing formatting sensitivity. It
includes templating for dynamic prompts and a comprehensive developer toolkit
(IDE support, SDKs) to improve version control and collaboration. We validate
POML through two case studies demonstrating its impact on complex application
integration (PomLink) and accuracy performance (TableQA), as well as a user
study assessing its effectiveness in real-world development scenarios.