プロンプトオーケストレーションマークアップ言語
Prompt Orchestration Markup Language
August 19, 2025
著者: Yuge Zhang, Nan Chen, Jiahang Xu, Yuqing Yang
cs.AI
要旨
大規模言語モデル(LLM)は高度なプロンプト設計を必要としますが、現在の手法は構造、データ統合、フォーマットの感度、ツーリングといった面で課題に直面しています。既存の方法では、多様なデータタイプ(ドキュメント、表、画像)を含む複雑なプロンプトを整理したり、プレゼンテーションのバリエーションを体系的に管理するための包括的なソリューションが不足しています。これらのギャップを埋めるため、我々はPOML(Prompt Orchestration Markup Language)を導入します。POMLは、論理構造(役割、タスク、例)のためのコンポーネントベースのマークアップ、シームレスなデータ統合のための専用タグ、コンテンツとプレゼンテーションを分離するCSSライクなスタイリングシステムを採用し、フォーマットの感度を低減します。また、動的プロンプトのためのテンプレート機能や、バージョン管理とコラボレーションを向上させる包括的な開発者向けツールキット(IDEサポート、SDK)を備えています。POMLの有効性を検証するため、複雑なアプリケーション統合(PomLink)と精度性能(TableQA)に与える影響を示す2つのケーススタディ、および実際の開発シナリオでの効果を評価するユーザースタディを実施しました。
English
Large Language Models (LLMs) require sophisticated prompting, yet current
practices face challenges in structure, data integration, format sensitivity,
and tooling. Existing methods lack comprehensive solutions for organizing
complex prompts involving diverse data types (documents, tables, images) or
managing presentation variations systematically. To address these gaps, we
introduce POML (Prompt Orchestration Markup Language). POML employs
component-based markup for logical structure (roles, tasks, examples),
specialized tags for seamless data integration, and a CSS-like styling system
to decouple content from presentation, reducing formatting sensitivity. It
includes templating for dynamic prompts and a comprehensive developer toolkit
(IDE support, SDKs) to improve version control and collaboration. We validate
POML through two case studies demonstrating its impact on complex application
integration (PomLink) and accuracy performance (TableQA), as well as a user
study assessing its effectiveness in real-world development scenarios.