ChatPaper.aiChatPaper

Panoptisch Paarsgewijs Vervormingsgraaf

Panoptic Pairwise Distortion Graph

April 13, 2026
Auteurs: Muhammad Kamran Janjua, Abdul Wahab, Bahador Rashidi
cs.AI

Samenvatting

In dit werk introduceren we een nieuw perspectief op comparatieve beeldbeoordeling door een beeldpaar voor te stellen als een gestructureerde compositie van zijn regio's. Bestaande methoden richten zich daarentegen op analyse van het gehele beeld, terwijl ze impliciet steunen op een begrip op regioniveau. Wij breiden het intra-beeld concept van een scenegrafie uit naar inter-beeld, en stellen een nieuwe taak voor: de Distortiegraaf (DG). DG behandelt gepaarde beelden als een gestructureerde topologie gebaseerd op regio's, en vertegenwoordigt dichte degradatie-informatie, zoals distortietype, ernst, vergelijking en kwaliteitsscore, in een compacte, interpreteerbare grafiekstructuur. Om de taak van het leren van een distortiegraaf te realiseren, leveren wij (i) een dataset op regioniveau, PandaSet, (ii) een benchmark suite, PandaBench, met variërende moeilijkheidsgraad op regioniveau, en (iii) een efficiënte architectuur, Panda, om distortiegrafen te genereren. Wij tonen aan dat PandaBench een aanzienlijke uitdaging vormt voor state-of-the-art multimodale large language models (MLLM's), omdat zij er niet in slagen degradaties op regioniveau te begrijpen, zelfs niet wanneer zij expliciete regionale cues krijgen aangeboden. Wij tonen aan dat training op PandaSet of prompting met DG een begrip van distortie per regio opwekt, wat een nieuwe richting opent voor fijnmazige, gestructureerde paarsgewijze beeldbeoordeling.
English
In this work, we introduce a new perspective on comparative image assessment by representing an image pair as a structured composition of its regions. In contrast, existing methods focus on whole image analysis, while implicitly relying on region-level understanding. We extend the intra-image notion of a scene graph to inter-image, and propose a novel task of Distortion Graph (DG). DG treats paired images as a structured topology grounded in regions, and represents dense degradation information such as distortion type, severity, comparison and quality score in a compact interpretable graph structure. To realize the task of learning a distortion graph, we contribute (i) a region-level dataset, PandaSet, (ii) a benchmark suite, PandaBench, with varying region-level difficulty, and (iii) an efficient architecture, Panda, to generate distortion graphs. We demonstrate that PandaBench poses a significant challenge for state-of-the-art multimodal large language models (MLLMs) as they fail to understand region-level degradations even when fed with explicit region cues. We show that training on PandaSet or prompting with DG elicits region-wise distortion understanding, opening a new direction for fine-grained, structured pairwise image assessment.
PDF22April 21, 2026