ChatPaper.aiChatPaper

G-FOCUS: UI 설계 설득력 평가를 위한 강건한 방법론 모색

G-FOCUS: Towards a Robust Method for Assessing UI Design Persuasiveness

May 8, 2025
저자: Jaehyun Jeon, Jang Han Yoon, Min Soo Kim, Sumin Shim, Yejin Choi, Hanbin Kim, Youngjae Yu
cs.AI

초록

사용자 인터페이스(UI) 설계의 효과를 평가하는 것은 미적 요소를 넘어 사용자 행동에 영향을 미치는 데까지 확장되며, 이는 설계 설득력(Design Persuasiveness)의 핵심 원칙이다. A/B 테스트는 어떤 UI 변형이 더 높은 사용자 참여를 이끌어내는지 결정하는 주요 방법이지만, 비용과 시간이 많이 소요된다. 최근 비전-언어 모델(VLMs)이 자동화된 UI 분석을 처리할 수 있게 되었지만, 현재의 접근 방식은 사용자 상호작용 최적화의 핵심 요소인 비교적 설득력보다는 고립된 설계 속성에 초점을 맞추고 있다. 이를 해결하기 위해, 우리는 실제 UI 이미지 쌍 300개를 A/B 테스트 결과와 전문가의 근거와 함께 라벨링한 Pairwise UI Design Persuasiveness Assessment 작업을 위한 벤치마크인 WiserUI-Bench를 소개한다. 또한, 위치 편향을 줄이고 평가 정확도를 향상시켜 VLM 기반 설득력 평가를 강화하는 새로운 추론 시 전략인 G-FOCUS를 제안한다. 실험 결과는 G-FOCUS가 pairwise UI 평가에서 기존 추론 전략을 일관성과 정확도 면에서 능가함을 보여준다. VLM 기반 UI 설득력 평가를 촉진함으로써, 우리의 연구는 A/B 테스트를 보완할 수 있는 접근 방식을 제공하며, 확장 가능한 UI 선호도 모델링 및 설계 최적화의 진전을 이끌어낼 것이다. 코드와 데이터는 공개될 예정이다.
English
Evaluating user interface (UI) design effectiveness extends beyond aesthetics to influencing user behavior, a principle central to Design Persuasiveness. A/B testing is the predominant method for determining which UI variations drive higher user engagement, but it is costly and time-consuming. While recent Vision-Language Models (VLMs) can process automated UI analysis, current approaches focus on isolated design attributes rather than comparative persuasiveness-the key factor in optimizing user interactions. To address this, we introduce WiserUI-Bench, a benchmark designed for Pairwise UI Design Persuasiveness Assessment task, featuring 300 real-world UI image pairs labeled with A/B test results and expert rationales. Additionally, we propose G-FOCUS, a novel inference-time reasoning strategy that enhances VLM-based persuasiveness assessment by reducing position bias and improving evaluation accuracy. Experimental results show that G-FOCUS surpasses existing inference strategies in consistency and accuracy for pairwise UI evaluation. Through promoting VLM-driven evaluation of UI persuasiveness, our work offers an approach to complement A/B testing, propelling progress in scalable UI preference modeling and design optimization. Code and data will be released publicly.

Summary

AI-Generated Summary

PDF122May 12, 2025