ChatPaper.aiChatPaper

Hin zu interaktiver Intelligenz für digitale Menschen

Towards Interactive Intelligence for Digital Humans

December 15, 2025
papers.authors: Yiyi Cai, Xuangeng Chu, Xiwei Gao, Sitong Gong, Yifei Huang, Caixin Kang, Kunhang Li, Haiyang Liu, Ruicong Liu, Yun Liu, Dianwen Ng, Zixiong Su, Erwin Wu, Yuhan Wu, Dingkun Yan, Tianyu Yan, Chang Zeng, Bo Zheng, You Zhou
cs.AI

papers.abstract

Wir stellen Interactive Intelligence vor, ein neuartiges Paradigma digitaler Menschen, das zu persönlichkeitskonformer Ausdrucksweise, adaptiver Interaktion und Selbstentwicklung befähigt ist. Zur Umsetzung präsentieren wir Mio (Multimodal Interactive Omni-Avatar), ein End-to-End-Framework aus fünf spezialisierten Modulen: Denker, Sprecher, Gesichtsanimator, Körperanimator und Renderer. Diese vereinheitlichte Architektur integriert kognitive Reasoning-Fähigkeiten mit Echtzeit-Multimodalität, um flüssige, konsistente Interaktionen zu ermöglichen. Des Weiteren etablieren wir einen neuen Benchmark zur rigorosen Evaluierung der Fähigkeiten interaktiver Intelligenz. Umfangreiche Experimente belegen, dass unser Framework state-of-the-art-Methoden in allen evaluierten Dimensionen übertrifft. Diese Beiträge führen gemeinsam dazu, dass digitale Menschen sich über oberflächliche Nachahmung hinaus zu intelligenter Interaktion weiterentwickeln.
English
We introduce Interactive Intelligence, a novel paradigm of digital human that is capable of personality-aligned expression, adaptive interaction, and self-evolution. To realize this, we present Mio (Multimodal Interactive Omni-Avatar), an end-to-end framework composed of five specialized modules: Thinker, Talker, Face Animator, Body Animator, and Renderer. This unified architecture integrates cognitive reasoning with real-time multimodal embodiment to enable fluid, consistent interaction. Furthermore, we establish a new benchmark to rigorously evaluate the capabilities of interactive intelligence. Extensive experiments demonstrate that our framework achieves superior performance compared to state-of-the-art methods across all evaluated dimensions. Together, these contributions move digital humans beyond superficial imitation toward intelligent interaction.
PDF92December 17, 2025