ChatPaper.aiChatPaper

Rumo a uma Inteligência Interativa para Humanos Digitais

Towards Interactive Intelligence for Digital Humans

December 15, 2025
Autores: Yiyi Cai, Xuangeng Chu, Xiwei Gao, Sitong Gong, Yifei Huang, Caixin Kang, Kunhang Li, Haiyang Liu, Ruicong Liu, Yun Liu, Dianwen Ng, Zixiong Su, Erwin Wu, Yuhan Wu, Dingkun Yan, Tianyu Yan, Chang Zeng, Bo Zheng, You Zhou
cs.AI

Resumo

Apresentamos a Inteligência Interativa, um novo paradigma de humano digital capaz de expressão alinhada com a personalidade, interação adaptativa e auto-evolução. Para concretizar isso, apresentamos o Mio (Avatar Ômni Multimodal Interativo), uma estrutura de ponta a ponta composta por cinco módulos especializados: Pensador, Locutor, Animador Facial, Animador Corporal e Renderizador. Esta arquitetura unificada integra o raciocínio cognitivo com a embodiação multimodal em tempo real para permitir interação fluida e consistente. Além disso, estabelecemos um novo benchmark para avaliar rigorosamente as capacidades da inteligência interativa. Experimentos extensivos demonstram que nossa estrutura alcança desempenho superior em comparação com métodos state-of-the-art em todas as dimensões avaliadas. Juntas, essas contribuições elevam os humanos digitais além da imitação superficial rumo à interação inteligente.
English
We introduce Interactive Intelligence, a novel paradigm of digital human that is capable of personality-aligned expression, adaptive interaction, and self-evolution. To realize this, we present Mio (Multimodal Interactive Omni-Avatar), an end-to-end framework composed of five specialized modules: Thinker, Talker, Face Animator, Body Animator, and Renderer. This unified architecture integrates cognitive reasoning with real-time multimodal embodiment to enable fluid, consistent interaction. Furthermore, we establish a new benchmark to rigorously evaluate the capabilities of interactive intelligence. Extensive experiments demonstrate that our framework achieves superior performance compared to state-of-the-art methods across all evaluated dimensions. Together, these contributions move digital humans beyond superficial imitation toward intelligent interaction.
PDF122March 6, 2026