ChatPaper.aiChatPaper

Geração Aumentada por Recuperação Consciente do Panorama Mental para Melhor Compreensão de Contextos Longos

Mindscape-Aware Retrieval Augmented Generation for Improved Long Context Understanding

December 19, 2025
Autores: Yuqing Li, Jiangnan Li, Zheng Lin, Ziyan Zhou, Junjie Wu, Weiping Wang, Jie Zhou, Mo Yu
cs.AI

Resumo

Os seres humanos compreendem textos longos e complexos ao recorrer a uma representação semântica holística do conteúdo. Esta visão global ajuda a organizar o conhecimento prévio, a interpretar novas informações e a integrar evidências dispersas ao longo de um documento, conforme revelado pela Capacidade de Consciência do Panorama Mental (Mindscape-Aware Capability) na psicologia. Os sistemas atuais de Geração Aumentada por Recuperação (RAG) carecem dessa orientação e, portanto, têm dificuldades com tarefas de contexto longo. Neste artigo, propomos o RAG com Consciência do Panorama Mental (MiA-RAG), a primeira abordagem que equipa sistemas RAG baseados em LLM com uma consciência explícita do contexto global. O MiA-RAG constrói um panorama mental através de sumarização hierárquica e condiciona tanto a recuperação quanto a geração a esta representação semântica global. Isto permite que o módulo de recuperação forme incorporações de consulta enriquecidas e que o gerador raciocine sobre as evidências recuperadas dentro de um contexto global coerente. Avaliamos o MiA-RAG em diversos benchmarks de contexto longo e bilíngues para compreensão baseada em evidências e construção de sentido global. O sistema supera consistentemente os baseline, e uma análise mais aprofundada mostra que ele alinha detalhes locais com uma representação global coerente, permitindo uma recuperação e raciocínio de contexto longo mais semelhantes aos humanos.
English
Humans understand long and complex texts by relying on a holistic semantic representation of the content. This global view helps organize prior knowledge, interpret new information, and integrate evidence dispersed across a document, as revealed by the Mindscape-Aware Capability of humans in psychology. Current Retrieval-Augmented Generation (RAG) systems lack such guidance and therefore struggle with long-context tasks. In this paper, we propose Mindscape-Aware RAG (MiA-RAG), the first approach that equips LLM-based RAG systems with explicit global context awareness. MiA-RAG builds a mindscape through hierarchical summarization and conditions both retrieval and generation on this global semantic representation. This enables the retriever to form enriched query embeddings and the generator to reason over retrieved evidence within a coherent global context. We evaluate MiA-RAG across diverse long-context and bilingual benchmarks for evidence-based understanding and global sense-making. It consistently surpasses baselines, and further analysis shows that it aligns local details with a coherent global representation, enabling more human-like long-context retrieval and reasoning.
PDF691December 30, 2025