ChatPaper.aiChatPaper

Pensando Além dos Tokens: Da Inteligência Inspirada no Cérebro aos Fundamentos Cognitivos para a Inteligência Artificial Geral e seu Impacto Societal

Thinking Beyond Tokens: From Brain-Inspired Intelligence to Cognitive Foundations for Artificial General Intelligence and its Societal Impact

July 1, 2025
Autores: Rizwan Qureshi, Ranjan Sapkota, Abbas Shah, Amgad Muneer, Anas Zafar, Ashmal Vayani, Maged Shoman, Abdelrahman B. M. Eldaly, Kai Zhang, Ferhat Sadak, Shaina Raza, Xinqi Fan, Ravid Shwartz-Ziv, Hong Yan, Vinjia Jain, Aman Chadha, Manoj Karkee, Jia Wu, Philip Torr, Seyedali Mirjalili
cs.AI

Resumo

As máquinas podem realmente pensar, raciocinar e agir em domínios como os humanos? Essa questão perene continua a moldar a busca pela Inteligência Artificial Geral (AGI). Apesar das capacidades crescentes de modelos como GPT-4.5, DeepSeek, Claude 3.5 Sonnet, Phi-4 e Grok 3, que exibem fluência multimodal e raciocínio parcial, esses sistemas permanecem fundamentalmente limitados por sua dependência de previsão em nível de token e pela falta de agência fundamentada. Este artigo oferece uma síntese interdisciplinar do desenvolvimento da AGI, abrangendo inteligência artificial, neurociência cognitiva, psicologia, modelos generativos e sistemas baseados em agentes. Analisamos as fundações arquitetônicas e cognitivas da inteligência geral, destacando o papel do raciocínio modular, da memória persistente e da coordenação multiagente. Em particular, enfatizamos o surgimento de frameworks Agentic RAG que combinam recuperação, planejamento e uso dinâmico de ferramentas para permitir comportamentos mais adaptativos. Discutimos estratégias de generalização, incluindo compressão de informação, adaptação em tempo de teste e métodos sem treinamento, como caminhos críticos para uma inteligência flexível e independente de domínio. Os Modelos de Visão e Linguagem (VLMs) são reexaminados não apenas como módulos de percepção, mas como interfaces em evolução para compreensão incorporada e conclusão colaborativa de tarefas. Também argumentamos que a verdadeira inteligência surge não apenas da escala, mas da integração de memória e raciocínio: uma orquestração de componentes modulares, interativos e autoaperfeiçoadores, onde a compressão possibilita comportamentos adaptativos. Com base em avanços em sistemas neurosimbólicos, aprendizado por reforço e suporte cognitivo, exploramos como arquiteturas recentes começam a preencher a lacuna entre aprendizado estatístico e cognição orientada a objetivos. Por fim, identificamos os principais desafios científicos, técnicos e éticos no caminho para a AGI.
English
Can machines truly think, reason and act in domains like humans? This enduring question continues to shape the pursuit of Artificial General Intelligence (AGI). Despite the growing capabilities of models such as GPT-4.5, DeepSeek, Claude 3.5 Sonnet, Phi-4, and Grok 3, which exhibit multimodal fluency and partial reasoning, these systems remain fundamentally limited by their reliance on token-level prediction and lack of grounded agency. This paper offers a cross-disciplinary synthesis of AGI development, spanning artificial intelligence, cognitive neuroscience, psychology, generative models, and agent-based systems. We analyze the architectural and cognitive foundations of general intelligence, highlighting the role of modular reasoning, persistent memory, and multi-agent coordination. In particular, we emphasize the rise of Agentic RAG frameworks that combine retrieval, planning, and dynamic tool use to enable more adaptive behavior. We discuss generalization strategies, including information compression, test-time adaptation, and training-free methods, as critical pathways toward flexible, domain-agnostic intelligence. Vision-Language Models (VLMs) are reexamined not just as perception modules but as evolving interfaces for embodied understanding and collaborative task completion. We also argue that true intelligence arises not from scale alone but from the integration of memory and reasoning: an orchestration of modular, interactive, and self-improving components where compression enables adaptive behavior. Drawing on advances in neurosymbolic systems, reinforcement learning, and cognitive scaffolding, we explore how recent architectures begin to bridge the gap between statistical learning and goal-directed cognition. Finally, we identify key scientific, technical, and ethical challenges on the path to AGI.
PDF224July 2, 2025