ChatPaper.aiChatPaper

Pensando más allá de los tokens: desde la inteligencia inspirada en el cerebro hasta los fundamentos cognitivos para la inteligencia artificial general y su impacto social

Thinking Beyond Tokens: From Brain-Inspired Intelligence to Cognitive Foundations for Artificial General Intelligence and its Societal Impact

July 1, 2025
Autores: Rizwan Qureshi, Ranjan Sapkota, Abbas Shah, Amgad Muneer, Anas Zafar, Ashmal Vayani, Maged Shoman, Abdelrahman B. M. Eldaly, Kai Zhang, Ferhat Sadak, Shaina Raza, Xinqi Fan, Ravid Shwartz-Ziv, Hong Yan, Vinjia Jain, Aman Chadha, Manoj Karkee, Jia Wu, Philip Torr, Seyedali Mirjalili
cs.AI

Resumen

¿Pueden las máquinas realmente pensar, razonar y actuar en dominios como los humanos? Esta pregunta perdurable continúa moldeando la búsqueda de la Inteligencia General Artificial (AGI). A pesar de las crecientes capacidades de modelos como GPT-4.5, DeepSeek, Claude 3.5 Sonnet, Phi-4 y Grok 3, que exhiben fluidez multimodal y razonamiento parcial, estos sistemas siguen siendo fundamentalmente limitados por su dependencia de la predicción a nivel de tokens y la falta de agencia fundamentada. Este artículo ofrece una síntesis interdisciplinaria del desarrollo de la AGI, abarcando inteligencia artificial, neurociencia cognitiva, psicología, modelos generativos y sistemas basados en agentes. Analizamos los fundamentos arquitectónicos y cognitivos de la inteligencia general, destacando el papel del razonamiento modular, la memoria persistente y la coordinación multiagente. En particular, enfatizamos el auge de los marcos Agentic RAG que combinan recuperación, planificación y uso dinámico de herramientas para permitir un comportamiento más adaptativo. Discutimos estrategias de generalización, incluyendo compresión de información, adaptación en tiempo de prueba y métodos libres de entrenamiento, como vías críticas hacia una inteligencia flexible y agnóstica de dominio. Los Modelos de Visión-Lenguaje (VLMs) se reexaminan no solo como módulos de percepción, sino como interfaces en evolución para la comprensión encarnada y la finalización colaborativa de tareas. También argumentamos que la verdadera inteligencia surge no solo de la escala, sino de la integración de la memoria y el razonamiento: una orquestación de componentes modulares, interactivos y automejorables donde la compresión permite un comportamiento adaptativo. Basándonos en avances en sistemas neurosimbólicos, aprendizaje por refuerzo y andamiaje cognitivo, exploramos cómo las arquitecturas recientes comienzan a cerrar la brecha entre el aprendizaje estadístico y la cognición dirigida a objetivos. Finalmente, identificamos los desafíos científicos, técnicos y éticos clave en el camino hacia la AGI.
English
Can machines truly think, reason and act in domains like humans? This enduring question continues to shape the pursuit of Artificial General Intelligence (AGI). Despite the growing capabilities of models such as GPT-4.5, DeepSeek, Claude 3.5 Sonnet, Phi-4, and Grok 3, which exhibit multimodal fluency and partial reasoning, these systems remain fundamentally limited by their reliance on token-level prediction and lack of grounded agency. This paper offers a cross-disciplinary synthesis of AGI development, spanning artificial intelligence, cognitive neuroscience, psychology, generative models, and agent-based systems. We analyze the architectural and cognitive foundations of general intelligence, highlighting the role of modular reasoning, persistent memory, and multi-agent coordination. In particular, we emphasize the rise of Agentic RAG frameworks that combine retrieval, planning, and dynamic tool use to enable more adaptive behavior. We discuss generalization strategies, including information compression, test-time adaptation, and training-free methods, as critical pathways toward flexible, domain-agnostic intelligence. Vision-Language Models (VLMs) are reexamined not just as perception modules but as evolving interfaces for embodied understanding and collaborative task completion. We also argue that true intelligence arises not from scale alone but from the integration of memory and reasoning: an orchestration of modular, interactive, and self-improving components where compression enables adaptive behavior. Drawing on advances in neurosymbolic systems, reinforcement learning, and cognitive scaffolding, we explore how recent architectures begin to bridge the gap between statistical learning and goal-directed cognition. Finally, we identify key scientific, technical, and ethical challenges on the path to AGI.
PDF114July 2, 2025