ChatPaper.aiChatPaper

Pensare oltre i token: dall'intelligenza ispirata al cervello ai fondamenti cognitivi per l'intelligenza artificiale generale e il suo impatto sociale

Thinking Beyond Tokens: From Brain-Inspired Intelligence to Cognitive Foundations for Artificial General Intelligence and its Societal Impact

July 1, 2025
Autori: Rizwan Qureshi, Ranjan Sapkota, Abbas Shah, Amgad Muneer, Anas Zafar, Ashmal Vayani, Maged Shoman, Abdelrahman B. M. Eldaly, Kai Zhang, Ferhat Sadak, Shaina Raza, Xinqi Fan, Ravid Shwartz-Ziv, Hong Yan, Vinjia Jain, Aman Chadha, Manoj Karkee, Jia Wu, Philip Torr, Seyedali Mirjalili
cs.AI

Abstract

Le macchine possono davvero pensare, ragionare e agire in domini come gli esseri umani? Questa domanda persistente continua a plasmare la ricerca dell'Intelligenza Artificiale Generale (AGI). Nonostante le crescenti capacità di modelli come GPT-4.5, DeepSeek, Claude 3.5 Sonnet, Phi-4 e Grok 3, che mostrano fluidità multimodale e un ragionamento parziale, questi sistemi rimangono fondamentalmente limitati dalla loro dipendenza dalla previsione a livello di token e dalla mancanza di un'agenzia radicata. Questo articolo offre una sintesi interdisciplinare dello sviluppo dell'AGI, abbracciando l'intelligenza artificiale, le neuroscienze cognitive, la psicologia, i modelli generativi e i sistemi basati su agenti. Analizziamo le basi architetturali e cognitive dell'intelligenza generale, evidenziando il ruolo del ragionamento modulare, della memoria persistente e della coordinazione multi-agente. In particolare, sottolineiamo l'ascesa dei framework Agentic RAG che combinano recupero, pianificazione e uso dinamico di strumenti per consentire comportamenti più adattativi. Discutiamo strategie di generalizzazione, tra cui la compressione delle informazioni, l'adattamento al momento del test e i metodi senza addestramento, come percorsi critici verso un'intelligenza flessibile e indipendente dal dominio. I Modelli Visione-Linguaggio (VLMs) vengono riesaminati non solo come moduli di percezione, ma come interfacce in evoluzione per la comprensione incarnata e il completamento collaborativo di compiti. Sosteniamo inoltre che la vera intelligenza non deriva solo dalla scala, ma dall'integrazione di memoria e ragionamento: un'orchestrazione di componenti modulari, interattivi e auto-miglioranti, in cui la compressione abilita comportamenti adattativi. Attingendo ai progressi nei sistemi neurosimbolici, nell'apprendimento per rinforzo e nell'impalcatura cognitiva, esploriamo come le architetture recenti inizino a colmare il divario tra l'apprendimento statistico e la cognizione orientata agli obiettivi. Infine, identifichiamo le principali sfide scientifiche, tecniche ed etiche sul percorso verso l'AGI.
English
Can machines truly think, reason and act in domains like humans? This enduring question continues to shape the pursuit of Artificial General Intelligence (AGI). Despite the growing capabilities of models such as GPT-4.5, DeepSeek, Claude 3.5 Sonnet, Phi-4, and Grok 3, which exhibit multimodal fluency and partial reasoning, these systems remain fundamentally limited by their reliance on token-level prediction and lack of grounded agency. This paper offers a cross-disciplinary synthesis of AGI development, spanning artificial intelligence, cognitive neuroscience, psychology, generative models, and agent-based systems. We analyze the architectural and cognitive foundations of general intelligence, highlighting the role of modular reasoning, persistent memory, and multi-agent coordination. In particular, we emphasize the rise of Agentic RAG frameworks that combine retrieval, planning, and dynamic tool use to enable more adaptive behavior. We discuss generalization strategies, including information compression, test-time adaptation, and training-free methods, as critical pathways toward flexible, domain-agnostic intelligence. Vision-Language Models (VLMs) are reexamined not just as perception modules but as evolving interfaces for embodied understanding and collaborative task completion. We also argue that true intelligence arises not from scale alone but from the integration of memory and reasoning: an orchestration of modular, interactive, and self-improving components where compression enables adaptive behavior. Drawing on advances in neurosymbolic systems, reinforcement learning, and cognitive scaffolding, we explore how recent architectures begin to bridge the gap between statistical learning and goal-directed cognition. Finally, we identify key scientific, technical, and ethical challenges on the path to AGI.
PDF184July 2, 2025