Intelligenza Artificiale Generativa Atto II: Il Ridimensionamento al Momento del Test Guida l'Ingegneria Cognitiva

Abstract

La prima generazione di Modelli Linguistici di Grande Scala - quella che potremmo definire "Atto I" dell'IA generativa (2020-2023) - ha raggiunto risultati straordinari grazie a un massiccio aumento di parametri e dati, ma ha mostrato limitazioni fondamentali in termini di latenza delle conoscenze, ragionamento superficiale e processi cognitivi vincolati. Durante questa era, l'ingegneria dei prompt è emersa come la nostra principale interfaccia con l'IA, consentendo una comunicazione a livello di dialogo attraverso il linguaggio naturale. Ora assistiamo all'emergere dell'"Atto II" (2024-presente), in cui i modelli stanno passando da sistemi di recupero delle conoscenze (nello spazio latente) a motori di costruzione del pensiero attraverso tecniche di scalabilità al momento del test. Questo nuovo paradigma stabilisce una connessione a livello mentale con l'IA attraverso pensieri basati sul linguaggio. In questo articolo, chiariamo i fondamenti concettuali dell'ingegneria cognitiva e spieghiamo perché questo momento è cruciale per il suo sviluppo. Scomponiamo sistematicamente questi approcci avanzati attraverso tutorial completi e implementazioni ottimizzate, democratizzando l'accesso all'ingegneria cognitiva e consentendo a ogni praticante di partecipare al secondo atto dell'IA. Forniamo una raccolta regolarmente aggiornata di articoli sulla scalabilità al momento del test nel Repository GitHub: https://github.com/GAIR-NLP/cognition-engineering.

English

The first generation of Large Language Models - what might be called "Act I" of generative AI (2020-2023) - achieved remarkable success through massive parameter and data scaling, yet exhibited fundamental limitations in knowledge latency, shallow reasoning, and constrained cognitive processes. During this era, prompt engineering emerged as our primary interface with AI, enabling dialogue-level communication through natural language. We now witness the emergence of "Act II" (2024-present), where models are transitioning from knowledge-retrieval systems (in latent space) to thought-construction engines through test-time scaling techniques. This new paradigm establishes a mind-level connection with AI through language-based thoughts. In this paper, we clarify the conceptual foundations of cognition engineering and explain why this moment is critical for its development. We systematically break down these advanced approaches through comprehensive tutorials and optimized implementations, democratizing access to cognition engineering and enabling every practitioner to participate in AI's second act. We provide a regularly updated collection of papers on test-time scaling in the GitHub Repository: https://github.com/GAIR-NLP/cognition-engineering

Intelligenza Artificiale Generativa Atto II: Il Ridimensionamento al Momento del Test Guida l'Ingegneria Cognitiva

Generative AI Act II: Test Time Scaling Drives Cognition Engineering

Abstract

Support