Intelligenza Artificiale Generativa Atto II: Il Ridimensionamento al Momento del Test Guida l'Ingegneria Cognitiva
Generative AI Act II: Test Time Scaling Drives Cognition Engineering
April 18, 2025
Autori: Shijie Xia, Yiwei Qin, Xuefeng Li, Yan Ma, Run-Ze Fan, Steffi Chern, Haoyang Zou, Fan Zhou, Xiangkun Hu, Jiahe Jin, Yanheng He, Yixin Ye, Yixiu Liu, Pengfei Liu
cs.AI
Abstract
La prima generazione di Modelli Linguistici di Grande Scala - quella che potremmo definire "Atto I" dell'IA generativa (2020-2023) - ha raggiunto risultati straordinari grazie a un massiccio aumento di parametri e dati, ma ha mostrato limitazioni fondamentali in termini di latenza delle conoscenze, ragionamento superficiale e processi cognitivi vincolati. Durante questa era, l'ingegneria dei prompt è emersa come la nostra principale interfaccia con l'IA, consentendo una comunicazione a livello di dialogo attraverso il linguaggio naturale. Ora assistiamo all'emergere dell'"Atto II" (2024-presente), in cui i modelli stanno passando da sistemi di recupero delle conoscenze (nello spazio latente) a motori di costruzione del pensiero attraverso tecniche di scalabilità al momento del test. Questo nuovo paradigma stabilisce una connessione a livello mentale con l'IA attraverso pensieri basati sul linguaggio. In questo articolo, chiariamo i fondamenti concettuali dell'ingegneria cognitiva e spieghiamo perché questo momento è cruciale per il suo sviluppo. Scomponiamo sistematicamente questi approcci avanzati attraverso tutorial completi e implementazioni ottimizzate, democratizzando l'accesso all'ingegneria cognitiva e consentendo a ogni praticante di partecipare al secondo atto dell'IA. Forniamo una raccolta regolarmente aggiornata di articoli sulla scalabilità al momento del test nel Repository GitHub: https://github.com/GAIR-NLP/cognition-engineering.
English
The first generation of Large Language Models - what might be called "Act I"
of generative AI (2020-2023) - achieved remarkable success through massive
parameter and data scaling, yet exhibited fundamental limitations in knowledge
latency, shallow reasoning, and constrained cognitive processes. During this
era, prompt engineering emerged as our primary interface with AI, enabling
dialogue-level communication through natural language. We now witness the
emergence of "Act II" (2024-present), where models are transitioning from
knowledge-retrieval systems (in latent space) to thought-construction engines
through test-time scaling techniques. This new paradigm establishes a
mind-level connection with AI through language-based thoughts. In this paper,
we clarify the conceptual foundations of cognition engineering and explain why
this moment is critical for its development. We systematically break down these
advanced approaches through comprehensive tutorials and optimized
implementations, democratizing access to cognition engineering and enabling
every practitioner to participate in AI's second act. We provide a regularly
updated collection of papers on test-time scaling in the GitHub Repository:
https://github.com/GAIR-NLP/cognition-engineeringSummary
AI-Generated Summary