IA Generativa Acto II: El Escalado en Tiempo de Prueba Impulsa la Ingeniería Cognitiva
Generative AI Act II: Test Time Scaling Drives Cognition Engineering
April 18, 2025
Autores: Shijie Xia, Yiwei Qin, Xuefeng Li, Yan Ma, Run-Ze Fan, Steffi Chern, Haoyang Zou, Fan Zhou, Xiangkun Hu, Jiahe Jin, Yanheng He, Yixin Ye, Yixiu Liu, Pengfei Liu
cs.AI
Resumen
La primera generación de Modelos de Lenguaje a Gran Escala —lo que podríamos llamar "Acto I" de la IA generativa (2020-2023)— logró un éxito notable mediante el escalado masivo de parámetros y datos, aunque exhibió limitaciones fundamentales en la latencia del conocimiento, el razonamiento superficial y los procesos cognitivos restringidos. Durante esta era, la ingeniería de prompts emergió como nuestra principal interfaz con la IA, permitiendo la comunicación a nivel de diálogo a través del lenguaje natural. Ahora somos testigos del surgimiento del "Acto II" (2024-presente), donde los modelos están transitando de sistemas de recuperación de conocimiento (en el espacio latente) a motores de construcción de pensamiento mediante técnicas de escalado en tiempo de prueba. Este nuevo paradigma establece una conexión a nivel mental con la IA a través de pensamientos basados en el lenguaje. En este artículo, aclaramos los fundamentos conceptuales de la ingeniería de la cognición y explicamos por qué este momento es crucial para su desarrollo. Desglosamos sistemáticamente estos enfoques avanzados mediante tutoriales exhaustivos e implementaciones optimizadas, democratizando el acceso a la ingeniería de la cognición y permitiendo que cada profesional participe en el segundo acto de la IA. Proporcionamos una colección de artículos actualizada regularmente sobre el escalado en tiempo de prueba en el Repositorio de GitHub: https://github.com/GAIR-NLP/cognition-engineering.
English
The first generation of Large Language Models - what might be called "Act I"
of generative AI (2020-2023) - achieved remarkable success through massive
parameter and data scaling, yet exhibited fundamental limitations in knowledge
latency, shallow reasoning, and constrained cognitive processes. During this
era, prompt engineering emerged as our primary interface with AI, enabling
dialogue-level communication through natural language. We now witness the
emergence of "Act II" (2024-present), where models are transitioning from
knowledge-retrieval systems (in latent space) to thought-construction engines
through test-time scaling techniques. This new paradigm establishes a
mind-level connection with AI through language-based thoughts. In this paper,
we clarify the conceptual foundations of cognition engineering and explain why
this moment is critical for its development. We systematically break down these
advanced approaches through comprehensive tutorials and optimized
implementations, democratizing access to cognition engineering and enabling
every practitioner to participate in AI's second act. We provide a regularly
updated collection of papers on test-time scaling in the GitHub Repository:
https://github.com/GAIR-NLP/cognition-engineeringSummary
AI-Generated Summary