IA Generativa Ato II: Escalonamento em Tempo de Teste Impulsiona a Engenharia da Cognição
Generative AI Act II: Test Time Scaling Drives Cognition Engineering
April 18, 2025
Autores: Shijie Xia, Yiwei Qin, Xuefeng Li, Yan Ma, Run-Ze Fan, Steffi Chern, Haoyang Zou, Fan Zhou, Xiangkun Hu, Jiahe Jin, Yanheng He, Yixin Ye, Yixiu Liu, Pengfei Liu
cs.AI
Resumo
A primeira geração de Modelos de Linguagem de Grande Escala - o que poderia ser chamado de "Ato I" da IA generativa (2020-2023) - alcançou um sucesso notável por meio da escalabilidade massiva de parâmetros e dados, mas exibiu limitações fundamentais em termos de latência de conhecimento, raciocínio superficial e processos cognitivos restritos. Durante essa era, a engenharia de prompts emergiu como nossa principal interface com a IA, permitindo comunicação em nível de diálogo por meio de linguagem natural. Agora, testemunhamos o surgimento do "Ato II" (2024-presente), onde os modelos estão em transição de sistemas de recuperação de conhecimento (no espaço latente) para motores de construção de pensamento por meio de técnicas de escalabilidade em tempo de teste. Esse novo paradigma estabelece uma conexão em nível mental com a IA por meio de pensamentos baseados em linguagem. Neste artigo, esclarecemos os fundamentos conceituais da engenharia cognitiva e explicamos por que este momento é crucial para seu desenvolvimento. Desmembramos sistematicamente essas abordagens avançadas por meio de tutoriais abrangentes e implementações otimizadas, democratizando o acesso à engenharia cognitiva e permitindo que cada profissional participe do segundo ato da IA. Disponibilizamos uma coleção de artigos sobre escalabilidade em tempo de teste, regularmente atualizada, no Repositório GitHub: https://github.com/GAIR-NLP/cognition-engineering.
English
The first generation of Large Language Models - what might be called "Act I"
of generative AI (2020-2023) - achieved remarkable success through massive
parameter and data scaling, yet exhibited fundamental limitations in knowledge
latency, shallow reasoning, and constrained cognitive processes. During this
era, prompt engineering emerged as our primary interface with AI, enabling
dialogue-level communication through natural language. We now witness the
emergence of "Act II" (2024-present), where models are transitioning from
knowledge-retrieval systems (in latent space) to thought-construction engines
through test-time scaling techniques. This new paradigm establishes a
mind-level connection with AI through language-based thoughts. In this paper,
we clarify the conceptual foundations of cognition engineering and explain why
this moment is critical for its development. We systematically break down these
advanced approaches through comprehensive tutorials and optimized
implementations, democratizing access to cognition engineering and enabling
every practitioner to participate in AI's second act. We provide a regularly
updated collection of papers on test-time scaling in the GitHub Repository:
https://github.com/GAIR-NLP/cognition-engineeringSummary
AI-Generated Summary