Generative KI, Akt II: Testzeit-Skalierung treibt die Kognitionsentwicklung voran
Generative AI Act II: Test Time Scaling Drives Cognition Engineering
April 18, 2025
Autoren: Shijie Xia, Yiwei Qin, Xuefeng Li, Yan Ma, Run-Ze Fan, Steffi Chern, Haoyang Zou, Fan Zhou, Xiangkun Hu, Jiahe Jin, Yanheng He, Yixin Ye, Yixiu Liu, Pengfei Liu
cs.AI
Zusammenfassung
Die erste Generation von Large Language Models – was man als „Akt I“ der generativen KI (2020-2023) bezeichnen könnte – erzielte bemerkenswerte Erfolge durch massive Skalierung von Parametern und Daten, zeigte jedoch grundlegende Einschränkungen in Bezug auf Wissenslatenz, oberflächliches Denken und eingeschränkte kognitive Prozesse. In dieser Ära etablierte sich das Prompt Engineering als unsere primäre Schnittstelle zur KI, die eine dialogbasierte Kommunikation durch natürliche Sprache ermöglichte. Wir erleben nun den Beginn von „Akt II“ (2024-heute), in dem Modelle den Übergang von Wissensabrufsystemen (im latenten Raum) zu Denkkonstruktionsmaschinen durch Test-Time-Scaling-Techniken vollziehen. Dieses neue Paradigma schafft eine geistebasierte Verbindung zur KI durch sprachbasierte Gedanken. In diesem Artikel klären wir die konzeptionellen Grundlagen des Cognition Engineering und erklären, warum dieser Moment entscheidend für seine Entwicklung ist. Wir zerlegen diese fortgeschrittenen Ansätze systematisch durch umfassende Tutorials und optimierte Implementierungen, um den Zugang zum Cognition Engineering zu demokratisieren und jedem Praktiker die Teilnahme am zweiten Akt der KI zu ermöglichen. Wir bieten eine regelmäßig aktualisierte Sammlung von Artikeln zum Test-Time-Scaling im GitHub-Repository: https://github.com/GAIR-NLP/cognition-engineering
English
The first generation of Large Language Models - what might be called "Act I"
of generative AI (2020-2023) - achieved remarkable success through massive
parameter and data scaling, yet exhibited fundamental limitations in knowledge
latency, shallow reasoning, and constrained cognitive processes. During this
era, prompt engineering emerged as our primary interface with AI, enabling
dialogue-level communication through natural language. We now witness the
emergence of "Act II" (2024-present), where models are transitioning from
knowledge-retrieval systems (in latent space) to thought-construction engines
through test-time scaling techniques. This new paradigm establishes a
mind-level connection with AI through language-based thoughts. In this paper,
we clarify the conceptual foundations of cognition engineering and explain why
this moment is critical for its development. We systematically break down these
advanced approaches through comprehensive tutorials and optimized
implementations, democratizing access to cognition engineering and enabling
every practitioner to participate in AI's second act. We provide a regularly
updated collection of papers on test-time scaling in the GitHub Repository:
https://github.com/GAIR-NLP/cognition-engineeringSummary
AI-Generated Summary