L'IA générative Acte II : La mise à l'échelle au moment du test pilote l'ingénierie cognitive

papers.abstract

La première génération de modèles de langage à grande échelle - que l'on pourrait qualifier d'"Acte I" de l'IA générative (2020-2023) - a obtenu un succès remarquable grâce à une mise à l'échelle massive des paramètres et des données, tout en présentant des limitations fondamentales en termes de latence des connaissances, de raisonnement superficiel et de processus cognitifs contraints. Durant cette ère, l'ingénierie des prompts est apparue comme notre interface principale avec l'IA, permettant une communication au niveau du dialogue via le langage naturel. Nous assistons aujourd'hui à l'émergence de l'"Acte II" (2024-présent), où les modèles passent de systèmes de récupération de connaissances (dans l'espace latent) à des moteurs de construction de pensée grâce à des techniques de mise à l'échelle en temps de test. Ce nouveau paradigme établit une connexion au niveau de l'esprit avec l'IA à travers des pensées basées sur le langage. Dans cet article, nous clarifions les fondements conceptuels de l'ingénierie cognitive et expliquons pourquoi ce moment est crucial pour son développement. Nous décomposons systématiquement ces approches avancées à travers des tutoriels complets et des implémentations optimisées, démocratisant l'accès à l'ingénierie cognitive et permettant à chaque praticien de participer au second acte de l'IA. Nous fournissons une collection régulièrement mise à jour d'articles sur la mise à l'échelle en temps de test dans le dépôt GitHub : https://github.com/GAIR-NLP/cognition-engineering.

English

The first generation of Large Language Models - what might be called "Act I" of generative AI (2020-2023) - achieved remarkable success through massive parameter and data scaling, yet exhibited fundamental limitations in knowledge latency, shallow reasoning, and constrained cognitive processes. During this era, prompt engineering emerged as our primary interface with AI, enabling dialogue-level communication through natural language. We now witness the emergence of "Act II" (2024-present), where models are transitioning from knowledge-retrieval systems (in latent space) to thought-construction engines through test-time scaling techniques. This new paradigm establishes a mind-level connection with AI through language-based thoughts. In this paper, we clarify the conceptual foundations of cognition engineering and explain why this moment is critical for its development. We systematically break down these advanced approaches through comprehensive tutorials and optimized implementations, democratizing access to cognition engineering and enabling every practitioner to participate in AI's second act. We provide a regularly updated collection of papers on test-time scaling in the GitHub Repository: https://github.com/GAIR-NLP/cognition-engineering

L'IA générative Acte II : La mise à l'échelle au moment du test pilote l'ingénierie cognitive

Generative AI Act II: Test Time Scaling Drives Cognition Engineering

papers.abstract

Support