Vers la construction d'une IA généraliste spécialisée grâce à la fusion des systèmes 1 et 2
Towards Building Specialized Generalist AI with System 1 and System 2 Fusion
July 11, 2024
Auteurs: Kaiyan Zhang, Biqing Qi, Bowen Zhou
cs.AI
Résumé
Dans cet article de perspective, nous introduisons le concept d'Intelligence Artificielle Généraliste Spécialisée (SGAI ou simplement SGI) comme une étape cruciale vers l'Intelligence Artificielle Générale (AGI). Contrairement à une approche visant directement à élargir les capacités générales, la SGI se définit comme une IA qui se spécialise dans au moins une tâche, surpassant les experts humains, tout en conservant des aptitudes générales. Cette voie de fusion permet à la SGI d'atteindre rapidement des domaines à haute valeur ajoutée. Nous catégorisons la SGI en trois étapes en fonction du niveau de maîtrise des compétences professionnelles et des performances générales. De plus, nous discutons de la nécessité de la SGI pour résoudre les problèmes associés aux grands modèles de langage, tels que leur généralité insuffisante, leurs capacités spécialisées, l'incertitude dans l'innovation et les applications pratiques. Par ailleurs, nous proposons un cadre conceptuel pour le développement de la SGI qui intègre les forces des systèmes de traitement cognitif 1 et 2. Ce cadre comprend trois couches et quatre composants clés, qui se concentrent sur l'amélioration des capacités individuelles et la facilitation de l'évolution collaborative. Nous concluons en résumant les défis potentiels et en suggérant des orientations futures. Nous espérons que la SGI proposée fournira des insights pour des recherches et applications ultérieures visant à atteindre l'AGI.
English
In this perspective paper, we introduce the concept of Specialized Generalist
Artificial Intelligence (SGAI or simply SGI) as a crucial milestone toward
Artificial General Intelligence (AGI). Compared to directly scaling general
abilities, SGI is defined as AI that specializes in at least one task,
surpassing human experts, while also retaining general abilities. This fusion
path enables SGI to rapidly achieve high-value areas. We categorize SGI into
three stages based on the level of mastery over professional skills and
generality performance. Additionally, we discuss the necessity of SGI in
addressing issues associated with large language models, such as their
insufficient generality, specialized capabilities, uncertainty in innovation,
and practical applications. Furthermore, we propose a conceptual framework for
developing SGI that integrates the strengths of Systems 1 and 2 cognitive
processing. This framework comprises three layers and four key components,
which focus on enhancing individual abilities and facilitating collaborative
evolution. We conclude by summarizing the potential challenges and suggesting
future directions. We hope that the proposed SGI will provide insights into
further research and applications towards achieving AGI.Summary
AI-Generated Summary