Verso la Costruzione di un'IA Generalista Specializzata con la Fusione tra Sistema 1 e Sistema 2
Towards Building Specialized Generalist AI with System 1 and System 2 Fusion
July 11, 2024
Autori: Kaiyan Zhang, Biqing Qi, Bowen Zhou
cs.AI
Abstract
In questo articolo prospettico, introduciamo il concetto di Intelligenza Artificiale Generalista Specializzata (SGAI o semplicemente SGI) come una tappa cruciale verso l'Intelligenza Artificiale Generale (AGI). Rispetto al semplice potenziamento di abilità generali, la SGI è definita come un'IA che si specializza in almeno un compito, superando gli esperti umani, pur mantenendo capacità generali. Questo percorso di fusione consente alla SGI di raggiungere rapidamente aree ad alto valore. Classifichiamo la SGI in tre fasi basate sul livello di padronanza delle competenze professionali e sulle prestazioni generali. Inoltre, discutiamo la necessità della SGI nell'affrontare i problemi associati ai grandi modelli linguistici, come la loro insufficiente generalità, capacità specializzate, incertezza nell'innovazione e applicazioni pratiche. Proponiamo inoltre un framework concettuale per lo sviluppo della SGI che integra i punti di forza dei processi cognitivi dei Sistemi 1 e 2. Questo framework è composto da tre livelli e quattro componenti chiave, che si concentrano sul potenziamento delle capacità individuali e sulla facilitazione dell'evoluzione collaborativa. Concludiamo riassumendo le potenziali sfide e suggerendo direzioni future. Speriamo che la SGI proposta fornisca spunti per ulteriori ricerche e applicazioni verso il raggiungimento dell'AGI.
English
In this perspective paper, we introduce the concept of Specialized Generalist
Artificial Intelligence (SGAI or simply SGI) as a crucial milestone toward
Artificial General Intelligence (AGI). Compared to directly scaling general
abilities, SGI is defined as AI that specializes in at least one task,
surpassing human experts, while also retaining general abilities. This fusion
path enables SGI to rapidly achieve high-value areas. We categorize SGI into
three stages based on the level of mastery over professional skills and
generality performance. Additionally, we discuss the necessity of SGI in
addressing issues associated with large language models, such as their
insufficient generality, specialized capabilities, uncertainty in innovation,
and practical applications. Furthermore, we propose a conceptual framework for
developing SGI that integrates the strengths of Systems 1 and 2 cognitive
processing. This framework comprises three layers and four key components,
which focus on enhancing individual abilities and facilitating collaborative
evolution. We conclude by summarizing the potential challenges and suggesting
future directions. We hope that the proposed SGI will provide insights into
further research and applications towards achieving AGI.