Rumo à Construção de uma IA Generalista Especializada com Fusão do Sistema 1 e Sistema 2
Towards Building Specialized Generalist AI with System 1 and System 2 Fusion
July 11, 2024
Autores: Kaiyan Zhang, Biqing Qi, Bowen Zhou
cs.AI
Resumo
Neste artigo de perspectiva, introduzimos o conceito de Inteligência Artificial Generalista Especializada (SGAI ou simplesmente SGI) como um marco crucial em direção à Inteligência Artificial Geral (AGI). Em comparação com a escalabilidade direta das habilidades gerais, a SGI é definida como IA que se especializa em pelo menos uma tarefa, superando especialistas humanos, enquanto mantém habilidades gerais. Esse caminho de fusão permite que a SGI alcance rapidamente áreas de alto valor. Categorizamos a SGI em três estágios com base no nível de domínio das habilidades profissionais e desempenho geral. Além disso, discutimos a necessidade da SGI em lidar com questões associadas a grandes modelos de linguagem, como a falta de generalidade, capacidades especializadas, incerteza na inovação e aplicações práticas. Além disso, propomos um framework conceitual para o desenvolvimento da SGI que integra as forças do processamento cognitivo dos Sistemas 1 e 2. Esse framework é composto por três camadas e quatro componentes-chave, que se concentram em aprimorar habilidades individuais e facilitar a evolução colaborativa. Concluímos resumindo os desafios potenciais e sugerindo direções futuras. Esperamos que a SGI proposta forneça insights para pesquisas e aplicações adicionais em direção à conquista da AGI.
English
In this perspective paper, we introduce the concept of Specialized Generalist
Artificial Intelligence (SGAI or simply SGI) as a crucial milestone toward
Artificial General Intelligence (AGI). Compared to directly scaling general
abilities, SGI is defined as AI that specializes in at least one task,
surpassing human experts, while also retaining general abilities. This fusion
path enables SGI to rapidly achieve high-value areas. We categorize SGI into
three stages based on the level of mastery over professional skills and
generality performance. Additionally, we discuss the necessity of SGI in
addressing issues associated with large language models, such as their
insufficient generality, specialized capabilities, uncertainty in innovation,
and practical applications. Furthermore, we propose a conceptual framework for
developing SGI that integrates the strengths of Systems 1 and 2 cognitive
processing. This framework comprises three layers and four key components,
which focus on enhancing individual abilities and facilitating collaborative
evolution. We conclude by summarizing the potential challenges and suggesting
future directions. We hope that the proposed SGI will provide insights into
further research and applications towards achieving AGI.