ChatPaper.aiChatPaper

Évaluation de l'intelligence par essais et erreurs

Evaluating Intelligence via Trial and Error

February 26, 2025
Auteurs: Jingtao Zhan, Jiahao Zhao, Jiayu Li, Yiqun Liu, Bo Zhang, Qingyao Ai, Jiaxin Mao, Hongning Wang, Min Zhang, Shaoping Ma
cs.AI

Résumé

L'intelligence est une caractéristique cruciale permettant aux espèces de trouver des solutions en un nombre limité d'essais et d'erreurs. En nous appuyant sur cette idée, nous introduisons le Jeu de Survie comme un cadre pour évaluer l'intelligence en fonction du nombre d'échecs dans un processus d'essais et d'erreurs. Moins il y a d'échecs, plus l'intelligence est élevée. Lorsque l'espérance et la variance du nombre d'échecs sont toutes deux finies, cela indique la capacité à trouver systématiquement des solutions à de nouveaux défis, ce que nous définissons comme le Niveau Autonome d'intelligence. En utilisant le Jeu de Survie, nous évaluons de manière exhaustive les systèmes d'IA existants. Nos résultats montrent que si les systèmes d'IA atteignent le Niveau Autonome dans des tâches simples, ils en sont encore loin dans des tâches plus complexes, telles que la vision, la recherche, la recommandation et le langage. Bien que la mise à l'échelle des technologies actuelles d'IA puisse aider, cela se ferait à un coût astronomique. Les projections suggèrent que l'atteinte du Niveau Autonome pour des tâches générales nécessiterait 10^{26} paramètres. Pour mettre cela en perspective, le chargement d'un modèle aussi massif nécessite tant de GPU H100 que leur valeur totale est 10^{7} fois celle de la capitalisation boursière d'Apple Inc. Même avec la loi de Moore, soutenir une telle échelle de paramètres prendrait 70 ans. Ce coût vertigineux met en lumière la complexité des tâches humaines et les insuffisances des technologies actuelles d'IA. Pour approfondir cette question, nous menons une analyse théorique du Jeu de Survie et de ses résultats expérimentaux. Nos conclusions suggèrent que les tâches humaines possèdent une propriété de criticité. Par conséquent, le Niveau Autonome nécessite une compréhension approfondie des mécanismes sous-jacents de la tâche. Cependant, les systèmes d'IA actuels ne saisissent pas pleinement ces mécanismes et s'appuient plutôt sur une imitation superficielle, ce qui rend difficile l'atteinte d'un niveau autonome. Nous croyons que le Jeu de Survie peut non seulement guider le développement futur de l'IA, mais aussi offrir des perspectives profondes sur l'intelligence humaine.
English
Intelligence is a crucial trait for species to find solutions within a limited number of trial-and-error attempts. Building on this idea, we introduce Survival Game as a framework to evaluate intelligence based on the number of failed attempts in a trial-and-error process. Fewer failures indicate higher intelligence. When the expectation and variance of failure counts are both finite, it signals the ability to consistently find solutions to new challenges, which we define as the Autonomous Level of intelligence. Using Survival Game, we comprehensively evaluate existing AI systems. Our results show that while AI systems achieve the Autonomous Level in simple tasks, they are still far from it in more complex tasks, such as vision, search, recommendation, and language. While scaling current AI technologies might help, this would come at an astronomical cost. Projections suggest that achieving the Autonomous Level for general tasks would require 10^{26} parameters. To put this into perspective, loading such a massive model requires so many H100 GPUs that their total value is 10^{7} times that of Apple Inc.'s market value. Even with Moore's Law, supporting such a parameter scale would take 70 years. This staggering cost highlights the complexity of human tasks and the inadequacies of current AI technologies. To further investigate this phenomenon, we conduct a theoretical analysis of Survival Game and its experimental results. Our findings suggest that human tasks possess a criticality property. As a result, Autonomous Level requires a deep understanding of the task's underlying mechanisms. Current AI systems, however, do not fully grasp these mechanisms and instead rely on superficial mimicry, making it difficult for them to reach an autonomous level. We believe Survival Game can not only guide the future development of AI but also offer profound insights into human intelligence.

Summary

AI-Generated Summary

PDF43March 12, 2025