AssetOpsBench : Évaluation comparative des agents d'IA pour l'automatisation des tâches dans les opérations et la maintenance des actifs industriels
AssetOpsBench: Benchmarking AI Agents for Task Automation in Industrial Asset Operations and Maintenance
June 4, 2025
Auteurs: Dhaval Patel, Shuxin Lin, James Rayfield, Nianjun Zhou, Roman Vaculin, Natalia Martinez, Fearghal O'donncha, Jayant Kalagnanam
cs.AI
Résumé
L'IA pour la gestion du cycle de vie des actifs industriels vise à automatiser les flux de travail opérationnels complexes -- tels que la surveillance des conditions, la planification de la maintenance et la programmation des interventions -- afin de réduire la charge de travail humaine et de minimiser les temps d'arrêt du système. Les approches traditionnelles d'IA/ML ont principalement abordé ces problèmes de manière isolée, en résolvant des tâches spécifiques au sein du pipeline opérationnel global. En revanche, l'émergence des agents d'IA et des grands modèles de langage (LLM) introduit une opportunité de nouvelle génération : permettre une automatisation de bout en bout sur l'ensemble du cycle de vie des actifs. Cet article envisage un avenir où les agents d'IA gèrent de manière autonome des tâches qui nécessitaient auparavant une expertise distincte et une coordination manuelle. À cette fin, nous présentons AssetOpsBench -- un cadre et un environnement unifiés conçus pour guider le développement, l'orchestration et l'évaluation d'agents spécifiques au domaine, adaptés aux applications de l'Industrie 4.0. Nous décrivons les exigences clés pour de tels systèmes holistiques et fournissons des insights actionnables pour construire des agents intégrant la perception, le raisonnement et le contrôle pour les opérations industrielles réelles. Le logiciel est disponible à l'adresse https://github.com/IBM/AssetOpsBench.
English
AI for Industrial Asset Lifecycle Management aims to automate complex
operational workflows -- such as condition monitoring, maintenance planning,
and intervention scheduling -- to reduce human workload and minimize system
downtime. Traditional AI/ML approaches have primarily tackled these problems in
isolation, solving narrow tasks within the broader operational pipeline. In
contrast, the emergence of AI agents and large language models (LLMs)
introduces a next-generation opportunity: enabling end-to-end automation across
the entire asset lifecycle. This paper envisions a future where AI agents
autonomously manage tasks that previously required distinct expertise and
manual coordination. To this end, we introduce AssetOpsBench -- a unified
framework and environment designed to guide the development, orchestration, and
evaluation of domain-specific agents tailored for Industry 4.0 applications. We
outline the key requirements for such holistic systems and provide actionable
insights into building agents that integrate perception, reasoning, and control
for real-world industrial operations. The software is available at
https://github.com/IBM/AssetOpsBench.