AssetOpsBench: Бенчмарк для ИИ-агентов, автоматизирующих задачи в промышленной эксплуатации и техническом обслуживании активов
AssetOpsBench: Benchmarking AI Agents for Task Automation in Industrial Asset Operations and Maintenance
June 4, 2025
Авторы: Dhaval Patel, Shuxin Lin, James Rayfield, Nianjun Zhou, Roman Vaculin, Natalia Martinez, Fearghal O'donncha, Jayant Kalagnanam
cs.AI
Аннотация
Искусственный интеллект для управления жизненным циклом промышленных активов направлен на автоматизацию сложных операционных процессов, таких как мониторинг состояния, планирование технического обслуживания и составление графиков вмешательств, с целью снижения нагрузки на персонал и минимизации простоев системы. Традиционные подходы на основе ИИ/машинного обучения в основном решали эти задачи изолированно, фокусируясь на узких аспектах в рамках более широкого операционного конвейера. В отличие от этого, появление агентов ИИ и крупных языковых моделей (LLM) открывает новое поколение возможностей: сквозная автоматизация всего жизненного цикла активов. В данной статье рассматривается будущее, в котором агенты ИИ автономно управляют задачами, которые ранее требовали специализированных знаний и ручной координации. Для достижения этой цели мы представляем AssetOpsBench — унифицированную среду и фреймворк, предназначенные для разработки, оркестрации и оценки предметно-ориентированных агентов, адаптированных для приложений Индустрии 4.0. Мы описываем ключевые требования к таким комплексным системам и предоставляем практические рекомендации по созданию агентов, интегрирующих восприятие, логику и управление для реальных промышленных операций. Программное обеспечение доступно по адресу https://github.com/IBM/AssetOpsBench.
English
AI for Industrial Asset Lifecycle Management aims to automate complex
operational workflows -- such as condition monitoring, maintenance planning,
and intervention scheduling -- to reduce human workload and minimize system
downtime. Traditional AI/ML approaches have primarily tackled these problems in
isolation, solving narrow tasks within the broader operational pipeline. In
contrast, the emergence of AI agents and large language models (LLMs)
introduces a next-generation opportunity: enabling end-to-end automation across
the entire asset lifecycle. This paper envisions a future where AI agents
autonomously manage tasks that previously required distinct expertise and
manual coordination. To this end, we introduce AssetOpsBench -- a unified
framework and environment designed to guide the development, orchestration, and
evaluation of domain-specific agents tailored for Industry 4.0 applications. We
outline the key requirements for such holistic systems and provide actionable
insights into building agents that integrate perception, reasoning, and control
for real-world industrial operations. The software is available at
https://github.com/IBM/AssetOpsBench.