5G 무선 네트워크에서 근본 원인 분석을 위한 추론 언어 모델
Reasoning Language Models for Root Cause Analysis in 5G Wireless Networks
July 29, 2025
저자: Mohamed Sana, Nicola Piovesan, Antonio De Domenico, Yibin Kang, Haozhe Zhang, Merouane Debbah, Fadhel Ayed
cs.AI
초록
모바일 네트워크에서의 근본 원인 분석(Root Cause Analysis, RCA)은 해석 가능성, 도메인 전문성, 그리고 인과적 추론의 필요성으로 인해 여전히 어려운 과제로 남아 있다. 본 연구에서는 RCA를 위해 대규모 언어 모델(Large Language Models, LLMs)을 활용하는 경량 프레임워크를 제안한다. 이를 위해, RCA 능력을 벤치마킹하기 위해 설계된 주석이 달린 문제 해결 데이터셋인 TeleLogs를 소개한다. 평가 결과, 기존의 오픈소스 추론 LLM들은 이러한 문제들에 대해 어려움을 겪는 것으로 나타났으며, 이는 도메인 특화적 적응의 필요성을 강조한다. 이 문제를 해결하기 위해, 우리는 지도 학습 미세 조정과 강화 학습을 결합한 두 단계의 학습 방법론을 제안하여 LLM의 정확도와 추론 품질을 향상시킨다. 제안된 접근 방식은 일련의 RCA 모델을 미세 조정하여 도메인 지식을 통합하고 구조화된 다단계 진단 설명을 생성함으로써 해석 가능성과 효과성을 모두 개선한다. 다양한 크기의 LLM에 걸친 광범위한 실험은 최신 추론 및 비추론 모델 대비 상당한 성능 향상을 보여주며, 무작위 테스트 변형에 대한 강력한 일반화 능력을 입증한다. 이러한 결과는 네트워크 운영 및 관리에서 실용적이고 설명 가능한 RCA를 위해 도메인 적응 및 추론 강화된 LLM의 잠재력을 보여준다.
English
Root Cause Analysis (RCA) in mobile networks remains a challenging task due
to the need for interpretability, domain expertise, and causal reasoning. In
this work, we propose a lightweight framework that leverages Large Language
Models (LLMs) for RCA. To do so, we introduce TeleLogs, a curated dataset of
annotated troubleshooting problems designed to benchmark RCA capabilities. Our
evaluation reveals that existing open-source reasoning LLMs struggle with these
problems, underscoring the need for domain-specific adaptation. To address this
issue, we propose a two-stage training methodology that combines supervised
fine-tuning with reinforcement learning to improve the accuracy and reasoning
quality of LLMs. The proposed approach fine-tunes a series of RCA models to
integrate domain knowledge and generate structured, multi-step diagnostic
explanations, improving both interpretability and effectiveness. Extensive
experiments across multiple LLM sizes show significant performance gains over
state-of-the-art reasoning and non-reasoning models, including strong
generalization to randomized test variants. These results demonstrate the
promise of domain-adapted, reasoning-enhanced LLMs for practical and
explainable RCA in network operation and management.