VLAI: Ein RoBERTa-basiertes Modell zur automatisierten Klassifizierung der Schwere von Sicherheitslücken
VLAI: A RoBERTa-Based Model for Automated Vulnerability Severity Classification
July 4, 2025
Autoren: Cédric Bonhomme, Alexandre Dulaunoy
cs.AI
Zusammenfassung
Dieses Papier stellt VLAI vor, ein transformer-basiertes Modell, das die Schweregrade von Software-Schwachstellen direkt aus Textbeschreibungen vorhersagt. Basierend auf RoBERTa, wurde VLAI auf über 600.000 realen Schwachstellen feinabgestimmt und erreicht eine Genauigkeit von über 82 % bei der Vorhersage von Schweregradkategorien. Dies ermöglicht eine schnellere und konsistentere Priorisierung vor der manuellen CVSS-Bewertung. Das Modell und der Datensatz sind Open Source und in den Vulnerability-Lookup-Dienst integriert.
English
This paper presents VLAI, a transformer-based model that predicts software
vulnerability severity levels directly from text descriptions. Built on
RoBERTa, VLAI is fine-tuned on over 600,000 real-world vulnerabilities and
achieves over 82% accuracy in predicting severity categories, enabling faster
and more consistent triage ahead of manual CVSS scoring. The model and dataset
are open-source and integrated into the Vulnerability-Lookup service.