VLAI : Un modèle basé sur RoBERTa pour la classification automatisée de la sévérité des vulnérabilités
VLAI: A RoBERTa-Based Model for Automated Vulnerability Severity Classification
July 4, 2025
Auteurs: Cédric Bonhomme, Alexandre Dulaunoy
cs.AI
Résumé
Cet article présente VLAI, un modèle basé sur des transformateurs qui prédit les niveaux de gravité des vulnérabilités logicielles directement à partir de descriptions textuelles. Basé sur RoBERTa, VLAI est affiné sur plus de 600 000 vulnérabilités réelles et atteint une précision de plus de 82 % dans la prédiction des catégories de gravité, permettant un triage plus rapide et plus cohérent avant l'évaluation manuelle des scores CVSS. Le modèle et le jeu de données sont open-source et intégrés au service Vulnerability-Lookup.
English
This paper presents VLAI, a transformer-based model that predicts software
vulnerability severity levels directly from text descriptions. Built on
RoBERTa, VLAI is fine-tuned on over 600,000 real-world vulnerabilities and
achieves over 82% accuracy in predicting severity categories, enabling faster
and more consistent triage ahead of manual CVSS scoring. The model and dataset
are open-source and integrated into the Vulnerability-Lookup service.