VLAI: Un modelo basado en RoBERTa para la clasificación automatizada de la gravedad de vulnerabilidades
VLAI: A RoBERTa-Based Model for Automated Vulnerability Severity Classification
July 4, 2025
Autores: Cédric Bonhomme, Alexandre Dulaunoy
cs.AI
Resumen
Este artículo presenta VLAI, un modelo basado en transformadores que predice los niveles de gravedad de vulnerabilidades de software directamente a partir de descripciones textuales. Construido sobre RoBERTa, VLAI se ajusta finamente en más de 600,000 vulnerabilidades del mundo real y alcanza una precisión superior al 82% en la predicción de categorías de gravedad, permitiendo una clasificación más rápida y consistente antes de la puntuación manual CVSS. El modelo y el conjunto de datos son de código abierto y están integrados en el servicio Vulnerability-Lookup.
English
This paper presents VLAI, a transformer-based model that predicts software
vulnerability severity levels directly from text descriptions. Built on
RoBERTa, VLAI is fine-tuned on over 600,000 real-world vulnerabilities and
achieves over 82% accuracy in predicting severity categories, enabling faster
and more consistent triage ahead of manual CVSS scoring. The model and dataset
are open-source and integrated into the Vulnerability-Lookup service.