Rapporto Tecnico di Llama-3.1-FoundationAI-SecurityLLM-8B-Instruct

Abstract

I modelli linguistici di grandi dimensioni (LLM) hanno dimostrato un notevole successo in molti ambiti, ma la loro integrazione nelle applicazioni di cybersecurity rimane limitata a causa della mancanza di dati di cybersecurity generici, della complessità rappresentazionale e delle preoccupazioni relative alla sicurezza e alla regolamentazione. Per colmare questa lacuna, abbiamo precedentemente introdotto Foundation-Sec-8B, un LLM focalizzato sulla cybersecurity adatto per il fine-tuning su task downstream. Tuttavia, quel modello non era progettato per interazioni in stile chat o per il seguimento di istruzioni. In questo report, rilasciamo Foundation-Sec-8B-Instruct: un modello specificamente addestrato per dialoghi generici di cybersecurity. Basato su Foundation-Sec-8B, combina conoscenze specifiche del dominio con capacità di seguimento delle istruzioni, abilità conversazionali e allineamento con le preferenze umane per produrre risposte di alta qualità e pertinenti. Valutazioni complete dimostrano che Foundation-Sec-8B-Instruct supera Llama 3.1-8B-Instruct in una gamma di task di cybersecurity, eguagliando le sue prestazioni nel seguimento delle istruzioni. È anche competitivo con GPT-4o-mini nelle attività di intelligence sulle minacce informatiche e nel seguimento delle istruzioni. Prevediamo che Foundation-Sec-8B-Instruct diventi un assistente indispensabile nei flussi di lavoro quotidiani dei professionisti della cybersecurity. Rilasciamo il modello pubblicamente all'indirizzo https://huggingface.co/fdtn-ai/Foundation-Sec-8B-Instruct.

English

Large language models (LLMs) have shown remarkable success across many domains, yet their integration into cybersecurity applications remains limited due to a lack of general-purpose cybersecurity data, representational complexity, and safety and regulatory concerns. To address this gap, we previously introduced Foundation-Sec-8B, a cybersecurity-focused LLM suitable for fine-tuning on downstream tasks. That model, however, was not designed for chat-style interactions or instruction-following. In this report, we release Foundation-Sec-8B-Instruct: a model specifically trained for general-purpose cybersecurity dialogue. Built on Foundation-Sec-8B, it combines domain-specific knowledge with instruction-following, conversational capabilities, and alignment with human preferences to produce high-quality, relevant responses. Comprehensive evaluations show that Foundation-Sec-8B-Instruct outperforms Llama 3.1-8B-Instruct on a range of cybersecurity tasks while matching its instruction-following performance. It is also competitive with GPT-4o-mini on cyber threat intelligence and instruction-following tasks. We envision Foundation-Sec-8B-Instruct becoming an indispensable assistant in the daily workflows of cybersecurity professionals. We release the model publicly at https://huggingface.co/fdtn-ai/Foundation-Sec-8B-Instruct.

Rapporto Tecnico di Llama-3.1-FoundationAI-SecurityLLM-8B-Instruct

Llama-3.1-FoundationAI-SecurityLLM-8B-Instruct Technical Report

Abstract

Support