ChatPaper.aiChatPaper

Технический отчет Llama-3.1-FoundationAI-SecurityLLM-8B-Instruct

Llama-3.1-FoundationAI-SecurityLLM-8B-Instruct Technical Report

August 1, 2025
Авторы: Sajana Weerawardhena, Paul Kassianik, Blaine Nelson, Baturay Saglam, Anu Vellore, Aman Priyanshu, Supriti Vijay, Massimo Aufiero, Arthur Goldblatt, Fraser Burch, Ed Li, Jianliang He, Dhruv Kedia, Kojin Oshiba, Zhouran Yang, Yaron Singer, Amin Karbasi
cs.AI

Аннотация

Крупные языковые модели (LLM) продемонстрировали впечатляющие успехи во многих областях, однако их интеграция в приложения кибербезопасности остается ограниченной из-за недостатка универсальных данных по кибербезопасности, сложности представления, а также проблем безопасности и регулирования. Для устранения этого пробела мы ранее представили Foundation-Sec-8B — языковую модель, ориентированную на кибербезопасность и подходящую для тонкой настройки на последующих задачах. Однако эта модель не была предназначена для чат-взаимодействий или выполнения инструкций. В данном отчете мы представляем Foundation-Sec-8B-Instruct: модель, специально обученную для универсального диалога в области кибербезопасности. Построенная на основе Foundation-Sec-8B, она сочетает в себе предметные знания, способность следовать инструкциям, навыки ведения диалога и соответствие человеческим предпочтениям для создания высококачественных и релевантных ответов. Комплексные оценки показывают, что Foundation-Sec-8B-Instruct превосходит Llama 3.1-8B-Instruct в ряде задач по кибербезопасности, одновременно соответствуя её производительности в выполнении инструкций. Она также конкурентоспособна с GPT-4o-mini в задачах анализа киберугроз и выполнения инструкций. Мы предполагаем, что Foundation-Sec-8B-Instruct станет незаменимым помощником в повседневной работе специалистов по кибербезопасности. Модель доступна публично по адресу https://huggingface.co/fdtn-ai/Foundation-Sec-8B-Instruct.
English
Large language models (LLMs) have shown remarkable success across many domains, yet their integration into cybersecurity applications remains limited due to a lack of general-purpose cybersecurity data, representational complexity, and safety and regulatory concerns. To address this gap, we previously introduced Foundation-Sec-8B, a cybersecurity-focused LLM suitable for fine-tuning on downstream tasks. That model, however, was not designed for chat-style interactions or instruction-following. In this report, we release Foundation-Sec-8B-Instruct: a model specifically trained for general-purpose cybersecurity dialogue. Built on Foundation-Sec-8B, it combines domain-specific knowledge with instruction-following, conversational capabilities, and alignment with human preferences to produce high-quality, relevant responses. Comprehensive evaluations show that Foundation-Sec-8B-Instruct outperforms Llama 3.1-8B-Instruct on a range of cybersecurity tasks while matching its instruction-following performance. It is also competitive with GPT-4o-mini on cyber threat intelligence and instruction-following tasks. We envision Foundation-Sec-8B-Instruct becoming an indispensable assistant in the daily workflows of cybersecurity professionals. We release the model publicly at https://huggingface.co/fdtn-ai/Foundation-Sec-8B-Instruct.
PDF262August 5, 2025