ChatPaper.aiChatPaper

Hackphyr: Локальный настроенный агент LLM для сред сетевой безопасности

Hackphyr: A Local Fine-Tuned LLM Agent for Network Security Environments

September 17, 2024
Авторы: Maria Rigaki, Carlos Catania, Sebastian Garcia
cs.AI

Аннотация

Большие языковые модели (LLM) показали выдающийся потенциал в различных областях, включая кибербезопасность. Использование коммерческих облачных LLM может быть нежелательным из-за проблем конфиденциальности, затрат и ограничений сетевого подключения. В данной статье мы представляем Hackphyr, локально настроенную LLM для использования в качестве агента красной команды в средах сетевой безопасности. Наша настроенная модель с 7 миллиардами параметров может работать на одной видеокарте GPU и достигает производительности, сравнимой с гораздо более крупными и мощными коммерческими моделями, такими как GPT-4. Hackphyr явно превосходит другие модели, включая GPT-3.5-turbo, и базовые модели, такие как агенты Q-обучения в сложных, ранее не встречавшихся сценариях. Для достижения этой производительности мы создали новый набор данных по кибербезопасности для улучшения возможностей базовой модели. Наконец, мы провели всесторонний анализ поведения агентов, который предоставляет понимание способностей к планированию и потенциальных недостатков таких агентов, способствуя более глубокому пониманию агентов на основе LLM в контекстах кибербезопасности.
English
Large Language Models (LLMs) have shown remarkable potential across various domains, including cybersecurity. Using commercial cloud-based LLMs may be undesirable due to privacy concerns, costs, and network connectivity constraints. In this paper, we present Hackphyr, a locally fine-tuned LLM to be used as a red-team agent within network security environments. Our fine-tuned 7 billion parameter model can run on a single GPU card and achieves performance comparable with much larger and more powerful commercial models such as GPT-4. Hackphyr clearly outperforms other models, including GPT-3.5-turbo, and baselines, such as Q-learning agents in complex, previously unseen scenarios. To achieve this performance, we generated a new task-specific cybersecurity dataset to enhance the base model's capabilities. Finally, we conducted a comprehensive analysis of the agents' behaviors that provides insights into the planning abilities and potential shortcomings of such agents, contributing to the broader understanding of LLM-based agents in cybersecurity contexts

Summary

AI-Generated Summary

PDF82November 16, 2024