ChatPaper.aiChatPaper

Hackphyr: un agente LLM local ottimizzato per ambienti di sicurezza di rete

Hackphyr: A Local Fine-Tuned LLM Agent for Network Security Environments

September 17, 2024
Autori: Maria Rigaki, Carlos Catania, Sebastian Garcia
cs.AI

Abstract

I modelli linguistici di grandi dimensioni (LLM) hanno mostrato un notevole potenziale in vari settori, inclusa la cybersecurity. L'utilizzo di LLM basati su cloud commerciali potrebbe non essere auspicabile a causa di preoccupazioni legate alla privacy, costi e vincoli di connettività di rete. In questo articolo, presentiamo Hackphyr, un LLM localmente ottimizzato per essere impiegato come agente red-team all'interno di ambienti di sicurezza di rete. Il nostro modello con 7 miliardi di parametri ottimizzato in modo specifico può essere eseguito su una singola scheda GPU e raggiunge prestazioni paragonabili a modelli commerciali molto più grandi e potenti come il GPT-4. Hackphyr supera chiaramente altri modelli, inclusi GPT-3.5-turbo, e baselines come agenti Q-learning in scenari complessi e precedentemente non visti. Per ottenere queste prestazioni, abbiamo generato un nuovo dataset specifico per compiti di sicurezza informatica per potenziare le capacità del modello di base. Infine, abbiamo condotto un'analisi esaustiva dei comportamenti degli agenti che fornisce approfondimenti sulle capacità di pianificazione e sui potenziali difetti di tali agenti, contribuendo alla comprensione più ampia degli agenti basati su LLM in contesti di cybersecurity.
English
Large Language Models (LLMs) have shown remarkable potential across various domains, including cybersecurity. Using commercial cloud-based LLMs may be undesirable due to privacy concerns, costs, and network connectivity constraints. In this paper, we present Hackphyr, a locally fine-tuned LLM to be used as a red-team agent within network security environments. Our fine-tuned 7 billion parameter model can run on a single GPU card and achieves performance comparable with much larger and more powerful commercial models such as GPT-4. Hackphyr clearly outperforms other models, including GPT-3.5-turbo, and baselines, such as Q-learning agents in complex, previously unseen scenarios. To achieve this performance, we generated a new task-specific cybersecurity dataset to enhance the base model's capabilities. Finally, we conducted a comprehensive analysis of the agents' behaviors that provides insights into the planning abilities and potential shortcomings of such agents, contributing to the broader understanding of LLM-based agents in cybersecurity contexts

Summary

AI-Generated Summary

PDF82November 16, 2024