Alles Wat Je Nodig Hebt Is Een Fuzzing Brein: Een LLM-aangedreven Systeem voor Geautomatiseerde Kwetsbaarheidsdetectie en -reparatie
All You Need Is A Fuzzing Brain: An LLM-Powered System for Automated Vulnerability Detection and Patching
September 8, 2025
Auteurs: Ze Sheng, Qingxiao Xu, Jianwei Huang, Matthew Woodcock, Heqing Huang, Alastair F. Donaldson, Guofei Gu, Jeff Huang
cs.AI
Samenvatting
Ons team, All You Need Is A Fuzzing Brain, was een van de zeven finalisten in DARPA's Artificial Intelligence Cyber Challenge (AIxCC) en eindigde als vierde in de finale ronde. Tijdens de competitie ontwikkelden we een Cyber Reasoning System (CRS) dat autonoom 28 beveiligingslekken ontdekte - waaronder zes voorheen onbekende zero-days - in real-world open-source C- en Java-projecten, en slaagde erin om 14 daarvan te patchen. Het volledige CRS is open source beschikbaar op https://github.com/o2lab/afc-crs-all-you-need-is-a-fuzzing-brain. Dit artikel biedt een gedetailleerde technische beschrijving van ons CRS, met een nadruk op de LLM-gestuurde componenten en strategieën. Gebaseerd op AIxCC, introduceren we verder een publiek leaderboard voor het benchmarken van state-of-the-art LLMs op taken gerelateerd aan het detecteren en patchen van kwetsbaarheden, afgeleid van de AIxCC-dataset. Het leaderboard is beschikbaar op https://o2lab.github.io/FuzzingBrain-Leaderboard/.
English
Our team, All You Need Is A Fuzzing Brain, was one of seven finalists in
DARPA's Artificial Intelligence Cyber Challenge (AIxCC), placing fourth in the
final round. During the competition, we developed a Cyber Reasoning System
(CRS) that autonomously discovered 28 security vulnerabilities - including six
previously unknown zero-days - in real-world open-source C and Java projects,
and successfully patched 14 of them. The complete CRS is open source at
https://github.com/o2lab/afc-crs-all-you-need-is-a-fuzzing-brain. This paper
provides a detailed technical description of our CRS, with an emphasis on its
LLM-powered components and strategies. Building on AIxCC, we further introduce
a public leaderboard for benchmarking state-of-the-art LLMs on vulnerability
detection and patching tasks, derived from the AIxCC dataset. The leaderboard
is available at https://o2lab.github.io/FuzzingBrain-Leaderboard/.