ChatPaper.aiChatPaper

Alles Wat Je Nodig Hebt Is Een Fuzzing Brein: Een LLM-aangedreven Systeem voor Geautomatiseerde Kwetsbaarheidsdetectie en -reparatie

All You Need Is A Fuzzing Brain: An LLM-Powered System for Automated Vulnerability Detection and Patching

September 8, 2025
Auteurs: Ze Sheng, Qingxiao Xu, Jianwei Huang, Matthew Woodcock, Heqing Huang, Alastair F. Donaldson, Guofei Gu, Jeff Huang
cs.AI

Samenvatting

Ons team, All You Need Is A Fuzzing Brain, was een van de zeven finalisten in DARPA's Artificial Intelligence Cyber Challenge (AIxCC) en eindigde als vierde in de finale ronde. Tijdens de competitie ontwikkelden we een Cyber Reasoning System (CRS) dat autonoom 28 beveiligingslekken ontdekte - waaronder zes voorheen onbekende zero-days - in real-world open-source C- en Java-projecten, en slaagde erin om 14 daarvan te patchen. Het volledige CRS is open source beschikbaar op https://github.com/o2lab/afc-crs-all-you-need-is-a-fuzzing-brain. Dit artikel biedt een gedetailleerde technische beschrijving van ons CRS, met een nadruk op de LLM-gestuurde componenten en strategieën. Gebaseerd op AIxCC, introduceren we verder een publiek leaderboard voor het benchmarken van state-of-the-art LLMs op taken gerelateerd aan het detecteren en patchen van kwetsbaarheden, afgeleid van de AIxCC-dataset. Het leaderboard is beschikbaar op https://o2lab.github.io/FuzzingBrain-Leaderboard/.
English
Our team, All You Need Is A Fuzzing Brain, was one of seven finalists in DARPA's Artificial Intelligence Cyber Challenge (AIxCC), placing fourth in the final round. During the competition, we developed a Cyber Reasoning System (CRS) that autonomously discovered 28 security vulnerabilities - including six previously unknown zero-days - in real-world open-source C and Java projects, and successfully patched 14 of them. The complete CRS is open source at https://github.com/o2lab/afc-crs-all-you-need-is-a-fuzzing-brain. This paper provides a detailed technical description of our CRS, with an emphasis on its LLM-powered components and strategies. Building on AIxCC, we further introduce a public leaderboard for benchmarking state-of-the-art LLMs on vulnerability detection and patching tasks, derived from the AIxCC dataset. The leaderboard is available at https://o2lab.github.io/FuzzingBrain-Leaderboard/.
PDF52September 12, 2025