ChipNeMo: Domein-aangepaste grote taalmodellen voor chipontwerp

Samenvatting

ChipNeMo heeft als doel de toepassingen van grote taalmodellen (LLM's) voor industriële chipontwerpen te onderzoeken. In plaats van direct gebruik te maken van kant-en-klare commerciële of open-source LLM's, passen we de volgende domeinaanpassingstechnieken toe: aangepaste tokenizers, domeinadaptieve voortgezette voorpretraining, supervised fine-tuning (SFT) met domeinspecifieke instructies, en domeinaangepaste retrievalmodellen. We evalueren deze methoden op drie geselecteerde LLM-toepassingen voor chipontwerp: een technische assistent-chatbot, EDA-scriptgeneratie, en bugsamenvatting en -analyse. Onze resultaten tonen aan dat deze domeinaanpassingstechnieken aanzienlijke prestatieverbeteringen van LLM's mogelijk maken ten opzichte van algemene basismodellen voor de drie geëvalueerde toepassingen, met een modelgroottereductie tot wel 5x bij vergelijkbare of betere prestaties voor een reeks ontwerptaken. Onze bevindingen geven ook aan dat er nog ruimte is voor verbetering tussen onze huidige resultaten en ideale uitkomsten. Wij geloven dat verder onderzoek naar domeinaangepaste LLM-benaderingen zal helpen om deze kloof in de toekomst te verkleinen.

English

ChipNeMo aims to explore the applications of large language models (LLMs) for industrial chip design. Instead of directly deploying off-the-shelf commercial or open-source LLMs, we instead adopt the following domain adaptation techniques: custom tokenizers, domain-adaptive continued pretraining, supervised fine-tuning (SFT) with domain-specific instructions, and domain-adapted retrieval models. We evaluate these methods on three selected LLM applications for chip design: an engineering assistant chatbot, EDA script generation, and bug summarization and analysis. Our results show that these domain adaptation techniques enable significant LLM performance improvements over general-purpose base models across the three evaluated applications, enabling up to 5x model size reduction with similar or better performance on a range of design tasks. Our findings also indicate that there's still room for improvement between our current results and ideal outcomes. We believe that further investigation of domain-adapted LLM approaches will help close this gap in the future.

ChipNeMo: Domein-aangepaste grote taalmodellen voor chipontwerp

ChipNeMo: Domain-Adapted LLMs for Chip Design

Samenvatting

Support