Shai: Een groot taalmodel voor vermogensbeheer

Samenvatting

Dit artikel introduceert "Shai", een groot taalmodel op het niveau van 10B, specifiek ontworpen voor de vermogensbeheersector, gebouwd op een open-source basis model. Door continue voorafgaande training en fine-tuning met een gericht corpus, toont Shai verbeterde prestaties in taken die relevant zijn voor zijn domein, waarbij het baseline modellen overtreft. Ons onderzoek omvat de ontwikkeling van een innovatief evaluatiekader, dat professionele kwalificatie-examens, op maat gemaakte taken, open-einde vraagbeantwoording en veiligheidsbeoordelingen integreert, om de capaciteiten van Shai uitgebreid te beoordelen. Verder bespreken we de uitdagingen en implicaties van het gebruik van grote taalmodellen zoals GPT-4 voor prestatiebeoordeling in vermogensbeheer, waarbij we een combinatie van geautomatiseerde evaluatie en menselijk oordeel voorstellen. De ontwikkeling van Shai, die het potentieel en de veelzijdigheid van grote taalmodellen op het niveau van 10B in de financiële sector toont met aanzienlijke prestaties en bescheiden rekenvereisten, hoopt praktische inzichten en methodologieën te bieden om branchegenoten te ondersteunen bij hun soortgelijke inspanningen.

English

This paper introduces "Shai" a 10B level large language model specifically designed for the asset management industry, built upon an open-source foundational model. With continuous pre-training and fine-tuning using a targeted corpus, Shai demonstrates enhanced performance in tasks relevant to its domain, outperforming baseline models. Our research includes the development of an innovative evaluation framework, which integrates professional qualification exams, tailored tasks, open-ended question answering, and safety assessments, to comprehensively assess Shai's capabilities. Furthermore, we discuss the challenges and implications of utilizing large language models like GPT-4 for performance assessment in asset management, suggesting a combination of automated evaluation and human judgment. Shai's development, showcasing the potential and versatility of 10B-level large language models in the financial sector with significant performance and modest computational requirements, hopes to provide practical insights and methodologies to assist industry peers in their similar endeavors.

Shai: Een groot taalmodel voor vermogensbeheer

Shai: A large language model for asset management

Samenvatting

Support